Jesús Martín y los secretos del universo de las Voice User Interfaces

Jesús Martín es especialista en el diseño de Interfaces de Voz y desde hace varios años brinda sus servicios a empresas de primer nivel en el sector. En esta entrevista para Ok-Bot, explica la relevancia que tiene esta disciplina para la asistencia virtual y la comunicación digital y, además, cuenta cuáles son sus herramientas preferidas para introducirse en este emergente campo.

  1. ¿Qué son las VUI y por qué están tomando relevancia en la comunicación digital?

VUI viene de Voice User Interfaces, en contraposición de las interfaces visuales o GUI (graphic user interfaces). Son sistemas con los que podemos interactuar a través de la voz. Básicamente sería cualquier software al que podemos solicitarle que realice una acción hablando y que tiene la capacidad de responder de la misma manera. A pesar de que llevan entre nosotros desde los 90, en los últimos 10 años se han vuelto muy populares a raíz del lanzamiento de Siri en 2011 y los desarrollos de Alexa y Google Assistant. Su uso se expande como una alternativa a la interacción táctil de dispositivos móviles y ordenadores, permitiendo usar la tecnología de una manera adicional. Este auge se explica, por un lado, por la evolución tecnológica que permite una mayor comprensión y análisis del lenguaje natural y por otro por la facilidad de uso que supone para ciertas personas o situaciones de uso. El desarrollo tecnológico y la evolución de asistentes como Alexa o Google Assistant está provocando también una revisión y mejora de VUI tradicionales, como son los IVR o asistentes telefónicos.

  1. ¿Qué elementos hacen a una buena VUI?

Es necesario que haya una buena construcción tecnológica, pero como diseñador siempre destaco la importancia de una correcta propuesta de interacción. La tecnología que sustenta las VUI (principalmente Automatic Speech Recognition y Natural Language Understanding) y el medio de interacción (la conversación) tiene sus limitaciones igual que cualquier tecnología. Es tarea del diseñador y del equipo de producto crear un producto exitoso que salve esas limitaciones. Algunas claves de diseño para conseguir una buena VUI serían:

  • Elección de un caso de uso ideal, que tenga en cuenta las limitaciones del medio y de la tecnología.
  • Tener claro el objetivo de quién usa la VUI y ser capaces de ayudarles para conseguir su objetivo de la manera más satisfactoria posible.
  • El uso correcto de patrones conversacionales. Las VUI deben parecerse en su estructura a una conversación y no a un página web que navegamos mediante la voz.
  • El diseño sonoro, cuidando tanto la voz utilizada como los elementos sonoros que acompañan la interacción.
  • La capacidad de recuperarse de los errores que tengan lugar en la conversación.
  1. ¿Qué importancia tiene una VUI para la identidad de una empresa?

Es un elemento más de su estrategia digital. En ocasiones se utiliza como un canal adicional a través del cual servir su producto, en otras como elemento de comunicación… Dependiendo de la empresa y del objetivo que su interfaz de voz tenga, su importancia será mayor o más relativa.

  1. ¿Qué perfiles de empresas están incorporando asistencia de voz en la actualidad?

Es muy variado, sobre todo si incluimos las IVR como parte de ese pool de interfaces de voz. Hay infinidad de proyectos de entretenimiento, comunicación, atención al cliente, educación… Gracias a una mayor democratización de la tecnología esos proyectos vienen tanto de empresas gigantes como de pequeños estudios.

  1. ¿Qué formación debe tener un diseñador VUI?

No hay excesiva formación específica, aunque empiezan a aparecer escuelas que la ofrecen. Personalmente llevo un taller en La Nave Nodriza, que es el único por ahora en español y del cual llevamos ya 8 ediciones y recomiendo también VUIchallenge.com, un proyecto gratuito que lancé en 2021 con el que se puede practicar y aprender diseño de VUIs mediante la resolución de retos diarios. Las personas que trabajan en el sector de las interfaces tienen backgrounds diversos, incluyendo lingüistas, diseñadores de interfaces gráficas, redactores o UX writers… El diseño de interfaces de voz es una combinación que mezcla diseño de interacción con el uso de palabras que hacen que sea necesaria una combinación de esos dos mundos.

  1. ¿Cuáles son a tu juicio las herramientas digitales indispensables para diseñar una VUI?

Un bloc de notas que nos permita escribir es la herramienta básica. Dependiendo de la complejidad del proyecto necesitaremos además una herramienta que nos permita hacer tablas (tipo Excel) y otra para flowcharts. En este artículo sobre tipos de herramientas y cómo utilizarlas podéis ver más sobre ello. Una vez superada la fase de diseño podemos prototipar nuestra interacción con otras herramientas. En la actualidad recomendaría centrarse en Adobe XD (y su interacción por voz) y Voiceflow, pero puedes ver otras herramientas en este otro artículo.

  1. ¿Podés contarnos cuáles son tus VUI preferidas?

Si nos referimos a casos de uso dentro de las experiencias nativas, todo lo que tiene que ver con domótica me parece increíblemente útil. La parte de asistentes dentro del coche me parece también muy bueno. Si vamos a aplicaciones de voz dentro de asistentes generalistas, hay un montón de Skills que me gustan, aunque destacaría dos: En español creo que el desarrollo de Veo Veo es muy interesante y en inglés me encanta Yes Sire.

 

  1. ¿Cuál consideras que será el futuro de la interfaz de voz?

Creo que nos acostumbraremos aún más a interactuar mediante la voz con la tecnología que nos rodea y que la integración, y nuestra relación en general con ella, será mucho más natural a como la conocemos hoy en día.

 

Deja un comentario