Agentes conversacionales: ¿Para qué desarrollar sistemas que hablen?

Por Ignacio G.R. Gavilán

Dedicado al universo de la innovación y la transformación digital Ignacio G.R. Gavilán es autor del libro “Robots en la sombra”, en donde investiga el surgimiento de la automatización de procesos. G.R. Gavilán compartió con Ok-Bot esta columna de su blog personal.

En realidad, la pregunta es algo más amplia que la que el título indica.

En realidad, la pregunta no es sólo por qué construir agentes que sean capaces no sólo de hablar, sino también de escuchar.

Y ni siquiera la pregunta se queda ahí. Aunque quizá el caso más interesante sea la conversación de viva voz, la pregunta abarca también el porqué, en general, construir máquinas, físicas o software, capaces mantener una conversación y diálogo más o menos natural y fluido con los humanos.

De las interfaces conversacionales a la ‘Conversational AI’ pasando por los chatbots

Hablamos de un gran número de dispositivos y soluciones como los chatbots, voicebots, smart speakers, robots sociales y coches o aspiradoras que hablan, por mencionar algunos.

Es difícil elegir un nombre.

Refiriéndome sólo a las soluciones software, en mi primer libro, ‘La carrera digital‘ decidí adoptar el término interfaz conversacional, bastante afortunado conceptualmente, pero no muy cercano al gran público. En mi segundo libro ‘Robots en la sombra‘ opté por el término chatbots, corto y conocido, aunque en la mente de algunos lectores puede, incorrectamente, eliminar aquellos que utilizan la interfaz de voz.

Últimamente, suelo utilizar mucho el término ‘Conversational AI‘ porque es compacto, resalta el aspecto funcional (mantienen conversaciones) y tecnológico (los medianamente avanzados se basan en inteligencia artificial) y, quizá no tanto en Español, pero sí es muy utilizado en medios digitales internacionales.

En cualquier caso, las bases tecnológicas son las mismas y la pregunta “por qué construirlos” aplica probablemente a todos ellos: para qué, en definitiva, construimos agentes conversacionales, interfaces conversacionales, chatbots o como queramos denominarlos.

Tres razones para los agentes conversacionales

Estoy iniciando la lectura del libro ‘Conversational AI. Dialogue systems, conversational agents and chatbots‘ del profesor emérito Michael McTear y, en el primer capítulo del libro, el autor se pregunta precisamente esto, por qué construir lo que él denomina ‘dialogue systems‘ y que podríamos traducir como sistemas dialógicos o sistemas conversacionales, pero que no deja de ser otro nombre alternativo para lo mismo que decíamos más arriba.

Nomenclatura aparte, McTear identifica tres motivos para construir este tipo de sistemas conversacionales:

  • proporcionan una baja barrera de entrada para los usuarios, interactuando con ellos de forma natural y eliminando, por tanto, al menos en teoría, la necesidad de un conocimiento, aprendizaje o acostumbramiento por parte del usuario, quien interactúa de la misma forma que haría con un humano (un vendedor, un operador de contact center, etc);
  • desde un punto de vista de la ciencia cognitiva, permite modelar computacionalmente las competencias dialógicas humanos, pudiendo ser un medio para estudiar y entender el comportamiento humano y sus interacciones sociales;

  • para simular el comportamiento conversacional humano de forma que puedan parecer humanos y, por ejemplo, pasar el test de Turing.

De las tres motivaciones aportadas, la única que está orientada a motivos comerciales o de negocio es la primera que, por cierto, en mi opinión, es fundamental, aunque no única, para explicar el auge, o al menos el porqué, de estos agentes conversacionales.

Me parece interesantísima la segunda, su uso para la investigación cognitiva, pero no creo que eso justifique, por sí solo, ni mucho menos, el auge de los agentes conversacionales, aunque sí me parece un excelente motivo para trabajar en ellos.

La tercera, me parece, sinceramente, anecdótica o, si se prefiere, una derivada secundaria de las anteriores.

Y alguna razón más

Desde la visión más cercana al negocio o el uso comercial, quizá convendría apuntar algo más.

En mi libro ‘Robots en la sombra‘, cuando hablo de los beneficios de los chatbots, destaco lo que se puede obtener de ellos como una forma de automatización de procesos (más bien de tareas): eficiencia, reducción de tiempos, escalabilidad, disponibilidad 7×24, etc.

En realidad, estos beneficios están, de alguna forma, implícitos en el primer argumento de McTear puesto que se trata de beneficios que se derivan de cualquier automatización de la interfaz con personas (casi de cualquier automatización), siendo los chatbots una opción más de automatización que se elige, fundamentalmente, por esas bajas barreras de entrada para los usuarios.

Sin embargo, quisiera apuntar dos cosas.

En ‘Robots en la sombra‘ aludo también al interés operativo y de negocio del autoservicio del usuario. De nuevo, el autoservicio se puede implementar de muchas formas, no necesariamente conversacionales, pero todo lo que ayude a facilitar la comprensión, a engrasar la interacción, a bajar en definitiva la barrera de entrada a ese autoservicio, favorece muchísimo su adopción y su éxito y más cuando hablamos de gran público, de servicios generalistas.

Igualmente, y aunque esto es más discutible, y lo será más conforme pase el tiempo y nos acostumbremos más y más a las interfaces conversacionales, un agente conversacional, especialmente si es por voz y más especialmente si va acompañado por un avatar avanzado, tiene capacidad para provocar el llamado ‘efecto wow‘ y por tanto provocar una cierta diferenciación de marca, por pura experiencia de cliente, transmitiendo, además, una imagen moderna e innovadora.

Conclusión

Por estas, y quizá por alguna otra razón que no haya aparecido en este artículo, se construyen agentes conversacionales y, en mi opinión, es algo que no va a hacer otra cosa que crecer y generalizarse (y más a medida que se sigan perfeccionando los algoritmos de procesamiento de lenguaje natural).

Y creo que estos agentes conversacionales, o estas capacidades conversacionales embebidas en todo tipo de dispositivos, serán elementos muy importantes de esa explosión robótica que vaticino y que ya he recogido en algún artículo anterior.

Deja un comentario