Dando vida a la inteligencia artificial: la labor de diseño conversacional

Marina Jiménez Rodríguez
9 min readJun 3, 2019

--

Los asistentes virtuales han llegado y, aunque suene a frase hecha, lo han hecho para quedarse. La gente habla ―literalmente― con sus dispositivos. En casa, en el trabajo, en el coche, los asistentes de voz y chatbots son una realidad que no deja de crecer en las escenas típicas de nuestro día a día. Las palabras «inteligencia» y «artificial», de la mano, ya no provocan ecos de escenas futuristas salpicadas de múltiples efectos especiales: la IA es hoy un concepto palpable, un futuro presente, un horizonte que ya se deja tocar con los dedos.

Cada vez son más las empresas que se interesan por esta tecnología y por las múltiples ventajas que plantea para los negocios. Pero ¿qué tienen los asistentes virtuales? Una de las claves para entender su éxito es que aciertan en el corazón de nuestras principales exigencias de la sociedad: la inmediatez, el para luego es tarde, el aquí y el ahora. Lo quiero aquí y, sobre todo, lo quiero ahora. Desde la irrupción de internet, las páginas webs y, más adelante, las redes sociales, nos hemos convertido en devoradores compulsivos e insaciables de información instantánea. Queremos saber algo y queremos saberlo ya. Domingo, madrugada. Qué más da.

El huracán de los asistentes virtuales va conquistando sector por sector y a su paso va dejando una nueva configuración de los equipos que trabajan en inteligencia artificial, llamando a filas a profesionales tan variopintos como diseñadores, desarrolladores, lingüistas e incluso escritores. Una tecnología que trata de emular una interacción humana requiere, para llegar a ofrecer una buena experiencia de usuario, la misma diversidad o, al menos, la máxima posible, que caracteriza a un individuo.

Por tanto, diseñar un asistente virtual que sirva con éxito al objetivo que persigue (dentro teaser: más adelante hablaremos sobre la importancia de estos objetivos) necesita una confluencia de profesionales implicados en el proceso de creación de un asistente. Diferentes formas de pensar, de ver la realidad, de, por qué no, entender el mundo. Dentro de esta amalgama de disciplinas en continuo crecimiento hay ciertos perfiles técnicos que rechinan más que otros. Por ejemplo, damos por hecho y nos parece natural que crear una inteligencia artificial necesita desarrolladores, pero ¿qué hace un lingüista lejos del diccionario y diseñando asistentes virtuales?

La necesaria simbiosis de UX y diseño conversacional

Cada vez son más las gestiones que pueden llevarse a cabo a través de un asistente virtual: cuestiones de domótica pura, como encender y apagar las luces de nuestros hogares, hacer sonar nuestra playlist favorita u otras como realizar consultas con nuestro banco, pedir vacaciones en el trabajo o comunicarnos de forma directa y sin horarios con cualquier marca .Y esta lista de acciones posibles no hace más que crecer y desafiar nuestra imaginación. Se trata de una constante transformación que ha dado lugar a nuevas especializaciones, como es el caso de la UX conversacional, una metodología enfocada en asegurar la calidad de la experiencia conversacional con asistentes virtuales. UX y conversational design avanzan muy unidos para desarrollar soluciones de voz y/o texto centradas en el usuario y enfocadas a los siguientes objetivos: naturalidad en las interacciones, solución de problemas y cumplimiento de objetivos de negocio y definición de personalidad.

Cómo conseguir que nuestro bot sea natural

Cuando nos embarcamos en el desarrollo de la conversación de un asistente virtual, uno de los objetivos que no debemos olvidar ni un instante del proceso es diseñar interacciones conversacionales que sean lo más naturales posible. Un asistente virtual debe dejar claro que no es real (aquí entra en juego la gestión de expectativas: el usuario no va a exigir lo mismo si es consciente de que está hablando con un bot y la experiencia va a resultar, por lo general, más exitosa), pero eso no implica que no deba parecerlo. Es más: en realidad, si no distinguimos si una voz o interacción es humana o no, puede producirse una pérdida de confianza, ya que solemos gestionar mal los escenarios de incertidumbre. Por tanto, una conversación bien diseñada aplicará prácticas de comunicación y estructuras conversacionales características de las personas, dando además al usuario todo el tiempo una sensación de unidad y linealidad en la identidad: la percepción de estar hablando con una misma entidad cada vez que interactúa con el asistente. Esto último no puede entenderse sin hablar de personalidad, que trataremos más adelante.

Algunos aspectos relacionados con la naturalidad en las interacciones implican incluir la mayor variedad posible de respuestas para una misma pregunta, ya que si siempre responde igual se incrementará la percepción de estar hablando con una máquina. Los seres humanos no respondemos igual cada vez que nos hacen una pregunta: depende de quien nos lo pregunte, del contexto en que lo haga, del canal por el que respondamos o del momento en que nos encontremos.

Pero seamos realistas: hay que partir de la base y aceptar que, por mucha variedad de preguntas y respuestas que hayamos incluido en el diseño de la conversación de nuestro asistente virtual, y por muchas horas que hayamos pasado inmersos en el entrenamiento, el bot no va a entender lo que quiere el usuario a la primera. Por este motivo es muy importante incorporar lo que se conoce como secuencias de reparación, interacciones para restablecer la comunicación entre ambas partes ante un error de comprensión, como en este ejemplo de un chabot de ecommerce:

USUARIO: ¿Cuándo me va a llegar lo que he pedido?

ASISTENTE: Nuestro horario de atención telefónica es de 9 de la mañana a 6 de la tarde.

USUARIO: No me refiero a eso.

ASISTENTE: Mmm… no estoy seguro de haberte entendido muy bien entonces, ¡perdona! ¿Por qué no me lo preguntas de otra forma? 🙄

USUARIO: ¿Cuál es el plazo de entrega de los pedidos?

ASISTENTE: ¡Te cuento! Los pedidos llegarán a tu domicilio o al punto de entrega que hayas seleccionado en tres días hábiles ;-)

En este ejemplo podemos ver cómo incluir en el diseño de nuestra conversación secuencias de reparación ha conseguido una buena experiencia de usuario, con un estilo natural y de forma muy semejante a cómo lo habría resuelto un humano.

Otro aspecto clave en la lucha contra la eventual falta de compresión y la naturalidad para gestionarla de la interacción es el desarrollo de fallbacks, respuestas que el asistente virtual emplea cuando la pregunta del usuario no se corresponde con ninguna de las intenciones con las que ha sido programado y no es capaz de asignar una intención para gestionar la interacción. Estos planes b son soluciones muy socorridas para salir del paso garantizando una buena UX. Dentro ejemplo:

USUARIO: ‘Feliz final’

Supongamos que nuestro asistente asigna a una determinada intención todo lo que identifique como libros, pero como en este caso, ni aparece la palabra libro ni el intent de entrada presenta la estructura ‘¿Tenéis x, de x?’, que podría asignar automáticamente como libro, nuestro asistente no sabe cómo salir de este atolladero. Aquí una posible solución:

USUARIO: ¿Tenéis ‘Feliz final’?

BOT: Pues la verdad es que ahora mismo me pillas un poco despistado. ¿Por qué no pruebas a darme un poco más de información? Seguro que puedo ayudarte.

¿Para qué sirve nuestro asistente? La importancia de visualizar objetivos

Una buena experiencia de usuario tiene que tener en cuenta la fina línea que hace que se rompa la confianza del usuario en el asistente, por lo que es necesario diseñar cada interacción enfocándonos en que este siga pensando que es una herramienta útil, que puede ayudarle a resolver sus dudas. Se trata de resolver todas las necesidades de los usuarios, anticipándonos a todas las formas en las que una determinada interacción puede irse al traste. En este sentido cobra especial relevancia el diseño de flujos de conversación, una representación gráfica de las principales situaciones comunicativas que pueden darse cuando el usuario entra a hablar con nuestro asistente. Los flujos funcionales deben considerar todas las variantes que pueden surgir en una conversación tipo, como muestra el siguiente esquema.

Pongamos que un usuario está interactuando con el asistente virtual de una librería ―en la línea del ejemplo anterior―. Así podría ser el flujo funcional de la búsqueda de libro:

Este diagrama refleja una situación en la que un determinado usuario solicita al asistente una recomendación. El sistema le responde con otra pregunta: «¿Qué género prefiere?», indicando los tres que la librería trabaja: romántico, thriller o novela histórica. A pesar de que se le hayan ofrecido tres opciones, nuestro usuario ha escogido el género ‘Humor’, para el que no hay opciones disponibles. Sin embargo, en nuestro flujo se ha recogido esa opción y se ha diseñado una opción lo más útil posible.

El contexto es, pues, un pilar básico en el buen diseño de la conversación. Se trata de uno de los ejes de la conversación humana y podemos definirlo como el conjunto de circunstancias en las que se enmarca una determinada interacción (un momento concreto, un lugar, un marco cultural compartido entre emisor y receptor, etc.). Una perfecta coreografía comunicacional en la que resulta determinante tener presente las frases anteriores expresadas en el diálogo. Si dos personas (sin alejarnos de nuestro ejemplo) están hablando sobre libros, una conversación donde el contexto esté haciendo su magia podría desarrollarse de la siguiente forma:

¿Sabes cuándo escribió Isaac Rosa ‘Feliz final’?

— En 2018.

— ¿Y ‘La habitación oscura’?

— En 2013.

En la segunda pregunta de esta conversación observamos que el interlocutor no ha formulado el interrogante empleando tantos elementos como en la primera pregunta, porque la cercanía entre ambas frases invita al receptor a entender que continúan hablando del mismo tema. Ahora viene lo importante: esto también se puede ―y se debe― conseguir en el diseño conversacional de un asistente. En DialogFlow existen diversas formas de trabajar con contextos. Si situamos el cursor sobre alguna de nuestras intents nos aparecerá la opción ‘Add follow-up intent’, tras lo cual se desplegará este listado de acciones.

El siguiente paso será ir incluyendo respuestas para las diferentes opciones que pueda darnos el usuario. De esta forma estaremos diseñando conversaciones mucho más humanas, efectivas y naturales.

Es muy importante incluir en este punto, además, alternativas a los deseos o necesidades de los usuarios en aquellos casos en los que nuestro asistente no pueda satisfacerlas, para que este se sienta atendido en todo momento. Por ejemplo, ofrecer al usuario la posibilidad de hablar con un agente o de comunicarse con la empresa a través de un correo electrónico.

La personalidad, el «alma» del asistente

Llegamos así al punto crucial en el diseño de la conversación. Se trata de un trabajo previo esencial para una buena experiencia de usuario. Es el momento en que verdaderamente damos vida al bot y donde es realmente importante el trabajo del lingüista. ¿Cómo queremos que sea nuestro asistente? ¿Seguro de sí mismo? ¿Prudente? ¿Listillo? ¿Serio? ¿Hombre? ¿Mujer? ¿De género sin definir? Cada rasgo de su personalidad tiene una traslación directa en un rasgos lingüístico, e incluso fonético, si hablamos de asistentes de voz.

Para llevar a cabo este trabajo desde Sngular hemos elaborado el VUI Persona Canvas, un modelo para la construcción de personalidad, una completa hoja de ruta que contempla elementos como un mapa emocional de la voz (¿Es amistoso? ¿Es hostil?); rasgos del asistente que enfocaremos con la estructura de matización «adjetivo, pero no adjetivo», identidad del sistema (¿Qué ha estudiado? ¿Con quién vive? ¿Qué le frustra?) y, por último, rasgos conversacionales, que son la traducción de todos los pasos anteriores en marcas comunicativas: voz aguda, uso de emoticonos o exclamaciones, uso de ironías o tono simpático. Aquí las posibilidades se tornan infinitas: hay tantas formas de comunicar como personalidades desarrollemos.

Un desarrollo que, además, debe ir acorde con la marca para la que desarrollamos el asistente virtual. No podemos olvidar que, cuando hablamos de personas y de empresas, todo comunica. Lo que se dice y lo que no. Lo que tenemos en cuenta y lo que pasamos por alto. ¿Quién mejor para abanderar la identidad de una marca que una herramienta que se relaciona a través de palabras, que dialoga, que interactúa de forma directa y ubicua con los usuarios?

El desarrollo de asistentes virtuales da voz a las marcas.

El diseño conversacional les da la vida.

--

--