El contexto y su resolución: Chatbots con mayor humanidad

Iván Martínez Chin
SoldAI
Published in
4 min readSep 8, 2020

Las personas hacemos constante uso de elementos de economía lingüística, estos elementos se utilizan para no estar repitiendo entidades (objetos físicos o abstractos del mundo) constantemente en un texto o una conversación. Uno de los más comunes es la anáfora, el cual es una entidad que no ha sido mencionada explícitamente en cierta oración (en un texto o conversación), sin embargo, queda claro que antes ha sido mencionada y por tanto, se puede relacionar con dicha entidad o también llamado antecedente.

La anáfora es necesaria en un amplio rango de tareas de Procesamiento de Lenguaje Natural, como comprensión del lenguaje, traducción automática, extracción de información e interfaces en lenguaje natural como los chatbots. A la acción de relacionar una misma entidad en diversas oraciones, incluso si han sido mencionadas con anáforas, se le conoce como correferencia. El hecho de hacer todas las correferencias en un texto o conversación, se entiende como resolución del contexto.

Con el contexto, nos referimos a todos los conocimientos necesarios entre los hablantes para entender una conversación. El contexto puede ser visto como un iceberg donde lo único perceptible es el texto y lo que hay “debajo del agua” es la información previamente mencionada.

Hacer referencia a entidades antes mencionadas es una de las habilidades humanas que son interesantes en el lenguaje. Para los humanos es una acción tan natural que no nos damos cuenta de ello. Sin embargo, cuando tratamos de replicar este mismo comportamiento en una máquina, nos dimos cuenta que es uno de los problemas más complejos en el campo del lenguaje natural. El hecho de que existan diversos lenguajes y modismos dentro de ellos, hace que se complique aún más. Veamos un ejemplo sencillo:

  • Juan llegó tarde a la reunión, [Juan] tuvo un percance en el camino. -ej. 1.

El texto puesto entre corchetes es algo que generalmente no mencionamos, pero cuando preguntamos ¿Quien tuvo el percance? naturalmente pensamos en la entidad Juan.

Ahora pongamos un ejemplo un poco más complicado:

  • El perro de Juan mordió a un niño, ahora mismo [el niño] está siendo trasladado al hospital. -ej. 2.

Es ahora donde hacemos la pregunta ¿Quién está siendo trasladado al hospital? Naturalmente, un humano respondería lo más lógico: El niño. No obstante, al desarrollar un algoritmo o modelo que tome esta misma decisión en una máquina, no es tan trivial.

¿Cómo algo que hacemos de manera natural es tan difícil de replicar? Es por el hecho de no conocer la manera en que nuestra mente realiza este proceso, que no podemos replicarlo. Esto es frecuente con muchos procesos humanos (como la visión), que realizamos sin pensar en ello. Retomando los ejemplos 1 y 2, es relativamente sencillo ver que el primer ejemplo tiene más facilidad de solución, ya que sólo hay una entidad. Sin embargo en el segundo ejemplo, con la pregunta ¿Quién está siendo trasladado al hospital? ya no es tan fácil de construir un método que seleccione la entidad correcta, pues se cuenta con 3 y para un agente artificial no hay algo parecido a lo humanamente lógico.

La comunidad científica ha propuesto métodos y algoritmos con los que se pueda solventar este problema, estableciendo temas o escenarios para resolver el contexto y utilizando soluciones basadas en diccionarios o métodos más avanzados, como redes neuronales. Sin embargo, aún existe una brecha para acercarse al comportamiento humano.

El equipo de investigación de SoldAI (SoldAI Research), también ha puesto su enfoque en este problema, con el objetivo de brindar el mejor servicio de chatbots, así como aportar a la tecnociencia con modelos y métodos para mejorar las correferencias, actualmente para el lenguaje español.

¿En verdad la resolución de correferencias podría ayudar a hacer chatbots más agradables para la humanidad? En efecto. Usualmente las personas sienten mayor comodidad al hablar o ser atendidas por una persona, pues sabe que ésta comprenderá lo que diga. Crear chatbots que puedan llevar a cabo una resolución correcta de las correferencias, los acerca más al modo habitual de las personas, sin que éstas deban preocuparse hablar con un agente virtual y cambiar su modo de expresión para ser entendidas.

En este contexto, se dice que un agente virtual ha pasado la prueba de Turing si al tener una conversación con una persona, ésta no puede determinar si está hablando con otra persona o con una máquina.

Como vemos, este mecanismo de resolución de contexto es un problema complejo, cuya solución nos acercará más a la creación de bots que cuenten con una capacidad del lenguaje igual o cercana a la de las personas. En SoldAI nos esforzamos para dar un mejor servicio de chatbots, y así acercar a las personas a tener un mayor uso de estas herramientas virtuales que las ayudarán a mejorar procesos cotidianos. ¡Explora nuestro blog y entérate de cómo lo hacemos!

Publicado originalmente en el blog de SoldAI .

--

--

Iván Martínez Chin
SoldAI
Writer for

Junior core engineer in SoldAI Company. Master degree in Computer Sciencie.