Destapando el Machine Learning, esa caja negra que “todos conocemos”

Descubre cómo piensan las máquinas siguiendo procesos que ocurren a diario en tu cerebro y cómo hemos aplicado Machine Learning a Bemycar

Isabel Kofoed
Igeneris
8 min readSep 2, 2020

--

Cuando oímos hablar de una tecnología basada en Machine Learning (ML), en numerosas ocasiones no terminamos de entender qué es, para qué sirve, o si son dos letras que deben estar en el deck de toda startup para ser considerada digna de invertir, aún cuando esas letras bien pudieran significar Muy Legal, Más Lujoso o Much Love.

El Machine Learning se ha convertido en el nuevo término fetiche del sector tecnológico, pero ¿qué hay verdaderamente por detrás?

En este artículo queremos explicar de manera muy sencilla qué es Machine Learning y el uso que le hemos dado a algunas de las técnicas en Bemycar, la plataforma en la que ponemos en contacto a personas que buscan un coche con propietarios de ese modelo, para que puedan conocer de primera mano las opiniones de personas que conducen ese coche día a día y preguntarles sus dudas.

Empecemos con una pregunta sencilla, ¿puede una máquina pensar?

Esta primera pregunta se la hizo el considerado padre de la Inteligencia Artificial, Alan Turing, en un artículo publicado en 1950. Se preguntó si las máquinas podían pensar, y en caso de que pudieran hacerlo, ¿cómo se podría diferenciar a una máquina de un ser humano? Ideó el llamado Test de Turing o The Imitation Game (igual has visto la película), una prueba de la habilidad de una máquina para exhibir un comportamiento inteligente similar al de un ser humano, de manera que al interactuar con la máquina a través de un chat, una persona no pudiera determinar si el interlocutor es una máquina o una persona. En 2014 por primera vez una máquina consiguió superar el test de Turing.

El Aprendizaje Automático o Machine Learning, es una rama de la Inteligencia Artificial cuyo objetivo es desarrollar técnicas para construir sistemas que aprendan automáticamente, mejorando con la experiencia, identificando patrones complejos en millones de datos para predecir comportamientos futuros.

Esta caja negra (o mágica) cuyo mercado está previsto que supere los $20.83B en 2024 puede definirse de forma muy muy sencilla como un “etiquetador-de-cosas”: tú le muestras una descripción de algo, y ese etiquetador te dice la etiqueta que le debería corresponder.

Parece fácil, ¿verdad? Es lo mismo que hace el cerebro humano cuando vemos la imagen de un gato y la clasificamos como tal. El cerebro absorbe una cantidad de datos complejos muy elevada de cada uno de los píxeles para terminar etiquetando la imagen. El Machine Learning funciona de forma parecida.

La principal diferencia con las formas antiguas de programación consiste en los algoritmos son construidos enseñando con ejemplos, no con instrucciones. No explicamos por qué la imagen puede categorizarse como gato, sino que mostramos miles de imágenes donde aparecen gatos estableciendo que en esa imagen hay un gato para que la máquina encuentre patrones y aprenda qué caracteriza a un gato. Estos algoritmos de Machine Learning se llaman de aprendizaje supervisado y son algunos de los que hemos utilizado en Bemycar.

El proceso por el cual al ver esta imagen observamos un gato es un proceso muy complejo que ya realizamos de manera automática, probablemente por la cantidad de contenido gatuno que observamos en internet. No en vano, son las criaturas más virales de las redes sociales

Y si las máquinas pueden pensar, ¿pueden también comprender el lenguaje humano?

Dentro del ámbito del Machine Learning, una de las ramas más interesantes se basa en el análisis de textos para obtener conclusiones y generar predicciones, ayudando a los ordenadores a entender, interpretar y tratar el lenguaje humano. La ciencia de extraer significado y aprender de datos en formato texto se denomina Procesamiento de Lenguaje Natural (NLP en inglés). El uso de NLP se utiliza en ejemplos como el filtro antispam de tu correo, en las traducciones de idiomas (gracias, Google) o en el diseño de chatbots de atención a clientes en e-commerce como Zendesk.

En NLP no es suficiente con entender las palabras, es necesario comprender las oraciones, los párrafos y dar un sentido global al análisis del discurso para poder extraer conclusiones. La gran dificultad de NLP reside en la ambigüedad del lenguaje, los dobles significados y las distintas acepciones que, en función del contexto, giran y cambian el significado total del texto.

¿Cómo lo utilizamos nosotros en Bemycar?

Estas técnicas de NLP, junto con algoritmos de ML, se están desarrollando en Bemycar para generar un servicio tecnológico que ayude a los concesionarios y a los usuarios creando -y capturando- valor.

En Bemycar hemos desarrollado una tecnología para que las personas que estén buscando un coche puedan preguntar y pedir opiniones cercanas a propietarios que tienen el modelo que están buscando a través de un formulario. Esta tecnología está desarrollada para que los usuarios pregunten sin salir del portal en el que estén navegando a la comunidad de Bemycar. Es muy sencillo:

  1. Cuando un usuario escribe un mensaje, dicha pregunta es enviada a los propietarios de ese modelo dentro de la aplicación de Bemycar.
  2. Los propietarios reciben una notificación push y responden al mensaje, recibiendo a cambio una remuneración por cada respuesta que ofrecen.
  3. Las respuestas de los distintos propietarios son enviadas al usuario que ha utilizado el formulario a su email. Si desea continuar la conversación con alguno de los propietarios, puede descargarse la aplicación de Bemycar y continuar ahí la conversación o iniciar una nueva con otro propietario.

Gracias al NLP podemos procesar esos mensajes y entender las dudas de los usuarios, para ayudarles en la compra de su nuevo coche.

A la izquierda solución tecnológica de Bemycar para ser integrada en páginas webs de terceros de manera ágil. A la derecha, imagen del chat en la aplicación donde responden los propietarios a las preguntas.

¿Y si la pregunta no tiene nada que ver con coches?

Esta fue la primera duda que nos planteamos. Debíamos asegurarnos de que nuestro formulario no fuera vulnerable a ataques de bots, a mensajes inadecuados o a preguntas de publicidad, ¿os imagináis a los propietarios recibiendo mensajes no relevantes todo el tiempo? ¡Menudo rollo!

Por tanto, la primera aplicación de Machine Learning aplicada al proyecto de Bemycar fue diseñar un filtro de spam para que los mensajes considerados no relevantes no fueran enviados a los propietarios. Así, dividimos una colección de datos en formato texto (corpus) en 2 categorías distintas:

  • Categoría spam: Preguntas relacionadas con coches de segunda mano, mantenimiento y problemas, ofertas de concesionario y publicidad encubierta, mensajes ofensivos, preguntas de atención al cliente, mensajes que no tuvieran nada que ver con coches, etc.
  • Categoría no spam: Dudas y preguntas relacionadas con la compra de un vehículo.

Al final, el problema que queremos resolver es diseñar un algoritmo de clasificación que sea capaz de predecir si el mensaje es o no spam (casi como el de gato/no gato). Teniendo ya nuestra montaña de datos de texto, bien podríamos mandarle al algoritmo señales de humo, ya que una máquina solo comprende números, no texto. ¿Cómo podemos convertir este corpus en características numéricas útiles para el entrenamiento de nuestro clasificador? Aquí es donde entra en juego el NLP, transformando el texto en características numéricas para que los algoritmos puedan utilizar los datos y tomar decisiones.

Una vez los textos han sido transformados, puede entrenarse el algoritmo de ML. Cuando el algoritmo ha sido entrenado y es capaz de clasificar y predecir correctamente cuándo un mensaje es o no es spam, se implementa en el formulario. Así, los mensajes clasificados como spam son bloqueados y no son enviados a los propietarios.

Y si no es spam, ¿qué más podemos saber de los mensajes?

Esta fue la segunda derivada que nos planteamos para poder ayudar a los concesionarios a accionar la venta de forma más eficaz. Si de todos los mensajes considerados como buenos supiéramos sobre qué se está preguntando, podríamos segmentar a los usuarios en función de las dudas específicas de cada uno. Esto ayudaría a enfocar la comunicación y las campañas de marketing de una manera más directa, mejorando el ratio de conversión en venta al conocer las principales dudas que tienen los usuarios.

Nuestro problema se basaba en una categorización del mensaje para predecir las diferentes dudas que resumieran el mensaje. Definimos hasta 10 categorías (tags) diferentes para etiquetar con uno o más tags cada uno de los mensajes en función de las dudas específicas de los usuarios: consumo, motor, configuración, gama, espacio, autonomía, carga, extras, mantenimiento y compra.

¿Cuánto ayudaría a la red comercial de los principales concesionarios el conocer las dudas de sus futuros clientes para diseñar campañas de marketing personalizadas? La segmentación de los usuarios en función de las dudas que tienen permite el envío de una comunicación directa, específica y sustancialmente diferente a la que estamos acostumbrados, que incrementa radicalmente el porcentaje de conversión en venta. Bienvenidos a la era del retargeting contextual, where have you been?

Flujo de categorización de los mensajes en función de las dudas escritas para mostrar al usuario anuncios en redes de terceros relacionados con sus preguntas

Las técnicas de ML se pueden utilizar en numerosos proyectos para resolver distintos problemas

Si el número de usuarios que utilizan el producto digital de Bemycar es lo suficientemente elevado, podemos añadir un valor extra analizando el profiling de los diferentes clientes para futuras campañas. ¿Y si las mujeres con un rango de edad entre 25–30 de Madrid suelen dudar sobre el kilometraje y las reparaciones de coches utilitarios? ¿Y si a los hombres de +55 años les preocupan los extras, el ruido y la potencia de los Mercedes y Volvo, pero tienen dudas sobre el consumo y la configuración de los Audi?

¿Te imaginas conocer cuáles fueron las dudas principales de los clientes que finalmente no te compraron y acabaron adquiriendo un vehículo de la competencia y saber por qué lo hicieron?

Esta diferenciación entre usuarios distinguiendo por grupos o clusters de usuarios puede ser realizada mediante algoritmos de Machine Learning no supervisados, que os contaremos en otro artículo ;)

En definitiva, el uso de algoritmos de Machine Learning ha mejorado sustancialmente la propuesta de valor de Bemycar, y nos encontramos implementando la tecnología en nuestro producto:

  • Por una parte, permitiendo que los usuarios puedan hablar con un propietario que vaya a resolver sus dudas específicas, recibiendo respuestas honestas y cercanas.
  • Por otra parte, cuidando a nuestra comunidad de propietarios, para que solo reciban mensajes de preguntas relacionadas con sus vehículos.
  • En último lugar, secundando la actividad comercial de los concesionarios para que vendan más coches optimizando esfuerzos. Gracias a la tecnología de Bemycar pueden asesorar a los compradores conociendo lo que verdaderamente les importa.

Si tienes alguna duda sobre un coche que te quieres comprar, puedes acceder a preguntar aquí a nuestra comunidad.

Si en cambio, quieres saber cómo la tecnología de Bemycar puede ser aplicada en tu página para incrementar la captación de leads, reducir el CAC y accionar una venta inteligente gracias a nuestra tecnología y a la comunidad de propietarios ponte en contacto conmigo en ikofoed@bemycar.es.

--

--