La explicación más simple de Machine Learning que jamás habrás leido

Traducido por Juan A. Navarro del original por Cassie Kozyrkov.

Seguramente has escuchado hablar de aprendizaje automático, o “machine learning” en inglés, y de inteligencia artificial. Pero, ¿en realidad sabes lo que son? Quizá no te enteras bien de qué se tratan pero, te lo aseguro, no eres la única persona. Los temas están de moda y se dice mucho de ellos, pero no siempre es fácil distinguir la ciencia de la ciencia ficción. Empezando por qué significan los términos mismos…

Machine learning es, esencialmente, un etiquetador-de-cosas.

Mi formación profesional es en estadística y neurociencia, y nosotros los estadistas tenemos una reputación por escoger los nombres más simples y aburridos para las cosas. Nos gusta cuando el contenido es justo lo que indica en el envase. ¿Sabes qué nombre le hubiéramos puesto al aprendizaje automático? ¡La Etiquetación de Cosas!

Contrario a la creencia popular, el aprendizaje automático no es una caja mágica, ni la justificación para $30 mil millones en fondos de capital. Machine learning es, básicamente, un etiquetador-de-cosas que toma tu descripción de algo y te dice la etiqueta que le debería corresponder. Lo que suena mucho menos interesante de lo que podrías leer en Hacker News. ¿Pero te habrías interesado en leer del tema si desde el principio se hubiera llamado la etiquetación-de-cosas? Probablemente no, lo que muestra como un poco de marketing y frases más llamativas pueden ayudar a que esta tecnología obtenga la atención que merece (aunque no por las razones que creías).

Es fenomenalmente útil, pero no cosa de ciencia ficción como te podrías imaginar.

¿Y qué hay de Inteligencia Artificial? Mientras que los académicos siguen debatiendo los detalles sobre lo que es y no es la inteligencia artificial, la industria está usando el término para referirse a un tipo particular de aprendizaje automático. De hecho, la mayoría de las veces la gente usa los términos de manera intercambiable, y yo no tengo ningún problema con eso. De modo que la inteligencia artificial se trata también de etiquetar-cosas. ¿Esperabas robots? ¿Algo con su propia mente como en la ciencia ficción? ¿Quizá algo humanoide? Pues no, la inteligencia artificial de hoy no es eso. Nosotros somos una especie que siempre encuentra características humanas en todo. Vemos caras en el pan tostado, figuras en las nubes, y si pego dos botones a un calcetín hasta podría terminar hablándole. Pero ese muñeco de trapo no es una persona, y la inteligencia artificial tampoco — es importante no olvidarlo. ¿Esto te ha decepcionado? ¡Alégrate! La versión real es algo incluso mucho más útil.

Déjame mostrarte por qué deberías emocionarte. ¿Qué ves en esta foto?

¿Qué clase de animal es éste? Fácil, ¿verdad? Ahora dime qué fue lo que hizo tu cerebro con estos píxeles para obtener la respuesta.

Acabas de absorber una gran cantidad de datos complejos con tus sentidos y, como por arte de magia, le pusiste la etiqueta: ‘gato’. ¡Eso fue muy fácil para ti! ¿Pero cómo harías para pedir a una computadora que realice la misma tarea, clasificar (o etiquetar) fotos como gato/no-gato?

Machine learning es un nueva forma de programación, una nueva manera de comunicar tus deseos a una computadora.

En la forma tradicional de programación, un programador pensaría profundamente sobre los píxeles y las etiquetas, se comunicaría con el universo, buscaría canalizar inspiración, y finalmente construiría a mano un modelo. Un ‘modelo’ es solo una forma rebuscada de decir ‘receta’, o una lista de instrucciones que tu computadora debe seguir paso a paso para convertir píxeles en etiquetas.

Un modelo es una receta que una computadora usa para convertir datos en etiquetas. Es solo un código que una máquina usa para convertir ingredientes de entrada en productos de salida, y puede ser construido a mano por un programador o aprendido automáticamente a partir de datos por un algoritmo.

Pero piensa como tendrían que ser esas instrucciones. ¿Exactamente qué es lo que hace tu cerebro con esos píxeles? ¿Puedes expresar eso? Tu cerebro tiene la ventaja de eones de evolución y hoy simplemente funciona, pero no tienes ni idea de cómo lo hace. Es una receta particularmente difícil de obtener.

Explica con ejemplos, no con instrucciones.

¿No sería mucho mejor si le pudieras decir a la computadora: “Mira, aquí hay un montón de ejemplos de gatos, y aquí hay un montón de ejemplos de no-gatos, ve y descífralo como puedas”? Esa es la esencia del aprendizaje automático. Es una forma completamente diferente de programar. Ahora, en lugar de darle instrucciones específicas paso a paso, puedes programar con ejemplos y el algoritmo de machine learning encontrará patrones en tus datos para convertirlos en esas instrucciones que tú no sabías cómo describir. ¡No más construir recetas a mano!

La Inteligencia Artificial te permite automatizar lo inefable.

¿Por qué es esto emocionante? Porque nos permite expresar nuestros deseos a las computadoras en una forma que no lo podíamos hacer antes. Nos encanta que las computadoras hagan cosas por nosotros. ¿Pero cómo les podemos dar las instrucciones, cuando idear las instrucciones mismas es muy difícil? ¿Qué pasa si son inefables?

De lo que se tratan la inteligencia artificial y el aprendizaje de máquinas es de automatizar lo inefable. Sobre explicarle a la computadora usando ejemplos en lugar de instrucciones. Esto destapa una gran clase de tareas para las que en el pasado las computadoras no nos podían ayudar, porque no éramos capaces de expresar las instrucciones. Ahora todas estas tareas son posibles — machine learning representa un salto fundamental en el progreso humano. Es el futuro, ¡y el futuro está aquí!

¿Quieres aprender más? Aquí está un video (en inglés) donde doy una introducción sobre aplicaciones de machine learning. O, alternativamente, puedes leer el siguiente artículo de esta serie (por ahora también en inglés).

Obtenga más información sobre ciencia de datos e inteligencia artificial en español aquí.