Machine Learning: no es magia, pero tampoco estadística

Published in

manueldelgado

5 min readJul 1, 2018

En esto de la Inteligencia Artificial, vivimos un momento paradójico provocado por la confluencia de dos corrientes.

Meme sobre Machine Learning y estadística

Tenemos, por un lado, a quienes creen que estas cosas del Machine Learning no son más que “estadística avanzada”. Este meme que ha pululado por las redes en los últimos meses es un ejemplo de esta corriente de pensamiento.

Por otra parte, están (estamos) los que cada vez queremos hablar menos de “Inteligencia Artificial”, porque cada uno entendemos cosas (muy) distintas cuando oímos este concepto, lo que lo hace peligroso. Tú dices “Inteligencia Artificial” queriendo decir Machine Learning y el de enfrente entiende “máquinas inteligentes que nos van a robar el trabajo como paso previo a esclavizarnos y aniquilarnos”. O, en el mejor de los casos, entiende “con esto haces dos clicks y ya está resuelto”, que viene a ser igual de estúpido.

Y es que, amigos, ni una cosa ni la otra.

Ni “la Inteligencia Artificial” va a cobrar conciencia de sí misma y provocar un holocausto nuclear, ni su forma actual (el aprendizaje automático o Machine Learning) es “poco más que estadística avanzada”.

No es una varita mágica, ni un arma nuclear

El término “Inteligencia Artificial” es desafortunado. Hunde sus raíces en un momento en el que la ciencia aspiraba a replicar nuestra inteligencia. La cultura popular abrazó el concepto, echó a volar la imaginación y logró fijarlo en nuestras retinas y mentes como un proceso imparable cuya culminación era sólo cuestión de (poco) tiempo.

“2001: una odisea en el Espacio”, “Saturno 3” o “Terminator”, entre muchas otras, han creado y dibujado nuestra idea de “Inteligencia Artificial” mucho más que las toneladas de papers académicos que se han escrito sobre el tema a lo largo del mismo período de tiempo.

Tanto es así que, ahora, para hablar de Inteligencia Artificial con un poco de claridad, nos vemos obligados, en primer lugar, a aclarar que no nos referimos a la “Inteligencia Artificial General”, que respondería a esa concepción clásica de la disciplina.

Tampoco es que la propia disciplina haya hecho mucho por aclarar los conceptos. Desde que estoy metido en estos temas, me he enfrentado a innumerables clasificaciones y explicaciones distintas sobre qué se entiende por “Inteligencia Artificial” y Machine Learning, todas revestidas de la misma apariencia de normatividad, a pesar de contradecirse de forma continua. Las hay que las tratan como sinónimos perfectamente intercambiables, otras como parte la una de la otra.

Y lo mismo ocurre un nivel más allá: la popularización de la disciplina del Deep Learning no ha hecho más que aumentar esta confusión. Coexisten textos en los que Deep Learning figura como uno de los múltiples sabores del Machine Learning con otros que los tratan en paralelo, como dos disciplinas con suficiente entidad y suficientes diferencias como para ser categorías distintas. Y todos esos discursos, repito, cuentan con la misma apariencia de solvencia y conocimiento.

Tampoco es “sólo estadística avanzada”

Pero, cuidado: que se pueda echar de menos un esfuerzo taxonómico algo más serio y estable y que se pueda estar convencido de que el Machine Learning carece de propiedades mágicas no nos debe llevar a pensar que cuando hablamos de Machine Learning estamos hablando de “simple estadística venida a más”. Que tenga límites no significa que dichos límites sean bajos.

Las técnicas y métodos estadísticos tienen mucho que decir en la resolución de los problemas a los que nos enfrentamos en el análisis de datos, sin duda. Sin embargo, no son suficiente para abordar todas las preguntas para las que hoy se nos pide una respuesta.

El Machine Learning no es simple estadística avanzada: aunque hay que reconocerle a la estadística su influencia en el nacimiento del Machine Learning, las técnicas y métodos del Machine Learning provienen de una disciplina distinta, las ciencias de computación, y han surgido, precisamente, porque la estadística no bastaba para resolver los problemas a los que la computación comenzaba a enfrentarse hace ya décadas. Y, por supuesto, está muy lejos de poder afrontar los problemas a los que nos enfrentamos hoy, con datasets gigantescos, diversos, dinámicos y en los que la principal incógnita suele ser algo tan básico y esencial como qué queremos encontrar en ellos.

Simples algoritmos vs. procesos de trabajo

Un mecanismo por el que es fácil caer en la confusión entre “estadística” y Machine Learning es pensar, exclusivamente, en los algoritmos, ignorando (a propósito o por desconocimiento) el resto del flujo de trabajo con el que se desarrolla el análisis basado en Machine Learning, que le es propio y es distinto del que corresponde al análisis estadístico.

Las actividades de transformación y preparación de datos que preceden a la ejecución de cualquier algoritmo de Machine Learning son un método de trabajo que ha surgido al compás del desarrollo de esos algoritmos y sin el cual esos algoritmos, sencillamente, no sirven de (casi) nada.

Así que aplicar el Machine Learning no es tratar datos desde una perspectiva estadística y, al final del camino, utilizar uno u otro algoritmo en función de la complejidad del problema, sino que es un camino que diverge desde prácticamente el primer paso que se da.

Objetivos distintos, resultados distintos

Pero es que, sobre todo, lo que distingue al Machine Learning de la estadística es la capacidad para abordar según qué problemas. No es sólo una mejora en la capacidad de computación o una “sofisticación” de los métodos lo que nos permite ahora crear coches autónomos, identificar el contenido de imágenes, encontrar patrones comunes en el comportamiento simultáneo de millones de usuarios, dirigir ejércitos de drones o mantener conversaciones con máquinas: son técnicas nuevas y distintas, fuera del campo de la estadística.

En definitiva: ni tanto, ni tan calvo

Así que, no, Machine Learning no es “estadística con un marco bonito”, como en las viñetas de más arriba. Que haya algún solapamiento entre ambas disciplinas, más pequeño del que podemos creer desde fuera, no es suficiente para negarle al Machine Learning su estatus de disciplina independiente, capaz de resolver problemas distintos de los de la estadística y de hacerlo por métodos que le son propios.

Del mismo modo, no debe confundirse con una debilidad del Machine Learning el que algunos intentemos moderar las expectativas de quienes creen que la Inteligencia Artificial es un remedio mágico para todo tipo de problemas, de aplicación inmediata e indolora, o con capacidades fantásticas de cambiar la faz de la Tierra en sólo unos pocos años.

Es mucho más que estadística, pero es menos que magia. Quien esté cómodo en ese punto medio tiene la llave de una disciplina apasionante que ofrece posibilidades extraordinarias.