Creando inteligencia con Ciencia de Datos

En este artículo mostraré cómo la Ciencia de Datos nos permite crear inteligencia a través de la IA.

Favio Vázquez
Ciencia y Datos
7 min readMay 4, 2018

--

¿Qué es la inteligencia?

No es una pregunta fácil de responder. Luché hace un tiempo tratando de definir qué era, pero encontré una frase simple en uno de los cursos de Lex Friedman que me gustaba.

Así que vamos a definir la inteligencia como:

La capacidad de lograr objetivos complejos .

Pero, ¿qué es complejo aquí? ¿Cómo estamos definiendo algo complejo? Si miras en Internet, encontrarás varias definiciones diferentes, pero creo que la “principal” está cerca de lo que creo que está hablando la definición de inteligencia que dimos.

Si pensamos que algo tan complejo como algo que tiene muchas partes relacionadas entre sí de una manera que puede ser difícil de entender, podemos decir que algo complejo es una mezcla de cosas o partes, que juntas forman una cosa más grande, y la forma en que esas las partes están relacionadas no es muy fácil de entender.

Por ejemplo, algo complejo que tiene muchas partes que funcionan juntas de una manera que no es tan fácil de entender es un automóvil.

¡Pero! Si echamos un vistazo, las partes individuales no son tan difíciles de entender. No estoy diciendo que sean fáciles de construir o que vean exactamente lo que hacen, pero es más fácil captar lo que hacen.

Entonces podemos decir ahora que la inteligencia es:

La capacidad de lograr objetivos difíciles mediante la comprensión de las partes que forman el objetivo principal.

Estos objetivos se definirán en el contexto que queremos, pero ahora queremos centrarnos en el campo de la Inteligencia Artificial (IA). Entonces, como IA quiere construir inteligencia usando máquinas y computación tratando de imitar las formas en que nosotros, como ser humano, vemos, oímos, aprendemos y más, estos objetivos serán ver, aprender, escuchar, mover, comprender y más.

¿Qué es entender?

Otro concepto importante que tomaremos de las clases de Lex es la comprensión o entendimiento. Ya hemos usado esa palabra varias veces, así que vamos a definirla:

El entendimiento es la capacidad de convertir información compleja en sencilla y útil.

Necesitamos esto, y hablamos de ello cuando vimos las partes del automóvil. Cuando entendemos, estamos decodificando las partes que forman esta cosa compleja, y transformando los datos en bruto que obtuvimos al principio en algo útil y simple de ver.

Hacemos esto modelando . Este es el proceso de entender la “realidad”, el mundo que nos rodea, pero crear un prototipo de nivel superior que describa las cosas que estamos viendo, oyendo y sintiendo, pero es algo representativo, no lo “real” o lo “real” cosa.

Entonces, ¿cómo podemos nosotros humanos crear inteligencia? Modelando el mundo que nos rodea, entendiendo sus partes, transformando los datos sin procesar, obtenemos información útil y simple para luego ver cómo estas partes forman cosas más complejas, logrando los objetivos finales, los objetivos “difíciles”.

¿Cuánto tiempo nos tomó “ser inteligentes”?

Esto llevó algo así como 3.800 millones de años . Y queremos que esto suceda en los próximos cinco años:

A pesar de que no nos llevará tanto tiempo lograr objetivos complejos con IA, no será tan rápido como pensamos. Somos un campo que está madurando y mejorando cada día. Pero la inteligencia artificial no resolverá todos los problemas.

¿Qué necesitamos para crear inteligencia con AI?

Creo que la receta para crear inteligencia no es tan difícil en un nivel alto. Esto es lo que propongo que necesitamos para hacerlo:

Big Data + AI + Data Science = Inteligencia Artificial General

Estoy hablando de Inteligencia Artificial General (IAG) como el objetivo principal de esta revolución. Los IAG son sistemas de propósito general con inteligencia comparable a la de la mente humana (o tal vez más allá de los humanos).

Necesitamos Big Data como catalizador para llegar a AGI, porque con más datos, más nuevas formas de analizar datos, además de un mejor software y hardware, podemos crear mejores modelos y una mejor comprensión. Necesitamos el estado actual de AI, muy cercano a Deep Learning, Deep Reinforcement Learning y sus alrededores (más sobre Deep Learning aquí ), y luego necesitamos Data Science como el controlador y la ciencia detrás de esta revolución.

¿Qué es Ciencia de Datos?

Esta definición puede causar controversia para algunas personas, pero esto es algo que creo que está muy cerca de lo que los líderes (tanto teóricos como empresariales) están diciendo en este momento. Asi que,

Data Science es la resolución de los problemas de negocios/organizaciones a través de las matemáticas , la programación y el método científico que implica la creación de hipótesis , experimentos y pruebas a través del análisis de datos y la generación de modelos predictivos . Es responsable de transformar estos problemas en preguntas bien planteadas que también pueden responder a la hipótesis inicial de una manera creativa . También debe incluir la comunicación efectiva de los resultados obtenidos y cómo la solución agrega valor a la Empresa/Organización.

Y con esta definición podemos definir quién es un Científico de Datos:

Un Científico de Datos es una persona (¿o sistema?) Encargada de analizar problemas de negocios/organizaciones ofrenciendo una solución estructurada que comienza convirtiendo este problema en una pregunta válida y completa, luego usa programación y herramientas computacionales para desarrollar códigos que preparan , limpian y analizan los datos para crear modelos y responder la pregunta inicial.

Lo que estoy diciendo aquí es que Data Science está muy vinculada al negocio, pero al final es una ciencia, o está en proceso de convertirse en una, o tal vez no. Creo que podría ser muy útil que Data Science sea una ciencia, porque si ese es el caso, cada proyecto en Data Science debería ser al menos:

- Reproducible
- Falible
- Colaborativo
- Creativo
- Cumple con las regulaciones

Puede leer más acerca de por qué es importante esto en el increíble libro de Henri Poincaré, “Ciencia y método”, aquí:

El punto principal de este artículo (puede haber más en el futuro sobre esto), es mostrarte que estas son áreas realmente serias de investigación y desarrollo, necesitamos que todas ellas accedan a IAG, y Ciencia de Datos es crucial para este emprendimiento.

Podrías pensar, ¿por qué necesitamos IAG? o ¿por qué necesitamos AI en primer lugar?

Creo que podemos cambiar el mundo para mejorar, mejorar nuestras vidas, la forma en que trabajamos, pensamos y resolvemos problemas, y si canalizamos todos los recursos que tenemos ahora para hacer que esta área de conocimiento trabaje en conjunto para un bien mayor, podemos hacer un tremendo impacto positivo en el mundo y en nuestras vidas.

Necesitamos más personas interesadas, más cursos, más especializaciones, más entusiasmo. Te necesitamos :)

Soy un físico e ingeniero en computación que trabaja en Big Data, Data Science y Cosmology computacional. Tengo una pasión por la ciencia, la filosofía, la programación y la ciencia de datos. En este momento estoy trabajando en Data Science, Machine Learning y Deep Learning como Científico de Datos Principal en Oxxo. Me encantan los nuevos desafíos, trabajar con un buen equipo y resolver problemas interesantes. Soy parte de la colaboración de Apache Spark, ayudando en MLLib, Core y la Documentación. Me encanta aplicar mi conocimiento y experiencia en ciencia, análisis de datos, visualización y procesamiento de datos para ayudar a que el mundo se convierta en un lugar mejor.

--

--

Favio Vázquez
Ciencia y Datos

Data scientist, physicist and computer engineer. Love sharing ideas, thoughts and contributing to Open Source in Machine Learning and Deep Learning ;).