Ir más allá con la Ciencia de Datos Ágil

Ver más allá de lo que mis ojos ven es algo que aplico a todos los aspectos de mi vida. En este artículo, mostraré cómo Agile Data Science (la ciencia de datos ágil) me está ayudando en este esfuerzo.

Favio Vázquez
Ciencia y Datos
5 min readApr 30, 2018

--

Vivimos en un mundo complejo, vivimos un mundo cultural. Eso significa que no podemos elegir ser criaturas sin cultura. Nacemos y ya está, ya estás allí. No puedes elegir tu estado, padres, ciudad y más. Entonces aprendemos, de la vida y de la escuela, nuestros amigos, nuestra familia.

Ese proceso crea una forma de ver las cosas, una forma de pensar sobre el mundo, sobre nosotros mismos y sobre lo que nos rodea. Nuestros sentidos nos abren al mundo, escuchamos, sentimos, saboreamos, vemos. Cuando menciono “ver más allá” o algo así me refiero a la combinación de todos nuestros sentidos, lo que percibimos desde todos los ángulos.

Obtenemos los datos del “mundo exterior” y nuestro cuerpo y cerebro analizan los datos sin procesar que obtuvimos, y luego “interpretamos” las cosas.

Modelando el mundo

¿Qué es esta “interpretación”? Justo lo que hemos aprendido sobre cómo reaccionar, pensar, sentir y entender a partir de la información que recibimos. Cuando entendemos, estamos decodificando las partes que forman esta cosa compleja, y transformando los datos en bruto que obtuvimos al principio en algo útil y simple.

Hacemos esto modelando . Este es el proceso de entender la “realidad”, el mundo que nos rodea, pero creando un prototipo de nivel superior que describa las cosas que estamos viendo, oyendo y sintiendo, pero es algo representativo, no lo “real” o la cosa “real”.

Ir más allá

No nos quedamos allí. Nuestro modelo del mundo, o un proceso, tiene otra parte. Lo que pensamos que significa eso en particular y cómo nos sentimos al respecto.

YO SACANDO CONCLUSIONES

Cuando era más joven, tenía muchos prejuicios sobre muchas cosas. Juzgando cosas y personas incluso antes de conocerlos. Y no creo que estuviera solo en esto.

Estamos acostumbrados a llegar a conclusiones muy rápido, sin analizar todos los lados de las cosas. Estamos acostumbrados a ver lo que nuestros ojos ven y a “confiar en nuestro instinto”.

Lamentablemente, el sentido común que reina en nuestra cultura es aristotélico y medieval (Études d’histoire de la pensée scientifique — Alexander Koyré). Eso significa que la intuición falla muchas veces al tratar de entender el mundo, también este “sentido común” viene a veces con juicio, algo que crea un sesgo en la forma en que vemos las cosas.

Ir y ver más allá en este contexto significa dar un paso adelante, dejar de lado tu juicio, sentido común e intuición y analizar realmente una situación. Deberíamos hacer esto por todo lo que sucede a nuestro alrededor, preguntarnos si lo que estás haciendo, pensando y percibiendo es realmente correcto. Esto es algo muy cercano a la Duda cartesiana .

¿Por qué ir más allá con Ciencia de Datos?

La agilidad es fundamental para la capacidad de las empresas para construir sistemas con éxito en un mundo donde es difícil predecir el futuro: James Kobielus.

Entonces, ¿qué tiene que ver la Ciencia de Datos con esto? En realidad, ir más allá y más allá de nuestro sentido común e intuición es la única manera de resolver problemas empresariales complejos.

En un mundo lleno de modelos intuitivos, la disrupción y el avance provienen de ir más allá, usar datos para comprender lo que no se puede ver a simple vista o con una “mirada experta”.

El proceso de Agile Data Science (Ciencia de Datos Ágil) propuesto por Russell Jurney es una forma asombrosa de entender cómo y por qué la Ciencia de Datos junto con la agilidad nos ayuda a ir más allá, ver más y resolver problemas de una manera creativa.

https://www.oreilly.com/ideas/a-manifesto-for-agile-data-science

El manifiesto de Agile Data Science nos lleva a esto. Iterando , una y otra vez, reconsiderando el proceso y las necesidades del negocio, experimentando mucho, escuchando lo que dicen los datos , entendiendo y animando al negocio a comprender que la opinión de los datos siempre debe incluirse en las discusiones del producto, encontrando un camino crítico hacia resolver el problema y luego organizar al equipo para completarlo, e ir más allá , dejando que los modelos resuelvan los problemas, por supuesto utilizando nuestra experiencia para ayudarlos, pero sin sesgarlos.

Desde entender el negocio y sus necesidades hasta el despliegue de la solución, necesitamos echar un vistazo al problema desde lejos, desde arriba, desde abajo, desde un lado. Vaciar nuestras mentes de la intuición de que todos podemos agregar a la solución y confiar en lo que dicen nuestros modelos sobre el proceso y comprender cómo se está resolviendo el problema.

Como nota final, me gustaría recordar y afirmar que cada modelo asume cosas, y aquí el modelo puede significar una forma de entender cómo funciona el mundo, hasta como un clasificador Random Forest predice si una transacción será fraudulenta o no. Necesitamos entender estas suposiciones, pueden no estar claras al principio pero están ahí. En Machine Learning y Deep Learning es más fácil ver cuáles son estas suposiciones, están en los documentos que propusieron el algoritmo y también en los códigos, por lo que antes de usar una biblioteca ML o DL para importar un modelo, comprende lo que supone a partir de los datos y el proceso, lo cual hará que la “depuración” sea mucho más fácil.

--

--

Favio Vázquez
Ciencia y Datos

Data scientist, physicist and computer engineer. Love sharing ideas, thoughts and contributing to Open Source in Machine Learning and Deep Learning ;).