Top 10 Roles en Inteligencia Artificial y Ciencia de Datos

Cassie Kozyrkov
Ciencia y Datos
Published in
11 min readMar 25, 2019

Traducido por Carlos Secada del original por Cassie Kozyrkov (editado por Felipe Chiriboga)

Cuando piensas en el equipo de ciencia de datos ideal, ¿te imaginas 10 copias del mismo profesor de ciencias de la computación y estadística, con las manos ligeramente manchadas con marcador para pizarra blanca? ¡Espero que no!

Geoff Hinton de Google es mi héroe y un extraordinario investigador en Deep Learning, ¡pero espero que no estés planeando armar tu equipo de Ciencia de Datos Aplicada con 10 como él y nadie más!

La Ciencia de Datos Aplicada es un deporte en equipo que es altamente interdisciplinario. ¡La diversidad de perspectivas es importante! De hecho, la perspectiva y la actitud son tan importantes como la educación y la experiencia.

Si estás interesado en hacer que tus datos sean útiles, con un enfoque de ingeniería de inteligencia de decisiones, aquí tienes mi opinión sobre el orden en cómo hacer crecer tu equipo.

# 0 Ingeniero de Datos

Comenzamos a contar desde cero, por supuesto, ya que necesitas tener la capacidad de obtener datos antes de que tenga sentido hablar sobre el análisis de datos. Si estás trabajando con conjuntos de datos pequeños, la ingeniería de datos consistirá básicamente en ingresar algunos números en una hoja de cálculo. Cuando operas a una escala más grande, la ingeniería de datos se convierte en una disciplina sofisticada por derecho propio. Alguien de tu equipo deberá asumir la responsabilidad de lidiar con los complicados aspectos de ingeniería para poder entregar los datos con los que el resto de tu equipo pueda trabajar.

# 1 Decisor

Antes de contratar a un científico de datos con un PhD, asegúrate de que quien toma las decisiones entienda el arte y la ciencia de la toma de decisiones basada en datos.

Las capacidades de toma de decisiones deben estar establecidas, antes de que un equipo pueda obtener valor de los datos.

Este individuo es responsable de identificar las decisiones que valen la pena tomar con los datos, plasmarlas en un modelo (desde el diseño de métricas, hasta las inyecciones sobre supuestos estadísticos) y determinar el nivel requerido de rigor analítico, basado en el impacto potencial en el negocio. Busca un pensador profundo que no diga continuamente: “Oh, vaya, eso ni siquiera se me había ocurrido mientras estaba pensando en esta decisión”. Sino más bien que ya lo haya pensado. Y eso otro. Y esto también. Y aquello…

# 2 Analista

Luego, la siguiente contratación es … todos los que ya están trabajando contigo. Todos están calificados para mirar los datos y sentirse inspirados, lo único que puede estar faltando es un poco de familiaridad con el software que sea adecuado para hacer el análisis. Si alguna vez has visto una fotografía digital, has hecho visualización de datos y analítica.

Aprender a usar herramientas como R y Python es sólo una mejora sobre MS Paint para la visualización de datos; estas son simplemente herramientas más versátiles para visualizar una variedad más amplia de conjuntos de datos que sólo matrices de píxeles rojo-verde-azul.

Si alguna vez has visto una fotografía digital, ya has hecho visualización de datos y analítica. Es lo mismo.

Y mira, si todo lo que aguantas es mirar las primeras cinco filas de datos en una hoja de cálculo, bueno, eso es mejor que nada. Si toda tu fuerza laboral está empoderada para hacerlo, tendrás un mucho mejor pulso de tu negocio que si nadie está mirando ningún dato en lo absoluto.

El Monstruo del Lago Ness 1934: Estos son datos. Haz conclusiones al respecto con prudencia.

Lo importante a recordar, es que no se debe llegar a conclusiones más allá de tus datos. Eso requiere entrenamiento especializado. Al igual que con la foto de arriba, esto es todo lo que puedes decir al respecto: “Esto es lo que hay en mi conjunto de datos”. Por favor, no lo uses para concluir que el Monstruo de Lago Ness es real.

# 3 Analista Experto

¡Entra la versión ultrarrápida! Esta persona puede ver más datos más rápido. El juego aquí es velocidad, exploración, descubrimiento … ¡diversión! (Otro término para la analítica es la minería de datos). Este no es el rol relacionado con el rigor y las conclusiones cuidadosas. En su lugar, esta es la persona que ayuda a tu equipo a ver la mayor cantidad de datos posible para que el responsable de la toma de decisiones pueda tener una idea de lo que vale la pena obtener con más detalle.

El trabajo aquí es la velocidad, encontrando potenciales “insights” lo más rápido posible.

Esto puede ser contrario a la intuición, pero no asignes esta función con tus mejores ingenieros que escriben un magnífico y sólido código de software. El trabajo aquí es velocidad, encontrando potenciales “insights” o revelaciones lo más rápido posible, y desafortunadamente los que se obsesionan con la calidad del código les puede resultar muy difícil hacer un zoom a los datos lo suficientemente rápido como para ser útiles en este rol.

Aquellos que se obsesionan con la calidad del código pueden encontrar difícil ser útiles en este rol.

He visto a analistas ​​en equipos orientados a ingeniería, siendo menospreciados porque sus compañeros no se dan cuenta lo que significa escribir un “gran código” en analítica descriptiva. Gran significa “rápido y modesto” es este caso. Si tus analistas no reciben mucho cariño, abandonarán tu empresa y se que luego te preguntarás por qué no tienes sentido del pulso de tu negocio.

# 4 Estadístico

Ahora que tenemos a todas estas personas contentas explorando los datos, es mejor que tengamos a alguien cerca para controlar tanta exaltación. No hay peligro en mirar la “foto” del Monstruo del Lago Ness siempre y cuando tengas la disciplina para evitar llegar a conclusiones más allá de lo que realmente hay allí… pero, ¿lo harás? Si bien las personas son bastante buenas para pensar razonablemente cuando se trata de fotos, otros tipos de datos parecen enviar mensajes que tiran el sentido común por la ventana. Podría ser una buena idea tener a alguien cerca que pueda evitar que el equipo saque conclusiones infundadas.

La inspiración es barata, pero el rigor es caro.

Consejo de Vida: no saques conclusiones y no tendrás que preocuparte. Sólo estoy medio bromeando. La inspiración es barata, pero el rigor es caro. Paga o conténtate con pura inspiración.

Los Estadísticos ayudan a quienes toman las decisiones a llegar a conclusiones seguras más allá de los datos.

Por ejemplo, si tu sistema de Machine Learning funcionó para un conjunto de datos, todo lo que puedes concluir es que funcionó en ese conjunto de datos. ¿Funcionará cuando se está ejecutando en producción? ¿Deberías lanzarlo? Necesita algunas habilidades adicionales para lidiar con esas preguntas. Habilidades estadísticas.

Si queremos tomar decisiones serias cuando no tenemos datos perfectos, vayamos más despacio y tomemos un enfoque cuidadoso. Los estadísticos ayudan a quienes toman las decisiones a llegar a conclusiones más seguras, más allá de los datos analizados.

# 5 Ingeniero de Machine Learning Aplicado

El mejor atributo de un ingeniero de Machine Learning / Inteligencia Artificial aplicada no es una comprensión de cómo funcionan los algoritmos. Su trabajo es usarlos, no construirlos. (Eso es lo que hacen los investigadores). Lo que estás buscando es experiencia en transformar código para hacer que los algoritmos existentes acepten y revuelvan tus conjuntos de datos.

Además de dedos rápidos para codificar, busca una personalidad que tenga tolerancia frente al fracaso. Casi nunca sabes lo que estás haciendo, incluso si crees que lo estás haciendo. Ejecuta los datos a través de un grupo de algoritmos lo más rápido posible y ve sí parece estar funcionando … con la razonable expectativa de que fallarás muchas veces antes de tener éxito. Una gran parte del trabajo es ir tanteando a ciegas, y se necesita un tipo especial de personalidad para disfrutar eso.

Los perfeccionistas tienden a tener problemas como ingenieros de ML.

Como tu problema de negocio no está en un libro de texto, no puedes saber de antemano qué funcionará, por lo que no puedes esperar obtener un resultado perfecto la primera vez. Está bien, solo intenta muchos enfoques lo más rápido posible e intenta encontrar una solución.

Hablando de “ejecutar los datos a través de algoritmos” … ¿qué datos? Los “inputs”o entradas que tus analistas identificaron como potencialmente interesantes, por supuesto. Es por eso, que tiene sentido contratar primero a los analistas.

Aunque hay mucho de experimentar, es importante que el ingeniero de Machine Learning tenga un profundo respeto por la parte del proceso donde el rigor es vital: la evaluación. ¿Funcionó realmente la solución con nuevos datos? Por suerte, tomaste una buena decisión con tu anterior contratación, por lo que todo lo que tienes que hacer ahora es pasarle la batuta al estadístico.

Los ingenieros de ML aplicada más experimentados tienen una idea muy clara de cuánto tiempo tarda aplicar varios enfoques.

Impresiónate cuando un potencial ingeniero de ML pueda clasificar opciones según el tiempo que toma probarlas en distintos tipos de conjuntos de datos.

# 6 Data Scientist

Por la forma en que uso esta palabra, un científico de datos es alguien que es un experto completo en los tres roles anteriores. No todos usan mi definición: verás las solicitudes de empleo por ahí con personas que se autodenominan “científicos de datos” cuando sólo dominan realmente uno de los tres, así que vale la pena comprobarlo.

Los científicos de datos son totalmente expertos en las tres funciones anteriores.

Este rol está en la posición # 6 porque contratar a los verdaderos tres-en-uno es una opción costosa. Si puedes contratar uno dentro de tu presupuesto, sería una gran idea, pero si tiene un presupuesto ajustado, considera la posibilidad de entrenar y hacer crecer a tus actuales especialistas-de-una-sola-función.

# 7 Gerente de Análisis / Líder de Ciencia de Datos

El Gerente de Analítica es la gallina de los huevos de oro: son un híbrido entre el científico de datos y el que toma las decisiones. Su presencia en el equipo actúa como un multiplicador de fuerzas, lo que garantiza que tu equipo de ciencia de datos no quede en fuera de juego en lugar de agregar valor a tu negocio.

El híbrido del tomador de decisiones + científico de datos es un multiplicador de fuerzas. Desafortunadamente, son raros y difíciles de contratar.

Esta persona se queda despierta por la noche pensando preguntas como: “¿Cómo diseñamos las preguntas correctas? ¿Cómo tomamos decisiones? ¿Cómo podemos asignar mejor a nuestros expertos? ¿Qué vale la pena hacer? ¿Las habilidades y los datos coincidirán con los requerimientos? ¿Cómo aseguramos buenos datos de entrada?

Si tienes la suerte de contratar uno de estos, quédate con ellos y nunca los dejes ir. Aprende más sobre este papel aquí.

# 8 Experto Cualitativo / Científico Social

A veces, quien toma las decisiones es un brillante líder, gerente, motivador, influyente o navegante de la política organizacional … pero no tiene experiencia en el arte y la ciencia de la toma de decisiones. La toma de decisiones es mucho más que un talento. Si su decisor no ha perfeccionado su oficio, podrían hacer más daño que bien.

En lugar de despedir a un tomador de decisiones no calificado, puedes complementarlo con un experto cualitativo.

No despidas a un tomador de decisiones no calificado, compleméntalo. Puedes contratarle un “upgrade” en forma de ayudante. El experto cualitativo está para complementar sus habilidades.

Esta persona generalmente tiene formación en ciencias sociales y datos: Los economistas de comportamiento, neuroeconomistas y psicólogos de JDM reciben la capacitación más especializada, pero la gente autodidacta también puede ser buena en esto. El trabajo consiste en ayudar al responsable de la toma de decisiones a aclarar ideas, examinar todos los ángulos y convertir las intuiciones ambiguas en instrucciones bien pensadas en un lenguaje que facilite la ejecución al resto del equipo.

No nos damos cuenta de lo valiosos que son los científicos sociales. Por lo general, están mejor equipados que los científicos de datos para traducir en métricas concretas, las intuiciones e intenciones de quienes toman las decisiones.

El experto cualitativo no es el que toma las decisiones. En su lugar, se aseguran de que el responsable de la toma de decisiones haya captado completamente la información disponible para poderla tomar. También son un asesor de confianza, un compañero de intercambio de ideas y una caja de resonancia para quien toma las decisiones. Tenerlos a bordo es una excelente manera de garantizar que el proyecto comience en la dirección correcta.

# 9 Investigador

Muchos gerentes piensan que su primer miembro del equipo debe ser el ex profesor, pero en realidad no necesitas gente con doctorados a menos que ya sepas que las soluciones en el mercado no te van a proporcionar los algoritmos que necesitas. La mayoría de los equipos no lo saben de antemano, por lo que tiene más sentido hacer las cosas en el orden correcto: antes de construir ese bolígrafo espacial para viajar a la Luna, comprueba primero si un lápiz puede hacer el trabajo. Empieza primero, y si encuentras que las soluciones disponibles en el mercado no te están dando el cariño que necesitas, entonces deberás considerar contratar investigadores.

Si un investigador es tu primer empleado, es probable que no tengas el entorno adecuado para hacer un buen uso de ellos.

No los traigas de inmediato. Es mejor esperar hasta que tu equipo se haya desarrollado lo suficiente como para haber averiguado para qué necesitan un investigador. Espera hasta que hayas agotado todas las herramientas disponibles antes de contratar a alguien para que te construya nuevas y caras herramientas.

Antes de inventar bolígrafos que funcionan en el espacio, comprueba que las soluciones existentes no satisfacen tus necesidades.

# 10+ Personal Adicional

Además de los roles que vimos, estas son algunas de mis personas favoritas para participar en un proyecto de inteligencia de decisiones:

  • Experto en áreas específicas de negocio
  • Ética
  • Ingeniero de software
  • Ingeniero de Confiabilidad
  • Diseñador de Experiencia de Usuario
  • Visualizador interactivo / diseñador gráfico.
  • Especialista en recolección de datos
  • Gerente de producto de datos
  • Gerente de proyecto / programas

Muchos proyectos no pueden prescindir de ellos. La única razón por la que no figuran en mi top 10 es que la inteligencia de decisiones no es su negocio principal. En su lugar, son genios en su propia área y han aprendido lo suficiente sobre datos y la toma de decisiones para ser muy útiles en tu proyecto. Piensa en ellos como si tuvieran su propia carrera universitaria, pero con suficiente amor por la inteligencia de decisiones que eligieron estudiarla como una especialización.

¿Equipo enorme o equipo pequeño?

Después de leer todo eso, puedes sentirte abrumado. ¡Tantos roles! Toma aire profundo. Dependiendo de tus necesidades, podrías obtener suficiente valor sólo con los primeros roles.

Revisando mi analogía de Machine Learning Aplicado como innovación en la cocina, si deseas abrir una pizzería que elabore pizzas innovadoras a escala industrial, necesitas o bien un gran equipo o asociarte con proveedores/consultores. Si quieres hacer una o dos pizzas especiales este fin de semana — ¿a alguien le provoca una con jamón caramelizado?- entonces todavía necesitas pensar en todos los componentes que mencionamos. Vas a tener que decidir qué hacer (rol 1), qué ingredientes usar (roles 2 y 3), dónde obtener los ingredientes (rol 0), cómo personalizar la receta (rol 5) y cómo hacer una prueba de sabor (rol 4) antes de servírsela a alguien a quien quieres impresionar. Pero para la versión informal, con menos en juego, puedes hacerlo todo por tu cuenta. Y si tu objetivo es simplemente hacer una pizza tradicional estándar, ni siquiera necesitas todo eso: obtén de otra persona la receta ya probada (no es necesario reinventar la tuya propia) junto con los ingredientes y ¡comienza a cocinar!

Obtén más información sobre ciencia de datos e inteligencia artificial en español aquí.

--

--

Cassie Kozyrkov
Ciencia y Datos

Head of Decision Intelligence, Google. Hello (multilingual) world! This account is for translated versions of my English language articles. twitter.com/quaesita