¿Cómo trabajar en ciencia de datos?
Una guía inconclusa para no iniciados.
Hace unos días atrás, a través de nuestra cuenta de twitter, uno de los contenidos suscitó especial interés entre los seguidores, pues enunciaba la ciencia de datos como un trabajo muy similar al realizado por los/as profesionales de la estadística.
A partir de esa experiencia, nuestro grupo de trabajo tuvo un debate interesante sobre lo que significa para un oficio emergente como la ciencia de datos, conciliar su ejercicio con el mainstream de una profesión que ha sido afectada por la confusión, imprecisión y dispersión de sus referencias con respecto al ejercicio.
Ciencia de datos, ¿para qué?
Nos preguntábamos entonces ¿qué hace alguien de ciencia de datos? dialogamos sobre las distintas actividades quedebe estar en capacidad de hacer alguien de ciencia de datos. Tareas como: recopilar datos, de analizarlos, mostrar resultados de su análisis y otras actividades más que, en realidad, no hacen muy distinto esa labor, si la comparamos con alquien que trabaja en estadística, ciencias de la computación y machine learning entre otras.
Qué duda cabe que la ciencia de datos, como disciplina y como profesión es una parte determinante dentro de los factores productivos enlazados en la economía digital. Pero, sus usos hoy por hoy rebazan las fronteras de lo digital y vemos que actividades tan cotidianas como la venta de productos en tiendas físicas o su disposición en almacenes, pueden aprovechar mucho los aportes realizados desde la ciencia de datos, en la optimización de sus procesos.
Entonces, ¿qué es lo que distingue un trabajo de ciencia de datos, de otro con los que se vincula? Una pregunta sencilla, deno fácil respuesta si tenemos en cuenta que en twitter, instagram, facebook y otras redes o incluso blogs que se llaman especializados, utilizan el nombre de ciencia de datos para denotar cosas que son, en realidad, muy diversas y distintas de lo que la ciencia de datos es.
Por si aún tienes dudas, te diremos que aunque otras disciplinas pueden compilar datos, analizarlos y transformarla en información, corresponde a la ciencia de datos, entre otras cosas, la identificación y sistematización de patrones para convertirlos en conocimiento útil en la toma de decisiones estratégicas.
El proceso de reclutamiento en ciencia de datos. A qué deberías prestar atención
Muchas veces acudimos a un proceso de reclutamiento con la expectativa de agradar a nuestro/a reclutador/a, y esto nos desvía un poco de la necesidad de conocer más información acerca de si, por ejemplo, efectivamente esa organización es la que puede satisfacer nuestras expectativas de desarrollo profesional inmediato o futuro.
Por eso resulta de mucha importancia que, así como te preparas para la entrevista con quien te reclutará, tengas a mano alguna información que, desde el perfil de una persona en ciencia de datos, resultará muy necesario valorar al momento de decidir por ejemplo, si efectivamente tanto quien recluta como la organización, están realmente claros en lo que esperan de alguien en ciencia de datos. Esto puede ayudarte a evitar frustraciones futuras.
¿Qué deberías saber, por ejemplo, de parte de quien te recluta? Por lo general, los procesos de reclutamiento para las áreas técnicas, suelen transcurrir en tres etapas cuya progresiva superación te permitirá acceder a un detalle más profundo sobre la oferta de empleo que tienes en frente. El proceso normalmente inicia cuando una persona del área dentro de la organización ofertante, o de una empresa de reclutamiento te contacta o recibe tu información porque te postulaste a una oferta abierta. Una vez ocurre una breve entrevista donde quien recluta se encarga de verificar algunas cosas básicas dentro de tu currículo, básicamente si encajas en el perfil, te remiten a una entrevista conpersonal del área técnica, muchas veces conducida por alguien que trabaja en la organización y será tu futuro compañero/a de trabajo o que lidera el proyecto al que eventualmente podrías unirte a trabajar. Finalmente, tienes una entrevista con el área administrativa de la organización. Si hay suerte y tu perfil resulta llamativo, o si la empresa es pequeña, puede ser que te entreviste el personal directivo o alguien dentro de su primer círculo de confianza. Esta última entrevista tiene como propósito establecer algunas directrices sobre tu trabajo en la organización, su cultura organizacional y, además, concretar algunos aspectos técnicos y operativos de tu incorporación.
Antes de acudir a cualquiera de las fases que describi antes, es importante que conozcas la empresa que te está reclutando y también la empresa para la cual te hacen la entrevista. Una revisión básica en tu buscador preferido bastará para ayudarte a conocer más detalles como proyectos en los que se encuentran trabajando o han trabajado, conocer también, por ejemplo, cuánto tiempo llevan en el proceso de reclutamiento para el cargo que te ofrecen o, incluso, si este cargo es solicitado con frecuencia. Esto último resulta muy interesante si quieres tener algún indicio de una posible alta rotación de los/as empleados/as dentro de la organización.
Tipos de trabajos en ciencia de datos
No abundan en variedad, aunque es bastante probable que los encuentres referidos con otros nombres. Por simplificar, lo presento reducido a cuatro tipos, entre sus múltiples versiones pero, te recordamos, no pretendo que se trate de una lista exhaustiva.
- Análisis de datos: Para algunas organizaciones, ser científico de datos y ser analista de datos es sinónimo de lo mismo. En esta área, habrá que desempeñar tareas como extracción de datos desde bases de datos SQL o portales, manejar adecuadamente y de forma fluida hojas de cálculo, así como también generar visualizaciones básicas de los datos analizados, y los ya conocidos informes de cuadro de mando integral. En muchos casos, cuando te inicias en ciencia de datos, este es un muy buen puesto para comenzar, pues te permite aprender poco a poco de las tareas de ciencia de datos, al tiempo que comenzar a adiestrarte en el manejo de sus rutinas más básicas.
- Ingeniería de datos: Si tu interés es la organización sistémica de la infraestructura de datos de una organización o de un proyecto de ciencia de datos, entonces este es tu puesto. Cuando la cantidad de datos es realmente grande y se requiere establecer políticas de acceso, de almacenamiento y de manejo, se abre el espacio para eltrabajo de ingeniería de datos. Por eso, para desempeñar estas actividades no necesitarás tantas habilidades en manejo estadístico (¡aunque si debes conocerlas!) y quizás tampoco saber mucho el detalle de los algoritmos del machine learning (¡aunque pueden resultarte fascinantes!), pero si deberás asegurarte de contar con muy sólidas y actualizadas bases en software, metodologías de desarrollo y habilidades demostrables en desarrollo con los principales lenguajes de programación y frameworks como Python o Django, por citar algunos. Podría decirse que este es un buen cargo para mostrar tus mejores habilidades, pues no todas las personas atraídas por la ciencia de datos están en capacidad de atender lo que requiere el desarrollo de software que la posibilita.
- Ingeniería de Machine Learning: Cuando tu empresa ideal es una que tiene en mente el software como servicio, estás frente a una oportunidad de oro para ayudarles a desarrollar toda una infraestructura de machine learning que les permita sacar el mejor provecho de su plataforma, de sus datos y, por supuesto, de su producto. Entre las habilidades básicas de este perfil destacan una sólida formación en matemáticas, estadística o física y un especial interés por áreas de investigación académica y progresividad en su aprendizaje profesional. En este caso, hablamos de grandes empresas de consumo con grandes cantidades de datos o empresas que ofrecen un servicio basado en manejo, análisis y exploración de datos.
- Ciencia de datos: Quien trabaje, en general, en ciencia de datos, debe estar en capacidad de unirse a un equipo más grande, generalmente multidisciplinar, contar con el conocimiento aunque sea básico del código de desarrollo entre sus habilidades, aunque no se espere que lo desarrolle por su cuenta, y poder adaptar sus habilidades de forma flexible a las necesidades de la organización, las cuales pueden variar en función del producto, proyecto, o estrategia gerencial. Este es el caso de empresas que se interese por conocer del manejo de datos, aunque no sea posible catalogarla como una empresa puramente de datos. Entre sus condiciones principales se encuentran manejar adecuadamente las herramientas diseñadas para los’grandes datos’ y la experiencia con conjuntos de datos de la vida real. Muchas empresas buscan este perfil para complementar o fortalecer equipos de ciencia de datos ya establecidos.
En qué enfocarse si quieres trabajar en ciencia de datos
La respuesta no se hará esperar: ¡en desarrollar tus habilidades! Sabemos que esto puede parecer un poco peregrino aún, pero a continuación te doy algunas pistas mostrándote cuáles habilidades puedes establecer en tu proceso de formación (si quieres conocer detalles de cómo iniciar tu proceso de autoformación pincha aquí).
Apóyate en tecnología para explorar todo tu potencial
Recientemente hemos descubierto una herramienta que explora tus habilidades y tu potencial y busca enlazarte con puestos -reales- dentro de la economía digital.
Pymetrics utiliza Python para juntar aportes de ciencia de datos y del campo de las neurociencias al proceso de reclutamiento de personal. En su implementación, Pymetrics se apoya en conocimiento sistematizado en el área de neurociencia, capturando rasgos de cada uno de los/as candidatos/as y midiendo el comportamiento en lugar de las respuestas a meras preguntas durante el proceso de reclutamiento. Así como un doctor pesará a su paciente para conocer su peso, Pymetrics busca perfilar a los candidatos a partir del comportamiento de éstos en el desarrollo de los distintos tests disponibles en la plataforma.
La plataforma se actualiza con frecuencia, garantizando el dinamismo de sus algoritmos, posibilitando generar mejores perfiles y un mejor desempeño para las compañías interesadas en sus servicios, ofreciéndoles como parte de éstos, el acceso a candidatos/as que, además de ser buenos o buenas para los puestos vacantes, contribuyan a la mejora general del desempeño de la organización.
Te animamos a explorar en Pymetrics cuál es tu perfil, los tests están presentados como juegos en forma de preguntas sobre comportamientos ante situaciones y, además, incluye consideraciones particulares para algunas discapacidades como visual (daltonismo), cognitivas (como discapacidad de aprendizaje y trastorno de atención), entre otras. Los juegos sólo pueden ser jugados una vez, son bastante breves en duración y no es necesario que se jueguen todos de forma sucesiva en una única conexión. Una vez los hayas jugado, la plataforma crea un perfil de tu información como posible empleado/a y te permite perfilar a ofertas que también la plataforma dispone para sus clientes, orientándote sobre tu afinidad con el perfil deseado tanto por el cargo como por la organización.
Una vez perfilado tu comportamiento, el sistema te muestra tres secciones: profesiones principales (que el sistema te asigna en orden de prioridad según tu desempeño en los juegos), un panorama a todas las profesiones disponibles en su oferta y las profesiones deseadas (que pueden ser escogidas por ti).
Ninguna herramienta es la panacea, pero considero que siempre resulta interesante conocer las inclinaciones perfiladas para tu desempeño profesional. Hoy por hoy, hay quienes opinan que un porcentaje nada despreciable de las personas que trabajan en ciencia de datos están buscando otros empleos, fundamentalmente causado por no representar los puestos desempeñados, aquello que se esperaba obtener en el campo de la ciencia de datos. En todo caso, creo que perfilar tu desempeño, más allá de ayudarte a enrumbarte hacia un cambio de trabajo, puede darte muchas ideas sobre cuáles habilidades puedes ayudar a fortalecer con un proceso de autoformación, por ejemplo. ¡El resultado, podría sorprenderte!