Data Scientist

Nickols Yarmas
Jul 24, 2017 · 3 min read

Un Data Scientist es un experto en Data Science (Ciencia de datos), su trabajo consiste en extraer conocimiento a partir de los datos para poder responder a las preguntas que se le formulan.

¿Qué es la “ciencia de datos”?

Esta “ciencia de los datos”, nacida del método científico, es la evolución de lo que hasta ahora se conocía como Analista de datos, pero a diferencia de éste que sólo se dedicaba a analizar fuentes de datos de una única fuente, el Data Scientist debe explorar y analizar datos de múltiples fuentes, a menudo inmensas (conocidas como Big Data), y que pueden tener formatos muy diferentes. Además, debe tener una fuerte visión de negocio para ser capaz de extraer y transmitir recomendaciones a los responsables de negocio de su empresa.

Estos conjuntos de datos pueden provenir de los datos generados por todo tipo de dispositivos electrónicos (como un móvil, todo tipo de sensores, secuenciadores de genoma, …), redes sociales, datos médicos, páginas web, … y afectan de manera muy significativa la investigación actual en muchos campos como las ciencias biológicas, la informática médica, la salud, las ciencias sociales, por citar sólo algunos.

¿Qué cualidades se necesitan para ser un Data Scientist?

Tiene que tener una gran capacidad de aprendizaje. Debe ser creativo, estar preparado para establecer confianza entre los miembros de distintos departamentos, buen comunicador para convencer con éxito sus ideas y tener visión de negocio.

Es imprescindible que tenga conocimientos informáticos, matemáticos y estadísticos para aprender a codificar, crear hipótesis, comprender y comparar los distintos modelos, jugar con la probabilidad y resolver varios cálculos.

¿Qué proceso sigue un Data scientist?

El proceso que sigue un Data Scientist para responder a las cuestiones que se le plantean se pueden resumir en estos 5 pasos:

  • Extraer los datos, independientemente de su fuente (webs, csv, logs, apios, etc.) y de su volumen (Big Data o Small Data).
  • Limpiar los datos, para eliminar lo que distorsiona las mismas.
  • Procesar los datos usando diferentes métodos estadísticos (inferencia estadística, modelos de regresión, pruebas de hipótesis, etc.).
  • Diseñar nuevos tests o experimentos en caso necesario.
  • Visualizar y presentar gráficamente los datos.

¿Qué se espera de un Data Scientist?

Lo que se espera de un Data Scientist es que no sólo sea capaz de abordar un problema de explotación de datos desde el punto de vista de análisis, sino que también tenga las aptitudes necesarias para cubrir la etapa de gestión de datos. Así, el objetivo de un perfil de este tipo es acercar dos mundos (el de gestión y análisis de datos), que hasta ahora habían podido existir separados, pero que debido a los nuevos requisitos de volumen, de variedad de datos y de velocidad en la explotación de estas (las tres V’s de la definición estándar del término Big Data), se ha vuelto imprescindible llevar a cabo esta explotación a través de un perfil combinado, y que además, también entienda el negocio para dirigir esta explotación hacia resultados que puedan ser de interés para la compañía.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade