Data Scientist — El nuevo rol

Pablo Cigliuti
Data Management en español
2 min readSep 23, 2015

Ya hace unos años, con el advenimiento de BIG DATA se comenzó a hablar sobre un nuevo rol dentro de la empresa. Se trata del Data Scientist, este nuevo rol parece ser el indicado para poder analizar grandes volúmenes de información.

Según sostienen, el Data Scientist tiene que estar familiarizado con el proceso de capturar, analizar y presentar los datos de negocio. Veamos cada una de estas características con mayor detalle:

Captura

El Data Scientist tendrá que conocer sobre programación y base de datos. Tecnologías y lenguajes como Hadoop, Java, Python, SQL, Hive y Pig son algunas de las características esenciales. También deben predominar los conocimientos de procesos de ETL (Extract, Transform, y Load). Por supuesto también deberá conocer donde guardar estos datos y cual es la mejor manera, entonces este rol tenga que conocer sobre modelado de datos, data warehouse y datos no estructurados. Por último tendrá que entender que es lo que está procesando y para qué le puede servir. Así, el Data Scientist tendrá que tener amplios conocimientos del negocio, cosa que solo se gana con la experiencia y con formularse preguntas continuas sobre la temática en al cual esté trabajando.

Análisis

Utilizar R, Excel, SAS y otras herramientas que ayuden a construir proposiciones, descubrir patrones y correlaciones a través de las estadísticas es el corazón del trabajo con datos. La utilización de estas herramientas es una de las principales habilidades requeridas por el Data Scientist. Todo esto deberá estar acompañado por conocimientos en matemática, este rol deberá entender qué es una correlación, o una regresión y todos los aspectos de masajear los datos en conjunto para verlo desde diferentes ángulos para su uso en modelado predictivo y descriptivo es la columna vertebral del conocimiento que ayudan a dar el paso para revelar la inteligencia.

Presentación

Por último, pero tan importante como los puntos anteriores, este nuevo rol deberá manejar herramientas de visualización como Flare, HighCharts, AmCharts, D3.js, entre otros de forma tal de encontrar la mejor manera de presentar los resultados visualmente. Pero no solo bastará con una buena presentación sino que el Data Scientist tendrá que ser bueno explicando y contando como llegó a los resultados y por qué esos resultados son confiables. El Data Scientist deberá tener habilidades de Storytelling.

Algunos links sobre el tema:
http://www.sas.com/en_us/insights/analytics/what-is-a-data-scientist.html
https://datajobs.com/what-is-data-science

--

--