Escolhendo a Carreira

Giovanni Angelo
Dados de Cientista
4 min readDec 9, 2020

--

Entendendo a diferença entre Cientista de Dados e Engenheiro de Dados

Se você, assim como eu, está começando a adentrar no universo Data Science com o objetivo de torná-lo seu ganha pão, já deve ter se deparado com esses dois cargos e principalmente ficado em dúvida do que é cada um. (comigo foi assim). Então deixa eu te mostrar o que descobri, vamos lá!

Para que possamos entender com mais facilidade, vamos usar o exemplo da construção civil, vamos comparar o projeto de Data Science com a construção de uma casa. Desde a preparação do terreno onde a casa será construída até o próprio acabamento e decoração.

Engenheiro de Dados x Cientista de Dados

Basicamente o Engenheiro de Dados prepara o terreno para o Cientista de Dados.

É o engenheiro que estuda qual a composição do terreno, que tipo de solo existe e até quanto lixo aquele solo recebeu. Seu papel é entregar esse terreno o mais limpo, plano e confiável possível. Na prática é o engenheiro que junta, limpa e corrige os dados para que o cientista tenha a base necessária para desenvolver o seu modelo e gerar valor ao negócio.

Quanto mais sólido, limpo e preparado for esse terreno mais confiável será a construção.

O engenheiro depois de entregar o terreno ao cientista continua dando apoio para que todas as ferramentas necessárias estejam em pleno funcionamento para a construção.

E o cientista?

Bom, o cientista começa fazendo uma primeira etapa de verificação do terreno, ele precisa ver se o solo está realmente adequado, quais os tipos de construções poderão ser feitas e até se tem espaço suficiente. Ou seja, ele precisa verificar se para resolver o problema em questão todos os dados necessários estão disponíveis, se será preciso coletar mais dados ou até que tipo de modelos poderão ser desenvolvidos a partir dali.

Depois vem a parte da alvenaria, onde os alicerces e paredes são construídos. Tudo aquilo que sustentará a construção é feito nesta etapa. Neste momento que o cientista desenvolve, testa e valida os modelos de machine learning e gera os insights pro negócio.

É onde o dado ganha valor como informação.

E assim como uma casa super bem construída e forte não é vendida senão tiver um bom acabamento, é preciso dar uma decoração à ela para que chame a atenção de quem realmente importa. Por isso é preciso traduzir a informação bruta em uma forma amigável e legível para quem realmente tem interesse em tomar alguma decisão com ela.

É neste momento que assim como saber qual cortina combina com o sofá, é preciso saber qual tipo de gráfico combina com a informação gerada. E assim como uma casa bem decorada não se vende sozinha é preciso que esta informação chegue as pessoas certas e que seja “vendida” da forma correta. Aqui é onde o cientista conta a história do jeito certo. #storytelling

Acho que entendi, mas como é na prática?

De uma forma um pouco mais técnica, o engenheiro vai lidar com o pré-processamento dos dados limpando e traduzindo a base crua para um ponto em que ela possa ser utilizada pelo cientista. O engenheiro pode lidar bastante com bancos de dados e com processos ETL. O SQL e NoSQL podem ser skills importantes, além de conhecimentos dos sistemas operacionais e da infraestrutura do negócio.

O cientista por sua vez precisa entender de programação para a manipulação dos dados pré-preparados pelo engenheiro. E junto dos conhecimentos em estatística, desenvolve os modelos adequados para a resolução do problema. Python e R podem ser grandes aliadas neste processo. Sem esquecer que todo o conhecimento gerado pelos modelos precisam ser apresentados de forma clara aos interessados no negócio, por isso bons conhecimentos em técnicas de visualização de dados e storytelling farão toda a diferença para o sucesso de um cientista de dados.

Conclusão

Fica claro nesse exemplo que o engenheiro e o cientista trabalham juntos com o mesmo objetivo, construir a casa, ou seja, gerar valor para o negócio, porém com responsabilidades e papéis distintos.

Mas e aí, qual escolher?

Bom, depende de onde você veio e para onde você quer ir.

Nem sempre a divisão entre essas duas funções serão muito claras e objetivas. Conheça as características da vaga e da empresa que você deseja trabalhar e veja qual se adequa ao seu perfil ou ao perfil que você quer construir.

Independente de qual escolher, continue se desenvolvendo e dando o seu melhor. O sucesso é apenas uma consequência disso!

Grande abraço e até a próxima!

Referências:

https://www.datacamp.com/community/blog/data-scientist-vs-data-engineer

https://www.datacamp.com/community/tutorials/data-science-industry-infographic

--

--

Giovanni Angelo
Dados de Cientista

Cientista de Dados em formação | Coordenador de Sistemas | Administrador de Dados | Carioca