Escolhendo a Carreira
Entendendo a diferença entre Cientista de Dados e Engenheiro de Dados
Se você, assim como eu, está começando a adentrar no universo Data Science com o objetivo de torná-lo seu ganha pão, já deve ter se deparado com esses dois cargos e principalmente ficado em dúvida do que é cada um. (comigo foi assim). Então deixa eu te mostrar o que descobri, vamos lá!
Para que possamos entender com mais facilidade, vamos usar o exemplo da construção civil, vamos comparar o projeto de Data Science com a construção de uma casa. Desde a preparação do terreno onde a casa será construída até o próprio acabamento e decoração.
Engenheiro de Dados x Cientista de Dados
Basicamente o Engenheiro de Dados prepara o terreno para o Cientista de Dados.
É o engenheiro que estuda qual a composição do terreno, que tipo de solo existe e até quanto lixo aquele solo recebeu. Seu papel é entregar esse terreno o mais limpo, plano e confiável possível. Na prática é o engenheiro que junta, limpa e corrige os dados para que o cientista tenha a base necessária para desenvolver o seu modelo e gerar valor ao negócio.
Quanto mais sólido, limpo e preparado for esse terreno mais confiável será a construção.
O engenheiro depois de entregar o terreno ao cientista continua dando apoio para que todas as ferramentas necessárias estejam em pleno funcionamento para a construção.
E o cientista?
Bom, o cientista começa fazendo uma primeira etapa de verificação do terreno, ele precisa ver se o solo está realmente adequado, quais os tipos de construções poderão ser feitas e até se tem espaço suficiente. Ou seja, ele precisa verificar se para resolver o problema em questão todos os dados necessários estão disponíveis, se será preciso coletar mais dados ou até que tipo de modelos poderão ser desenvolvidos a partir dali.
Depois vem a parte da alvenaria, onde os alicerces e paredes são construídos. Tudo aquilo que sustentará a construção é feito nesta etapa. Neste momento que o cientista desenvolve, testa e valida os modelos de machine learning e gera os insights pro negócio.
É onde o dado ganha valor como informação.
E assim como uma casa super bem construída e forte não é vendida senão tiver um bom acabamento, é preciso dar uma decoração à ela para que chame a atenção de quem realmente importa. Por isso é preciso traduzir a informação bruta em uma forma amigável e legível para quem realmente tem interesse em tomar alguma decisão com ela.
É neste momento que assim como saber qual cortina combina com o sofá, é preciso saber qual tipo de gráfico combina com a informação gerada. E assim como uma casa bem decorada não se vende sozinha é preciso que esta informação chegue as pessoas certas e que seja “vendida” da forma correta. Aqui é onde o cientista conta a história do jeito certo. #storytelling
Acho que entendi, mas como é na prática?
De uma forma um pouco mais técnica, o engenheiro vai lidar com o pré-processamento dos dados limpando e traduzindo a base crua para um ponto em que ela possa ser utilizada pelo cientista. O engenheiro pode lidar bastante com bancos de dados e com processos ETL. O SQL e NoSQL podem ser skills importantes, além de conhecimentos dos sistemas operacionais e da infraestrutura do negócio.
O cientista por sua vez precisa entender de programação para a manipulação dos dados pré-preparados pelo engenheiro. E junto dos conhecimentos em estatística, desenvolve os modelos adequados para a resolução do problema. Python e R podem ser grandes aliadas neste processo. Sem esquecer que todo o conhecimento gerado pelos modelos precisam ser apresentados de forma clara aos interessados no negócio, por isso bons conhecimentos em técnicas de visualização de dados e storytelling farão toda a diferença para o sucesso de um cientista de dados.
Conclusão
Fica claro nesse exemplo que o engenheiro e o cientista trabalham juntos com o mesmo objetivo, construir a casa, ou seja, gerar valor para o negócio, porém com responsabilidades e papéis distintos.
Mas e aí, qual escolher?
Bom, depende de onde você veio e para onde você quer ir.
Nem sempre a divisão entre essas duas funções serão muito claras e objetivas. Conheça as características da vaga e da empresa que você deseja trabalhar e veja qual se adequa ao seu perfil ou ao perfil que você quer construir.
Independente de qual escolher, continue se desenvolvendo e dando o seu melhor. O sucesso é apenas uma consequência disso!
Grande abraço e até a próxima!
Referências:
https://www.datacamp.com/community/blog/data-scientist-vs-data-engineer
https://www.datacamp.com/community/tutorials/data-science-industry-infographic