Tipos de Cientista de Dados

Cora Silberschneider
Data Hackers
Published in
3 min readMay 23, 2021

Existem diversas vagas abertas com o título de Cientista de Dados no mercado, mas o que poucos sabem é que nem todo cargo de Cientista de Dados possui a mesma função.

Observando as vagas existentes resolvi trazer um pouco da minha visão dos diferentes cientistas de dados que o mercado vem buscando. Claro que um não exclui o outro, ou seja, existem cientistas que possuem as funções misturadas no que descrevi abaixo. A ideia é trazer uma visão mais genérica sem entrar em detalhes nas ferramentas ou skills técnicas que cada cientista precisa ter.

Source: Mindful

Cientista de dados — Negócio

Esse cientista tem a função de utilizar os dados para trazer inteligência no negócio. Através de análises de dados e construção de estudos, ele/ela irá buscar trazer insights que geram valor para a empresa. Seus conhecimentos em machine learning são utilizados para auxiliar nos estudos, por exemplo, desenvolver modelos de predição de churn de usuários ou segmentação de usuários. Além disso, são necessários conhecimentos em estatística e SQL para fazer as análises.

Essa pessoa vai possuir uma comunicação muito grande com os Stakeholders da empresa/clientes para entender melhor as “dores” e aprofundar nas necessidades do negócio. É necessário uma boa capacidade analítica, de comunicação e de interpretação dos dados.

Cientista de dados — Machine Learning

Dentro de machine learning acredito que existam dois tipos:

Researcher

Esse cientista está mais focado na criação e manutenção de modelos de machine learning. Faz o processamento de grande volume de dados e desenvolve modelos mais complexos para a empresa. Como alguns exemplos poderíamos citar aqueles modelos de anti-fraude, sistema de recomendação, reconhecimento de imagem/voz, dentre outros. O seu foco principal é a exploração e estudo dos modelos de machine learning aplicados em casos reais, que poderão ser produtizados no futuro.

O conhecimento em alguma linguagem de programação é essencial para desenvolver algoritmos de machine learning/deep learning. Esse cientista precisa ter uma comunicação com a área de engenharia de dados e também um pouco com a área de negócio para definir e priorizar os projetos de ML necessários para a empresa/clientes.

Machine Learning Engineer

Existem algumas vagas que já possuem esse título, mas outras ainda se mantém como vaga de Cientista de Dados. Além da construção de modelos de ML essa pessoa também possui um foco maior na parte de MLOPs. Ela precisa de uma comunicação forte com a área de engenharia de dados. Dentre suas tarefas, a principal é ter a capacidade de construir e modelar pipelines a fim de produtizar modelos de machine learning.

Ou seja, além dos conhecimentos em algoritmos de ML, essa pessoa precisa ter fundamentos de devops e engenharia de dados. Em alguns casos também, o conhecimento em engenharia de software contribui para o cientista ter melhores práticas nos processos.

Conclusão

A ideia foi trazer um pouco sobre as diferentes atuações que o mercado vêm procurando para os Cientistas de Dados. Acredito que essas atuações podem sofrer adaptações ao longo dos anos, conforme vão surgindo novas ferramentas e automações na área. E ai, vocês acham que existem outras funções mais específicas?

Obrigada a todos que chegaram até aqui, quem quiser conectar estou no Linkedin :)

--

--