Por onde começar em análise de dados?

Lucas Ribeiro
Data Hackers
Published in
5 min readSep 29, 2021

O que é? De onde vem? O que fazem? Pra que serve? Hoje! Nesse artigo :)

Photo by Gia Oris on Unsplash

A pergunta que eu mais recebo no meu canal é:

“Lucas, se você começasse hoje, por onde começaria e no que focaria?”

E eu sempre oriento em buscar os fundamentos da análise de dados, para depois buscar novos desafios. Mas … você sabe quais são as tarefas que uma pessoa analista de dados faz no seu dia a dia?

E é isso que eu vou te explicar ao longo desse artigo, na verdade, serão duas coisas que irei abordar:

  • O que uma pessoa analista de dados faz no seu dia a dia.
  • O que você precisa estudar para ser analista de dados.

Vamos começar do zero, entendendo o que é a análise de dados:

Análise de dados basicamente é um processo composto por algumas etapas, como: examinar, tratar, transformar e modelar dados.
Com o objetivo de encontrar informações relevantes nos dados brutos, quase sempre para apoiar uma tomada de decisão e/ou responder uma pergunta.

Resumindo: analistas de dados coletam, preparam e analisam os dados a fim de responder perguntas para apoiar a tomada de decisão.

O Ato de analisar é um campo amplo, mas podemos falar das ramificações mais famosas do mercado:

  • Business Intelligence: Coletar os dados internos da empresa e apoiar no entendimento do negócio. Pensamento muito voltado à ter dados de qualidade armazenados.
  • AED Análise Exploratória de Dados: Explorar os dados brutos para encontrar novas características nos dados.
  • ACD Análise Confirmatória de Dados: Confirma se uma hipótese é válida ou não.
  • APD Análise Preditiva de Dados: Uso de algoritmos para previsões estatísticas.

Existem outras ramificações, mas essas são as principais e quase todas as outras derivam dessas.

Resumindo: Você irá analisar dados, rs! Tem o caminho BI, buscando um entendimento do que aconteceu dentro da empresa e, as análises exploratórias, descobrindo/explorando dados internos e externos para direcionar o negócio.

Agora, minimamente, sabemos o que é o campo de análise de dados.

Então … Vamos entender quais são as tarefas do dia a dia de uma pessoa analista de dados:

Abaixo vou listar as principais atividades realizadas no dia a dia!

  • Coleta, tratamento e modelagem de dados: 80% das vezes você terá a necessidade de processar seus dados antes de analisá-los! E se você não está fazendo essa etapa, pode ter certeza que suas análises podem estar enviesadas (salvo exceções)!
  • Reuniões com as áreas de negócio: Você irá conversar, e muito, com as área de negócio da empresa. Desde de entender um problema, analisá-lo e apresentar resultados dos seus trabalhos. Estabeleça uma boa relação às áreas de negócio, serão seus aliados durante a sua jornada!
  • Visualização & História de Dados: Após todo o processo exploratório, será necessário apresentar o que foi encontrado, com isso duas técnicas serão extremamente necessárias, quase obrigatórias. Saber contar história com dados, elaborar algo que faça sentido (tenha início, meio e fim) e que estejam relacionados, e boa visualização dos resultados encontrados.
  • Mentoria, revisão de código e pareamento: É bem raro você trabalhar em um projeto sozinho! Você irá precisar minimamente saber se relacionar com outras pessoas, principalmente com a equipe que você faz parte.
  • Trabalhos fora da curva: Esteja preparada para executar alguns trabalhos que você não gosta muito, como rodar aquela consulta SQL demorada para enviar ao time de vendas às 18h em uma sexta-feira. Geralmente o analista é porta de entrada para os dados para as demais áreas da empresa, e muitas vezes detentor do conhecimento dos dados, logo, quase sempre é procurado quando as “coisas esquentam”.

Acima listei as atividades que são mais realizadas, mas ocorrem outras de acordo com a empresa.

Agora que já sabemos o que e quais são as atividades do dia a dia, vou falar um pouco de quais conhecimentos você deveria buscar.

Trilha para Análise de Dados

Essa trilha tem foco em Python!

Step 1

Nesse estágio você não tem nenhum conhecimento, seu principal objetivo é entender como a linguagem Python funciona para dados e como configurar seu ambiente de desenvolvimento.

  • Python: Com foco em análise de dados. Busque aprender os conceitos básicos da linguagem.
  • Ambiente de análise de dados: Aprender como configurar seu ambiente de desenvolvimento.

Step 2

Nesse momento você já sabe minimamente como funciona a linguagem e tem seu ambiente de desenvolvimento configurado mas não sabe como trabalhar com dados.

  • Biblioteca Pandas: Essa será sua principal biblioteca, nesse momento. Aprender a fazer no pandas o que você faz no Excel! Aprenda como extrair dados, transformar, manipular e exportar.
  • SQL: Criar consultas de dados utilizando SQL (aprender o comando SELECT) e como funcionam os JOINS.

Step 3

Agora você sabe como conectar diversas fontes de dados e prepará-los para analisar e visualizar o que foi encontrado.

  • Biblioteca Matplotlib: Praticamente é a biblioteca mãe na parte de visualização, quase todas as outras derivam dela. Domine o método plot e terá sucesso, depois avance conforme a necessidade.
  • Estatística Descritiva: Para deixar de ser apenas uma pessoa que cria gráficos, você vai precisar aprender a aplicar a estatística em seus dados. A estatística descritiva é simples de aprender e aplicar e te abrirá um leque gigantesco em termos de análise.
  • Biblioteca Seaborn: Visualizações estatística, tudo que você verá acima, Seaborn deixa a visualização bonita e simples de ser construída. Invista um tempo em aprender que vale muito a pena.

Eu vejo os três passos acima como essenciais! Será a sua base para novos conhecimentos. Abaixo vou listar mais alguns conhecimentos que você deverá buscar quando compreender os passos de cima:

  • Git/Github: Principais comandos do git, processo de pull request e revisão de código.
  • Estatística: Você não precisa virar um estatístico, mas irá precisar evoluir seus conhecimentos e aumentar seu leque de conhecimento.
  • SQL: Também será necessário entender um pouco mais das funções que o SQL tem.
  • Visualização de dados: É extremamente importante ler sobre boas práticas de visualização de dados, desde de como montar uma história a escolher cores.

E, não existe fórmula pronta, conforme você for avançando, as necessidades irão aparecer e você vai buscando os conhecimentos para supri-las.

Mas os três primeiros passos serão sua base para chegar nesse momento : )

Eu tenho um canal no YouTube para ensinar análise de dados, e temos as três trilhas descritas acima. Talvez possa te ajudar a dar seus primeiros passos : )

Ei, gostou do material? Deixe nos comentários se esse guia te ajudou ou se eu esqueci de comentar algum ponto.

Não esqueça de compartilhar e deixar seu like ❤

--

--