Por onde começar em análise de dados?
O que é? De onde vem? O que fazem? Pra que serve? Hoje! Nesse artigo :)
A pergunta que eu mais recebo no meu canal é:
“Lucas, se você começasse hoje, por onde começaria e no que focaria?”
E eu sempre oriento em buscar os fundamentos da análise de dados, para depois buscar novos desafios. Mas … você sabe quais são as tarefas que uma pessoa analista de dados faz no seu dia a dia?
E é isso que eu vou te explicar ao longo desse artigo, na verdade, serão duas coisas que irei abordar:
- O que uma pessoa analista de dados faz no seu dia a dia.
- O que você precisa estudar para ser analista de dados.
Vamos começar do zero, entendendo o que é a análise de dados:
Análise de dados basicamente é um processo composto por algumas etapas, como: examinar, tratar, transformar e modelar dados.
Com o objetivo de encontrar informações relevantes nos dados brutos, quase sempre para apoiar uma tomada de decisão e/ou responder uma pergunta.
Resumindo: analistas de dados coletam, preparam e analisam os dados a fim de responder perguntas para apoiar a tomada de decisão.
O Ato de analisar é um campo amplo, mas podemos falar das ramificações mais famosas do mercado:
- Business Intelligence: Coletar os dados internos da empresa e apoiar no entendimento do negócio. Pensamento muito voltado à ter dados de qualidade armazenados.
- AED Análise Exploratória de Dados: Explorar os dados brutos para encontrar novas características nos dados.
- ACD Análise Confirmatória de Dados: Confirma se uma hipótese é válida ou não.
- APD Análise Preditiva de Dados: Uso de algoritmos para previsões estatísticas.
Existem outras ramificações, mas essas são as principais e quase todas as outras derivam dessas.
Resumindo: Você irá analisar dados, rs! Tem o caminho BI, buscando um entendimento do que aconteceu dentro da empresa e, as análises exploratórias, descobrindo/explorando dados internos e externos para direcionar o negócio.
Agora, minimamente, sabemos o que é o campo de análise de dados.
Então … Vamos entender quais são as tarefas do dia a dia de uma pessoa analista de dados:
Abaixo vou listar as principais atividades realizadas no dia a dia!
- Coleta, tratamento e modelagem de dados: 80% das vezes você terá a necessidade de processar seus dados antes de analisá-los! E se você não está fazendo essa etapa, pode ter certeza que suas análises podem estar enviesadas (salvo exceções)!
- Reuniões com as áreas de negócio: Você irá conversar, e muito, com as área de negócio da empresa. Desde de entender um problema, analisá-lo e apresentar resultados dos seus trabalhos. Estabeleça uma boa relação às áreas de negócio, serão seus aliados durante a sua jornada!
- Visualização & História de Dados: Após todo o processo exploratório, será necessário apresentar o que foi encontrado, com isso duas técnicas serão extremamente necessárias, quase obrigatórias. Saber contar história com dados, elaborar algo que faça sentido (tenha início, meio e fim) e que estejam relacionados, e boa visualização dos resultados encontrados.
- Mentoria, revisão de código e pareamento: É bem raro você trabalhar em um projeto sozinho! Você irá precisar minimamente saber se relacionar com outras pessoas, principalmente com a equipe que você faz parte.
- Trabalhos fora da curva: Esteja preparada para executar alguns trabalhos que você não gosta muito, como rodar aquela consulta SQL demorada para enviar ao time de vendas às 18h em uma sexta-feira. Geralmente o analista é porta de entrada para os dados para as demais áreas da empresa, e muitas vezes detentor do conhecimento dos dados, logo, quase sempre é procurado quando as “coisas esquentam”.
Acima listei as atividades que são mais realizadas, mas ocorrem outras de acordo com a empresa.
Agora que já sabemos o que e quais são as atividades do dia a dia, vou falar um pouco de quais conhecimentos você deveria buscar.
Trilha para Análise de Dados
Essa trilha tem foco em Python!
Step 1
Nesse estágio você não tem nenhum conhecimento, seu principal objetivo é entender como a linguagem Python funciona para dados e como configurar seu ambiente de desenvolvimento.
- Python: Com foco em análise de dados. Busque aprender os conceitos básicos da linguagem.
- Ambiente de análise de dados: Aprender como configurar seu ambiente de desenvolvimento.
Step 2
Nesse momento você já sabe minimamente como funciona a linguagem e tem seu ambiente de desenvolvimento configurado mas não sabe como trabalhar com dados.
- Biblioteca Pandas: Essa será sua principal biblioteca, nesse momento. Aprender a fazer no pandas o que você faz no Excel! Aprenda como extrair dados, transformar, manipular e exportar.
- SQL: Criar consultas de dados utilizando SQL (aprender o comando SELECT) e como funcionam os JOINS.
Step 3
Agora você sabe como conectar diversas fontes de dados e prepará-los para analisar e visualizar o que foi encontrado.
- Biblioteca Matplotlib: Praticamente é a biblioteca mãe na parte de visualização, quase todas as outras derivam dela. Domine o método plot e terá sucesso, depois avance conforme a necessidade.
- Estatística Descritiva: Para deixar de ser apenas uma pessoa que cria gráficos, você vai precisar aprender a aplicar a estatística em seus dados. A estatística descritiva é simples de aprender e aplicar e te abrirá um leque gigantesco em termos de análise.
- Biblioteca Seaborn: Visualizações estatística, tudo que você verá acima, Seaborn deixa a visualização bonita e simples de ser construída. Invista um tempo em aprender que vale muito a pena.
Eu vejo os três passos acima como essenciais! Será a sua base para novos conhecimentos. Abaixo vou listar mais alguns conhecimentos que você deverá buscar quando compreender os passos de cima:
- Git/Github: Principais comandos do git, processo de pull request e revisão de código.
- Estatística: Você não precisa virar um estatístico, mas irá precisar evoluir seus conhecimentos e aumentar seu leque de conhecimento.
- SQL: Também será necessário entender um pouco mais das funções que o SQL tem.
- Visualização de dados: É extremamente importante ler sobre boas práticas de visualização de dados, desde de como montar uma história a escolher cores.
E, não existe fórmula pronta, conforme você for avançando, as necessidades irão aparecer e você vai buscando os conhecimentos para supri-las.
Mas os três primeiros passos serão sua base para chegar nesse momento : )