Como começar na área de Ciência de Dados? — Em dois passos.

Julia Tessler
iFood Tech
Published in
4 min readMay 28, 2020

Quando Ciência de Dados começou a aparecer como a profissão mais sexy do século XXI lá pros idos de 2012, eu tive o privilégio de ser uma aluna de segundo ano de estatística. Claro que eu não sabia como isso se aplicaria no dia-a-dia e menos ainda o que seria ciência de dados, só queria fugir dos bancos onde os meus colegas veteranos trabalhavam. Eu já contei um pouco sobre a trajetória da minha carreira em algumas oportunidades, então vamos para dicas rápidas de como se tornar um unicórnio num universo em que todos querem ser unicórnios.

Ciência de dados = Matemática + Computação + Domínio do negócio

A maior parte das pessoas que já ouviu falar sobre ciência de dados deve ter visto um diagrama que pinta a área como a união meio mágica entre matemática, computação e domínio do negócio. E é daí que vem o conceito de unicórnio: como diabos alguém vai dominar tudo isso e entrar em uma posição de estágio ou júnior? Matemática por si só já é complicado, computação leva tempo pra aprender e o que cargas d’água é domínio do negócio?

Na prática, pra começar, basta que você saiba um bocado de matemática e um pouco de computação. Modelos de aprendizado de máquina que usamos bastante em ciência de dados são bastante conhecimento estatístico aplicado através de computação. Se você fez ensino superior em alguma área das ciências exatas, isso significa que você provavelmente teve uma matéria de estatística — que deve ter sido muito chata, eu sei. Mas você vai aprender a amar essa ferramenta matemática linda que sofre com marketing ruim.

Você, também, provavelmente já se acostumou com a programação que aprendeu durante a faculdade. Note que, se acostumar, não é o mesmo que afirmar com o peito estufado “eu sei programar”. E tudo bem. Porque a parte realmente relevante da programação é entender lógica de programação, ou seja, como é a estrutura de blocos de comandos. Pra entender isso, recomendo a ferramenta Scratch, em que você monta cenários para um gatinho. Parece bobo, mas é realmente como programação funciona. Na prática, usamos linguagens como Python ou R para treinar modelos e SQL para extrair bancos de dados.

Scratch tá meio longe de Python ou R, mas linguagens de programação tem todas mais ou menos o mesmo centro. Então, se você entende como fazer o Scratch andar pela tela, você provavelmente vai conseguir passar pra Python :D E existe muito material pra aprender Python aplicado à ciência de dados na internet, boa parte gratuita. Porém, a maior parte desse material está em inglês. Então, inglês instrumental ainda é uma habilidade muito relevante. E, bem, códigos em Python precisam ser legíveis pra funcionar. Então um bom código em Python é quase como ler inglês (:

De estatística, é importante entender algumas medidas como média, mediana e desvio padrão. Com elas, você consegue começar a entender melhor sobre a distribuição dos dados, que é super importante para treinar modelos que façam sentido e sejam aplicáveis no mundo real! Alguns modelos comuns de aprendizado de máquina como a regressão logística (para classificação de pratos, como se é uma pizza ou um hambúrguer) e a linear (para predição de coisas contínuas como valor de pratos) são velhas conhecidas da estatística. Enquanto você se aventura nesse mundo maravilhoso, você já vai se acostumar a construir e entender gráficos, que são super importantes para um bom cientista de dados (que terá que traduzir as informações que os números nos trazem para pessoas que não são da área).

Tá, mas então o que eu preciso saber e como eu começo?

De forma simples e rápida, você precisa saber:

  1. Lógica de programação (e se já começar a aprender por Python uma vez que você entendeu o Scratch, melhor).
  2. Estatística (e esse tem vários cursos divertidos na internet também!)

Os pormenores você aprende no caminho, mas a base é essa. Quando eu comecei, mal sabia estatística e, olha só, deu tudo certo no final.

Algo muito importante é que acreditamos que bons profissionais podem vir de qualquer lugar. Então, se você tem ensino superior em alguma área de exatas, é bem provável que você tenha um pouco mais de facilidade com essas coisas porque a faculdade te obrigou. Mas isso não significa que só porque você não vem dessa área, você não consegue. O importante é começar em algum lugar e é sempre mais fácil começar de onde sabemos que somos um pouquinho mais treinados e depois evoluir pra coisas mais complexas.

Além disso, não tenha medo de tentar. Tudo é novo nessa área e todo mundo gosta muito de aprender o tempo todo. Se você já começou a se aventurar brincando com os códigos do Kaggle, você está no caminho certo e já pode começar a dar saltos mais altos, como se desafiar no mercado de trabalho (aliás, já deu uma olhada nas nossas vagas hoje?). Se ainda não chegou lá, quebre os objetivos em coisas menores, entre em contato com profissionais da área e peça ajuda. Vá em eventos! Os meetups do iFood Brain são lugares legais pra conhecer gente nova e trocar figurinhas sobre o aprendizado :)

Quer receber conteúdos exclusivos criados pelos nossos times de tecnologia? Inscreva-se.

--

--