E aí? Por onde começo nesse mundo de cientista de dados?

Data Bootcamp
Data Bootcamp
Published in
4 min readJan 25, 2018

Qual o caminho das pedras para conhecer Python?

Uma dúvida que já passou na nossa cabeça e de muita gente é por onde começo minha vida de cientista de dados? Por que falam tanto que tenho que saber programar?
Para ajudar a responder essa pergunta tão complexa estamos criando uma série de posts que vão falar sobre os pilares da ciência de dados.

“[Data scientists are] able to think of ways to use data to solve problems that otherwise would have been unsolved, or solved using only intuition.” — Peter Skomoroch, Former Principal Data Scientist at LinkedIn

Ciência de dados tem 3 grandes pilares:

  1. Programação
  2. Estatística
  3. Conhecimento sobre o negócio.

Eles são os pilares do mundo dos dados. Claro que cada um vai tender para uma qualidade que tem mais afinidade, mas o conhecimento dos 3 te ajuda a construir bases mais sólidas.

Nesse primeiro post vamos contar como programar é fundamental!

Saber programar nessa década passou de uma finalidade ao meio para se conseguir algo. Muita gente importante na história acredita que programação deveria ser ensinado na escola desde os primeiros anos. A justificativa para isso é a autonomia e a aceleração no processo criativo que a programação te traz.

“Learning these skills isn’t just important for your future. It’s important for our country’s future … If we want America to stay on the cutting edge, we need young Americans like you to master the tools and technology that will change the way we do just about everything.”

No mundo da ciência de dados, programar é a ferramenta que torna análises e modelos de machine learning realidade. Programar é mais que a sua entrega final, é aonde você busca as respostas e gera perguntas através dos seus dados.

No passado ler os dados só era possível com uma análise manual e a ajuda de uma calculadora. O tempo foi passando e a nossa coleta de dados aumentou muito, indo de máquinas nas industrias até as navegações de usuários em um site, tornando inviável o uso de “papel e caneta”. Atualmente muitos sistemas são vendidos prometendo fazer análises de dados, mas a maioria deles te entregam soluções para perguntas já geradas de forma engessada.

No mundo onde dados são abundantes ter ferramentas de código aberto e gratuitas que te auxiliam a extrair, coletar, armazenar, processar e tirar resultados são o melhor caminho. Trabalhos repetitivos, como por exemplo, todo dia extrair um relatório é muito custoso e ter a habilidade de saber programar te traz agilidade para muitas coisas que antes você nem pensava que poderia ser automatizado.

Qual a melhor forma de começar?

PYTHON. Fui direto demais mas vou traçar os motivos:

Fácil: Esse é um termo pejorativo nesse mundo mas o que torna Python uma linguagem fácil são os seus princípios, é uma linguagem voltada para todos nós conseguirmos ler e não só a máquina. Ela segue a filosofia do explicito é melhor que implícito, o que ajuda muito a entender o que está acontecendo.

Comunidade: Python tem uma grande vantagem de ser usada a anos por grandes empresas (google, facebook, yahoo, NASA, IBM..) e ser muito apoiada no código livre, isso fez com que muita gente boa já tenha criado pacotes que irão de ajudar do início da sua vida até você ter muitos anos de experiência.

Pacotes: Por falar em bibliotecas/pacotes, em Python nós temos 2 grandes amigos no mundo da ciência de dados o NumPy e o Sklearn, que nos ajudam muito a abstrair conceitos matemáticos, facilitando e deixando o nosso código mais limpo.

Padrão: Sei que os amigos que gostam de R vão ficar chateados mas Python é a linguagem mais usada no mundo dos cientistas de dados atualmente, a fonte disso é a pesquisa anual do Kaggle, principal plataforma de desafios de machine learning e análise de dados do mundo.

JUPYTER: Quando nós falamos de ferramenta para o dia-a-dia para gerar análises e modelos, ele é de longe o que temos de melhor. Além da facilidade de escrever um relatório que junte texto, imagens e código.

E cadê os links legais pra continuar minha saga?

E o Data Bootcamp?

Nós no Data Bootcamp acreditamos que com conhecimento prático sobre Python e estatística, junto com o seu conhecimento sobre o negócio você pode em pouco tempo mudar a forma como você olha, analisa e prediz sobre os dados que passam todo dia por você.

Se você quiser conhecer um pouco mais sobre nós pode visitar as nossas redes sociais e o nosso site.

www.databootcamp.com.br
https://www.facebook.com/databootcampbr/
https://twitter.com/databootcampbr

Obrigado!

Equipe Data Bootcamp

--

--

Data Bootcamp
Data Bootcamp

Bem-vindo ao maior bootcamp de Data Science do Brasil! Acesse www.databootcamp.com.br e conheça nossos cursos.