O que aprendi na Formação Cientista de Dados da Data Science Academy

Gustavo Santos
gustavorsantos
Published in
5 min readSep 25, 2020

--

Photo by Markus Spiske on Unsplash

Nota

Antes de mais nada, gostaria de deixar claro que esta postagem não é patrocinada. É meramente a minha opinião pessoal sobre os cursos que compõem a Formação Cientista de dados (FCD) da Data Science Academy (DSA).

Contexto

Neste artigo, vou fazer a minha review sobre os 6 cursos da FCD, a saber: 1. Big Data Analytics com R e Microsoft Azure Machine Learning; 2. Big Data Real-Time Analytics com Python e Spark; 3. Engenharia de Dados com Hadoop e Spark; 4. Machine Learning; 5. Business Analytics; 6. Visualização de Dados e Design de Dashboards.

Porém, antes de iniciar com a review propriamente dita, deixe-me contextualizar rapidamente como essa formação se encaixa com a minha carreira.

Eu trabalho na indústria de tecnologia desde o início da minha carreira em 2006, passando por duas grandes empresas do setor. Durante todo esse tempo, sempre estive em contato direto com dados (e quem não está hoje em dia, não é? hehe). E trabalhar com dados no mundo corporativo muitas vezes se resume a usar o Excel. Mas desde o início eu queria ir mais longe, criando maneiras de deixar a ferramenta fazer a maior parte do trabalho. Então criei diversas planilhas automatizadas ou semi-automatizadas, na qual as macros ou as fórmulas eram as estrelas.

Foi só recentemente, no final de 2018, que eu ouvi falar da carreira de Cientista de Dados. Inspirado e estimulado pela liderança da empresa, fui atrás de saber mais sobre a carreira. E foi aí que a Data Science Academy entrou no jogo.

Procurando por cursos, certificações ou diplomas na área, a formação oferecida por aquela escola me parecia a mais prática, a mais mão-na-massa possível. Para um cara com formação acadêmica em Marketing e alguma noção de programação em VBA, era justamente o que eu precisava. Escolhi a DSA em detrimento de outros cursos de especialização ou MBAs oferecidos na área e sei que fiz a melhor decisão.

Vamos em frente. Revisões!

1. Big Data Analytics com R e Microsoft Azure Machine Learning

No primeiro curso a DSA já chega com tudo. O curso de Big Data com R é um dos maiores da formação, tendo 108 horas de treinamento. Para mim, que nunca tinha ouvido falar em R, o início foi um chacoalhão do tipo "Ei, acorda! Existem muitas ferramentas boas por aí que você precisa aprender". O curso vai do zero mesmo — "não sei nem instalar o programa" — até um nível básico sólido. Eu aprendi muita coisa boa que me deu confiança para colocar o R no meu currículo logo ao fim desse curso.

Ainda tem uma bela introdução à estatística para análise de dados, uma introdução ao Machine Learning com R e também uma abordagem bem completa do Microsoft Azure ML.

2. Big Data Real-Time Analytics com Python e Spark

Ok. Antes de fazer esse curso, você vai ouvir o instrutor (Daniel Mendes) repetindo insistentemente para você completar o curso de Python Fundamentos, gratuito na própria DSA.

É fato. Se você não conhece Python, tem que fazer. A base está ali e será usada durante todo o curso 2 da formação. Eu preferi fazer o curso de Python antes mesmo de começar o curso 2 para aprender melhor o conteúdo.

No curso de Python com Spark você vai aprender mais um pouco de estatística, afinal uma boa parte do trabalho de um cientista de dados é compreender os dados. E, para isso, a estatística tem um papel fundamental, te ajudando a entender como os seus dados estão distribuídos e ajudando a fazer inferências sobre eles.

Mas, certamente, a coisa fica mais divertida quando começa o capítulo de Machine Learning com Python, onde você já começa a sentir o gostinho desta parte mais famosa da Ciência de Dados. Depois ainda tem os capítulos principais do curso, onde você aprende a manipular dados e aplicar machine learning em quantidades enormes de dados usando o Apache Spark, uma ferramenta que está bem em alta atualmente.

O projeto trabalhado no curso é de Análise de dados do Twitter e processamento de linguagem natural.

Um curso muito completo.

3. Engenharia de Dados com Hadoop e Spark

Nesse curso, a complexidade aumenta bastante. Usar o Hadoop não é tarefa fácil. Configurar o Hadoop é bem intenso. São diversos parâmetros e tudo na linguagem de comando do Linux.

A parte boa é que talvez você não vá encontrar outro curso onde o conteúdo vem tão mastigado quanto nesse da DSA. É a minha opinião.

Mas venha com a mente preparada. Este foi, para mim, o curso mais difícil da formação.

4. Machine Learning

Passado o curso de Engenharia de Dados, você aterrisa no coração da FCD: o curso de Machine Learning. Neste curso de 120 horas, o maior da formação, você vai aprender em profundidade os principais algoritmos de machine learning, alternando o uso de linguagem entre R e Python. Regressão Linear, Regressão LASSO, Regressão Logística, Random Forest, XGB, SVM, enfim, você vai virar o scikit-learn do avesso.

Quando eu acabei esse curso, senti que já era um Cientista de Dados. Isto é, senti que tinha conhecimento suficiente para começar um trabalho e performar bem como um profissional Junior da área.

5. Business Analytics

O curso de Business Analytics vem para começar o fechamento da formação. A ideia aqui me pareceu amarrar todos os conceitos em uma espécie de estudos de caso, para que você seja capaz de entender como os conceitos aprendidos até então podem ser usados no dia-a-dia, aplicados a situações e problemas de negócios reais.

6. Visualização de Dados e Design de Dashboards

E para finalizar, é preciso aprender a arte de contar histórias com dados. O data storytelling é uma habilidade valorizada por conseguir resumir o conteúdo dos dados e transformá-lo em conhecimento em forma de história, de modo que fique fácil para qualquer um entender o que aqueles dados estão fornecendo de informação.

Aqui você aprende que construir um gráfico é muito mais do que apenas abrir uma planilha ou um programa e jogar os dados ali. As cores, o tipo de gráfico, legenda, título, tudo precisa fazer sentido para ajudar o seu público a entender aqueles dados.

Conclusão

Pra fechar este artigo, deixo com vocês que a minha experiência com a FCD foi muito positiva. Eu saí de um status onde mal sabia o que era Ciência de Dados para um patamar bem mais avançado do que eu poderia imaginar.

Durante o curso, ainda recebi bastante conteúdo extra, adicionados para os alunos que compram as formações e que foram me ajudando a construir meu conhecimento.

É claro que muito do que você aprende depende de você. Somente comprar a FCD e assistir às aulas sem praticar não vai te fazer um Cientista de Dados. Nem mesmo outros cursos farão isso. A sua missão é se dedicar, praticar, fazer o máximo de projetos possíveis e pesquisar, ler e aprender também de outras fontes na internet. Tá cheio de coisa boa por aí: artigos no medium, cursos grátis no edX, YouTube etc etc etc.

Com o conhecimento dessa formação, fui capaz de construir o meu blog/ portfólio que segue sendo desenvolvido em https://datasciencegus.wordpress.com

Fiquem com esses pensamentos abaixo e boa sorte nos estudos!

A consistência leva ao sucesso.

Feito é melhor do que perfeito.

Gus

--

--

Gustavo Santos
gustavorsantos

Data Scientist. I extract insights from data to help people and companies to make better and data driven decisions. | In: https://www.linkedin.com/in/gurezende/