Como Aprender Data Science de Graça nas Melhores Universidades do Mundo

Sobre

Esse post apresenta um caminho sólido para quem quer, sem custo algum, se formar em um curso de Data Science fazendo seu próprio horário, nas melhores universidades do mundo.

Em nosso currículo, demos preferência a cursos no estilo MOOC (Massive Open Online Courses), porque esses foram criados tendo em mente o nosso próprio estilo de aprendizagem.

A Open Source Society

Esse curso foi montado pela Open Source Society, uma comunidade de estudantes de todos os níveis baseada em projetos. Lá, eles oferecem roteiros para graduações através de cursos online das melhores universidades do mundo sem custo algum.

Se Tornando um Estudante da OSS

Para oficialmente se inscrever nesse curso, você precisa criar um perfil em nossa aplicação web.

Como eu faço isso?

Basta criar uma conta no GitHub e fazer login com ela em nossa aplicação.

A intenção desse ambiente é oferecer aos nossos estudantes uma maneira de manter o registro do seu progresso, e também dar a possibilidade de mostrar seu progresso para outras pessoas através do seu perfil público.

Na aba "My progress", você pode editar o status dos cursos que está fazendo, e também adicionar os links dos seus projetos relevantes para cada.

Motivação e Preparação

Queremos deixar aqui dois links que podem mudar toda a diferença em sua jornada.

O primeiro é um video motivacional que mostra a história de um rapaz que topou participar do "MIT Challenge", onde ele aprendeu os 4 anos inteiros do currículo de Ciência da Computação do MIT através de cursos online em 1 ano.

MIT Challenge

O segundo é um curso que nos ensina as técnicas de aprendizado usados por experts na arte, música, literatura, matemática, ciência, esportes, e muitas outras disciplinas. Essas habilidades são fundamentais para ter sucesso nessa jornada.

Learning how to learn


Currículo

  • Álgebra Linear
  • Cálculo de Variáveis Únicas
  • Cálculo de Variáveis Múltiplas
  • Python
  • Probabilidade e Estatística em R
  • Introdução a Data Science
  • Machine Learning
  • Projeto

Álgebra Linear

Álgebra Linear — Da Fundação até as Fronteiras
Duração: 15 semanas
Esforço: 8 horas/semana
Aplicações da Álgebra Linear — Parte 1
Duração: 5 semanas
Esforço: 4 horas/semana
Aplicações da Álgebra Linear — Parte 2
Duração: 4 semanas
Esforço: 5 horas/semana

Cálculo de Variáveis Únicas

Cálculo 1A: Diferenciação
Duração: 13 semanas
Esforço: 6–10 horas/semana
Cálculo 1B: Integração
Duração: 13 semanas
Esforço:
5–10 horas/semana
Cálculo 1C: Sistemas coordenados e séries infinitas
Duração: 13 semanas
Esforço: 6–10 horas/semana

Cálculo de Variáveis Múltiplas

MIT OCW Cálculo de Variáveis Múltiplas
Duração: 15 semanas
Esforço: 8 horas/semana

Python

Introdução a Ciência da Computação e Programação com Python
Duração: 9 semanas
Esforço: 15 horas/semana
Introdução ao Pensamento Computacional e Data Science
Duração: 10 semanas
Esforço: 15 horas/semana
Introdução a Python para Data Science
Duração: 6 semanas
Esforço: 2-4 horas/semanas
Programando com Python para Data Science
Duração: 6 semanas
Esforço: 3–4 horas/semana

Probabilidade e Estatística com R

Introdução a Probabilidade
Duração: 16 semanas
Esforço: 12 horas/semana
Pensamento Estatístico
Introdução a Estatística: Estatística Descritiva
Duração: 5 semanas
Introdução a Estatística: Probabilidade
Duração: 5 semanas
Introdução a Estatística: Inferência
Duração: 5 semanas

Introdução a Data Science

Introdução a Data Science
Duração: 8 semanas
Esforço: 10–12 horas/semana
Data Science — CS109 de Harvard
Duração: 12 semanas
Esforço: 5–6 horas/semanas
A Ponta Analítica
Duração:
12 semanas
Esforço: 10–15 horas/semanas

Machine Learning

Aprendendo com Dados (Introdução a Machine Learning)
Duração: 10 semanas
Esforço: 10–20 horas/semana
Aprendizado Estatístico
Esforço: 3 horas/semana
Curso de Machine Learning de Stanford 
Esforço:
8/12 horas/semana

Projeto

Complete as competições para iniciantes e do playground no Kaggle


Especializações

Depois de terminar a lista acima, comece sua especialização no tópico que mais lhe chamou atenção.

Qual a ordem dos cursos?

Esse guia foi criado com uma lógica linear — ou seja, todos os cursos devem ser consumidos na ordem do currículo, um curso de cada vez.

Se um curso não estiver aberto para uma classe próxima, faça de qualquer maneira com o material da turma anterior.

Devo fazer todos os cursos?

Sim! A ideia é que você conclua todos os cursos dessa lista.

Duração do projeto

Fazer todos esses cursos pode tomar mais tempo do que uma formação tradicional de Data Science, mas lhe garanto: sua recompensa será proporcional a sua dedicação.

Você deve focar em seus hábitos e esquecer seu objetivo. Tente investir 1~2 horas por dia para estudar esse currículo. Se você conseguir isso, definitivamente vai chegar ao fim.

Qual linguagem de programação eu devo usar?

Python e R são as linguagens mais utilizadas para Data Science.

O importante é internalizar os conceitos principais, para que assim você possa utilizar qualquer linguagem de programação que você desejar.

Pré requisitos

A única coisa que você realmente precisa saber para iniciar é como usar Git e GitHub. Aqui estão alguns cursos para que você aprenda:

(Só um deles já é mais do que suficiente!)

Referências

Esse post é uma tradução do repositório do GitHub do curso de Data Science da OSS, criado por Shouvik Roy. Fique atento a página no repositório para atualizações no currículo.