Como Aprender Data Science de Graça nas Melhores Universidades do Mundo
Sobre
Esse post apresenta um caminho sólido para quem quer, sem custo algum, se formar em um curso de Data Science fazendo seu próprio horário, nas melhores universidades do mundo.
Em nosso currículo, demos preferência a cursos no estilo MOOC (Massive Open Online Courses), porque esses foram criados tendo em mente o nosso próprio estilo de aprendizagem.
A Open Source Society
Esse curso foi montado pela Open Source Society, uma comunidade de estudantes de todos os níveis baseada em projetos. Lá, eles oferecem roteiros para graduações através de cursos online das melhores universidades do mundo sem custo algum.
Se Tornando um Estudante da OSS
Para oficialmente se inscrever nesse curso, você precisa criar um perfil em nossa aplicação web.
Como eu faço isso?
Basta criar uma conta no GitHub e fazer login com ela em nossa aplicação.
A intenção desse ambiente é oferecer aos nossos estudantes uma maneira de manter o registro do seu progresso, e também dar a possibilidade de mostrar seu progresso para outras pessoas através do seu perfil público.
Na aba "My progress", você pode editar o status dos cursos que está fazendo, e também adicionar os links dos seus projetos relevantes para cada.
Motivação e Preparação
Queremos deixar aqui dois links que podem mudar toda a diferença em sua jornada.
O primeiro é um video motivacional que mostra a história de um rapaz que topou participar do "MIT Challenge", onde ele aprendeu os 4 anos inteiros do currículo de Ciência da Computação do MIT através de cursos online em 1 ano.
O segundo é um curso que nos ensina as técnicas de aprendizado usados por experts na arte, música, literatura, matemática, ciência, esportes, e muitas outras disciplinas. Essas habilidades são fundamentais para ter sucesso nessa jornada.
Currículo
- Álgebra Linear
- Cálculo de Variáveis Únicas
- Cálculo de Variáveis Múltiplas
- Python
- Probabilidade e Estatística em R
- Introdução a Data Science
- Machine Learning
- Projeto
Álgebra Linear
Álgebra Linear — Da Fundação até as Fronteiras
Duração: 15 semanas
Esforço: 8 horas/semanaAplicações da Álgebra Linear — Parte 1
Duração: 5 semanas
Esforço: 4 horas/semanaAplicações da Álgebra Linear — Parte 2
Duração: 4 semanas
Esforço: 5 horas/semana
Cálculo de Variáveis Únicas
Cálculo 1A: Diferenciação
Duração: 13 semanas
Esforço: 6–10 horas/semanaCálculo 1B: Integração
Duração: 13 semanas
Esforço: 5–10 horas/semanaCálculo 1C: Sistemas coordenados e séries infinitas
Duração: 13 semanas
Esforço: 6–10 horas/semana
Cálculo de Variáveis Múltiplas
MIT OCW Cálculo de Variáveis Múltiplas
Duração: 15 semanas
Esforço: 8 horas/semana
Python
Introdução a Ciência da Computação e Programação com Python
Duração: 9 semanas
Esforço: 15 horas/semanaIntrodução ao Pensamento Computacional e Data Science
Duração: 10 semanas
Esforço: 15 horas/semanaIntrodução a Python para Data Science
Duração: 6 semanas
Esforço: 2-4 horas/semanasProgramando com Python para Data Science
Duração: 6 semanas
Esforço: 3–4 horas/semana
Probabilidade e Estatística com R
Introdução a Probabilidade
Duração: 16 semanas
Esforço: 12 horas/semanaIntrodução a Estatística: Estatística Descritiva
Duração: 5 semanasIntrodução a Estatística: Probabilidade
Duração: 5 semanasIntrodução a Estatística: Inferência
Duração: 5 semanas
Introdução a Data Science
Introdução a Data Science
Duração: 8 semanas
Esforço: 10–12 horas/semanaData Science — CS109 de Harvard
Duração: 12 semanas
Esforço: 5–6 horas/semanasA Ponta Analítica
Duração: 12 semanas
Esforço: 10–15 horas/semanas
Machine Learning
Aprendendo com Dados (Introdução a Machine Learning)
Duração: 10 semanas
Esforço: 10–20 horas/semanaAprendizado Estatístico
Esforço: 3 horas/semanaCurso de Machine Learning de Stanford
Esforço: 8/12 horas/semana
Projeto
Complete as competições para iniciantes e do playground no Kaggle
Especializações
Depois de terminar a lista acima, comece sua especialização no tópico que mais lhe chamou atenção.
- Data Science
- Estatística com R
- Machine Learning
- Data Mining
- Data Science e Engenharia com Apache Spark XSeries
- Análise de Dados
- Engenharia Para Machine Learning
Qual a ordem dos cursos?
Esse guia foi criado com uma lógica linear — ou seja, todos os cursos devem ser consumidos na ordem do currículo, um curso de cada vez.
Se um curso não estiver aberto para uma classe próxima, faça de qualquer maneira com o material da turma anterior.
Devo fazer todos os cursos?
Sim! A ideia é que você conclua todos os cursos dessa lista.
Duração do projeto
Fazer todos esses cursos pode tomar mais tempo do que uma formação tradicional de Data Science, mas lhe garanto: sua recompensa será proporcional a sua dedicação.
Você deve focar em seus hábitos e esquecer seu objetivo. Tente investir 1~2 horas por dia para estudar esse currículo. Se você conseguir isso, definitivamente vai chegar ao fim.
Qual linguagem de programação eu devo usar?
Python e R são as linguagens mais utilizadas para Data Science.
O importante é internalizar os conceitos principais, para que assim você possa utilizar qualquer linguagem de programação que você desejar.
Pré requisitos
A única coisa que você realmente precisa saber para iniciar é como usar Git e GitHub. Aqui estão alguns cursos para que você aprenda:
(Só um deles já é mais do que suficiente!)
- Try git
- Git — the simple guide
- GitHub Training and Guides
- GitHub Hello World
- Git Immersion
- How to Use Git and GitHub
Referências
Esse post é uma tradução do repositório do GitHub do curso de Data Science da OSS, criado por Shouvik Roy. Fique atento a página no repositório para atualizações no currículo.