10 Cursos de Data Science do Kaggle gratuitos para iniciantes

Aprenda ciência de dados passo a passo por meio de exercícios rápidos, em uma plataforma líder em competições de Machine learning.

Jonys Arcanjo
Data Hackers
5 min readJul 12, 2021

--

Photo by Ben Write — https://unsplash.com/

Atualmente temos uma grande oferta de cursos voltados para Data Science sejam eles gratuitos ou não, e o problema que surgi aqui é como escolher o melhor entres eles, ou até mesmo como escolher um bom curso? Uma dica é procurar o instituições que estão na vanguarda este segmento como é o caso do Kaggle.

O que é o Kaggle?

Segundo a Wikipédia o Kaggle , uma subsidiária da Google LLC , é uma comunidade online de cientistas de dados e profissionais de aprendizado de máquina . O Kaggle permite que os usuários encontrem e publiquem conjuntos de dados, explorem e construam modelos em um ambiente de ciência de dados baseado na web, onde permite que trabalhem com outros cientistas de dados e engenheiros de aprendizado de máquina e participem de competições para resolver desafios de ciência de dados.

Photo by Kaggle.com

Porque você deveria fazer este cursos?

Estes cursos foram criados por lideres na área de ciência de dados, na trilha de aprendizagem temos cursos de diferente niveis de dificuldade, mas a cada um deles tem o objetivo criar uma fundamentação sólida para o profissional de Data science.

Não estou dizendo que isso é tudo que você precisa para se tornar um cientista de dados, mas é um excelente começo.

Photo by Kaggle.com

Adquira as habilidades necessárias para realizar projetos independentes de ciência de dados. Nós reduzimos tópicos complexos a seus principais componentes práticos, para que você ganhe habilidades utilizáveis em algumas horas (em vez de semanas ou meses).

Quais são os cursos disponíveis?

Photo by Kaggle.com

Neste link, você pode achar os cursos abaixo e muito mais! Vamos para lista que levantei para iniciantes:

[1] Curso básico de Python e como bonus é oferecido o famoso tutorial do Titanic onde você poderá fazer sua primeira submissão em uma competição do kaggle.

[2] Introdução a Machine Learning onde você poderá aprender como os modelos trabalham, um pouco sobre análise exploratória de dados, construirá seu primeiro modelo de machine learning, aprenderá sobre métricas de validação, conceitos como Underfitting and Overfitting.

[3] Intermediate Machine Learning você aprenderá sobre valores ausentes, variaveis categorias, Pipelines, cross- validation, XGboost e Data Leakage (vazamento de dados).

[4] Pandas este curso sobre aprenderá como manipular de dados de forma rápida, poderosa, flexível e fácil de usar, está biblioteca foi construída sobre a linguagem de programação Python .

[5] Data Visualization este curso você aprenderá a criar visualizações rápidas utilizando a biblioteca Seaborn e aprenderá o necessário sobre a utilização de gráficos como Line charts, scatterplots, distribuição, e também como realizar algumas customizações em seus gráficos.

[6] Feature Engineering este curso é importante porque no dia a dia do cientista de dados os datasets não chegam perfeitos para você incluir no modelo, isso siginifica que você terá que criar novas variáveis a partir das variáveis existentes, e para isso é de suma importante conhecer as tecnicas envolvidas no desenvolvimento da engenharia de recursos.

[7] Data Cleaning aqui você aprenderá a realizar a limpeza do seu conjunto de dados aprendendo como lidar com a valores ausentes, remover informações duplicadas ou irrelevantes, filtrar outliers indesejados, assim como aplicar dimensionamento e normalização.

[8] Introdução a SQL aqui você aprenderá a trabalhar com banco de dados usando o Google BigQuery.

[9] SQL avançado este curso você poderá desenvolver as habilidades aprendidas no curso de introdução ao SQL.

[10] Introdução à ética de IA o motivo pelo qual coloquei este curso entre os 10 mais melhores cursos para iniciantes em ciências de dados é porque ele que faz pensar nos resultados e impactos que os seus modelos podem criar na sociedade de forma geral. A ética procura resolver questões como a moralidade humana, temos que está cientes que como profissional de ciência de dados ou em qualquer ou área temos que promover equidade, mininuindo o racismo, a diferenças de gêneros, entre ricos e pobres, não podemos passar para os nossos modelos os preconceitos que nos carregamos como indivíduos.

Esperado que tenha gostado da lista de cursos mencionado acima, “ACREDITE” eles farão a direfença no seu aprendizado.

Ops… Ao concluir um curso no Kaggle você terá direto a um certificado e poderá incluir no seu Linkedin.

Photo by Kaggle.com

Além dos cursos, como o Kaggle pode agregar no meu aprendizado?

Photo by Kaggle.com

O kaggle tem uma comunidade vibrante com mais de 6 milhões de membros, que compartilham conhecimento para todos os níveis de aprendizado, com uma das maiores de variedade de conjuntos de dados para que você possa treinar ver também ver como outras pessoas resolveram um problema parecido com o seu. Dito isso, não vejo motivo para você ficar de fora dessa.

Bem, é isso. Se você gostou deste post, um pouco de motivação extra será útil, dando-lhe algumas palmas 👏. Estou sempre aberto a suas perguntas e sugestões. Você pode compartilhar isso no Facebook, Twitter, Linkedin, para que este post possa vir a ser útil para outras pessoas.

Você pode me contatar em:

Linkedin

Github

Referências

[1]Kaggle.com

--

--