Dados e Pipelines de Machine Learning em HealthData

Healthdata.ml
Nov 1 · 2 min read

Se está começando em Machine Learning em Healthdata, não há melhor forma de fazer senão buscando exemplos de como desenvolver um código em saúde de ponta-a-ponta.

Kaggle é o principal site de competições que disponibilizam dados e exemplos a partir das competições que já passaram por lá.

Um dos meios, senão o principal, é buscar competições (Kaggle) e seus exemplos (“notebooks/kernels”) nos quais foram disponibilizados dados para que consiga se debruçar no problema e realizar soluções usando algorítmos de Machine Learning.

Por meio de seus pipelines, passo-a-passo de desenvolvimento dos códigos, os desenvolvedores disponibilizam o que fizeram a partir das bases de dados, e sempre há exemplos para que você consiga aprender e praticar.

Vamos citar aqui alguns temas que você pode se interessar em colocar a mão na massa:

Exemplo (Pima Diabetes)

Se entrar no primeiro link, irá se deparar com a seguinte página:

Mais abaixo, você encontra a estrutura dos dados:

A partir deste ponto, pode buscar as informações sobre os dados:

Se for do interesse trabalhar em seu computador, pode baixar:

Trabalhar no próprio Kaggle pode vir a ser uma facilidade, mais acima, iniciando um novo notebook.

Por fim e mais importante, em Kernels, você encontra os exemplos de outras pessoas que fizeram soluções em cima desses dados:

Se você espera, a partir daqui, já começar o seu modelo, utilize os exemplos e mãos-a-obra!!

    Healthdata.ml

    Written by

    Ciência de Dados e Inovação Tecnológica na Saúde. http://healthdata.ml

    Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
    Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
    Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade