Dados e Pipelines de Machine Learning em HealthData
Se está começando em Machine Learning em Healthdata, não há melhor forma de fazer senão buscando exemplos de como desenvolver um código em saúde de ponta-a-ponta.
Um dos meios, senão o principal, é buscar competições (Kaggle) e seus exemplos (“notebooks/kernels”) nos quais foram disponibilizados dados para que consiga se debruçar no problema e realizar soluções usando algorítmos de Machine Learning.
Por meio de seus pipelines, passo-a-passo de desenvolvimento dos códigos, os desenvolvedores disponibilizam o que fizeram a partir das bases de dados, e sempre há exemplos para que você consiga aprender e praticar.
Vamos citar aqui alguns temas que você pode se interessar em colocar a mão na massa:
Exemplo (Pima Diabetes)
Se entrar no primeiro link, irá se deparar com a seguinte página:

Mais abaixo, você encontra a estrutura dos dados:

A partir deste ponto, pode buscar as informações sobre os dados:

Se for do interesse trabalhar em seu computador, pode baixar:

Trabalhar no próprio Kaggle pode vir a ser uma facilidade, mais acima, iniciando um novo notebook.
Por fim e mais importante, em Kernels, você encontra os exemplos de outras pessoas que fizeram soluções em cima desses dados:

Se você espera, a partir daqui, já começar o seu modelo, utilize os exemplos e mãos-a-obra!!
