Melhores algoritmos para cada tipo de dado na saúde

Matheus Coradini
dadosesaude
Published in
2 min readDec 12, 2020

Se você acompanha a Dados e Saúde há um tempo já deve ter visto o post que fizemos dos Tipos de Dados na saúde, estruturados e não estruturados, imagens, textos e sons… Nesse post vamos trazer um pouco de quais são os melhores algoritmos para cada tipo de dado!

Dados Estruturados (Classificação e Regressão) = XGBoost

Muito famoso por causa das competições do Kaggle, o XGBoost possui versões para classificação e regressão e tem se mostrado muito eficiente em problemas de dados estruturados. Pode ser visto como a evolução dos algoritmos de Gradient Boosting, que, por sua vez, são algoritmos de árvore que são otimizados por funções de gradiente descendente.

Dados Não Estruturados

Imagem = CNN

As redes neurais convolucionais revolucionaram a forma como criamos algoritmos que lidam com imagens. Suas camadas específicas para dados matriciais, como as convoluções e pooling layers, conseguem extrair características da imagem com muito menos poder computacional que as redes neurais artificiais, mais tradicionais.

Time series = LSTM

As redes neurais recorrentes do tipo “Long short-term memory” têm performado muito bem com dados sequenciais (como time series e áudios), principalmente por suas conexões “feedback”. Este tipo de conexão permite que o algoritmo não avalie um dado de cada vez, separadamente, mas sim o seu relacionamento com os pontos que vêm antes e depois do mesmo, característica clara de dados sequenciais.

NLP = BERT

É hoje o algoritmo de maior destaque na resolução de problemas de Processamento de Linguagem Natural. Desenvolvido pelo Google, o BERT transforma com muita eficiência o texto em informação compreensível para computadores e redes neurais. Existem diversas versões na internet que podem ser facilmente baixadas e utilizadas.

--

--