Machine Learning Beyond Deep Learning: A Motivação

Raphael Campos
Machine Learning Beyond Deep Learning
2 min readNov 28, 2017

Recentemente, iniciou-se um enorme hype ao redor de aprendizado de máquina (a.k.a., machine learning), sobretudo em torno de um de seus subcampos, o deep learning. É um fato indiscutível que deep learning é uma das técnicas de aprendizado de máquina mais eficazes para resolver vários problemas práticos, tais como tradução automática, reconhecimento de objetos em imagens e text-to-speech, só para citar alguns, alcançando resultados iguais, ou até mesmo superiores, aos de humanos.

Por conta desse alvoroço no entorno dessa tecnologia, muitos iniciantes cometem o erro, a meu ver, de iniciar o aprendizado ou mesmo a aplicação de aprendizado de máquina por essa técnica, muitas vezes, achando que há uma “bala de prata” para resolver todos os problemas (para não dizer mágica), porém, ainda não conseguimos chegar no algoritmo universal de aprendizado (acho que estamos um pouquinho longe disso). Todavia, é muito importante estarmos cientes das limitações de cada técnica e que there is no free lunch, para que não nos frustremos no processo de aprendizado e aplicação dessas tecnologias.

Na última semana, o kaggle publicou um artigo divulgando resultados de uma pesquisa, feita com vários cientistas de dados e usuários de sua plataforma, que tinha como objetivo levantar dados sobre a situação atual da ciência de dados e aprendizado de máquina na indústria. Um dos levantamentos foi sobre quais são as técnicas de aprendizado de máquina mais utilizadas na indústria (mostrado no gráfico abaixo).

Técnicas mais utilizadas por cientistas de dados no trabalho (fonte: https://www.kaggle.com/surveys/2017).

Como pode-se notar, as técnicas de aprendizado profundo (CNN, RNN, GAN) estão longe de figurar as técnicas mais utilizadas na prática. Esse resultado mostra a importância de conhecer outras técnicas e ramos do aprendizado de máquina e inteligência artificial, além do deep learning.

Pensando nisso, eu resolvi começar a publicar conteúdo mostrando o mundo do aprendizado de máquina além do deep learning. Isso não quer dizer que não falarei de deep learning! Mas que vou iniciar por outras técnicas que não estão tanto no holofote da mídia, mas que tem um grande valor para ciência de dados e aprendizado de máquina.

Obviamente irei iniciar as postagens pelos métodos que tenho uma expertise maior, são eles o métodos baseados em Árvores de Decisão (ela mesma, Random Forests, Gradient Boosted Machines) e, em seguida, irei continuar na ordem dos mais utilizados até o menos de acordo com a pesquisa do Kaggle.

Meus objetivos com essa série de publicações são:

  • Disponibilizar um material de qualidade sobre Aprendizado de Máquina em português
  • Consolidar meu conhecimento sobre Aprendizado de Máquina (ensinar e compartilhar é a melhor forma para isso)
  • E, claro, mostrar um mundo além do deep learning

Espero que o material seja proveitoso!

Vamos lá para primeira publicação? Árvores de Decisão

--

--