7 livros super hiper ultra indicados para começar do zero e se tornar um especialista em Machine Learning

Renata Galdino
9 min readFeb 2, 2019

--

Conheça livros que te levam do nível básico ao avançado, alguns disponíveis gratuitamente online 🙌

Robot reading

A leitura de ótimos livros é primordial para continuarmos nosso processo de evolução, tanto como seres humanos como profissionais.

Sabemos que apenas uma pequena fração de pessoas se torna especialista em seu campo de atuação. Os demais alcançam somente um nível de conhecimento funcional. Então, o que um especialista faz melhor que os outros? Maior inteligência? Influência de fatores ambientais? Maior dedicação?

Provavelmente é a dedicação, embora alguns especialistas sejam genuinamente gênios. Para os simples mortais, a base para se tornar um expert é ler/praticar mais do que qualquer outra pessoa sobre o assunto. Se você ler sobre um tema uma hora por dia útil por 10 anos, essas mais de 2000 horas de leitura te levarão a um longo caminho para se tornar o cara!

Assim, este post tem como objetivo te mostrar alguns livros que li ao longo dos últimos anos e pude aplicar nos meus projetos e que, certamente vão te ajudar.

Essa lista é pessoal e tem como referência o uso que fiz nos projetos por mim desenvolvidos e nas MUITAS (mas muitas) páginas resgatadas do meu caderninho de anotações 😜. Caso tenha algum livro que queiram mencionar, fiquem à vontade, ok?

Certamente essa lista não é exaustiva e há outras excelentes opções para estudo. Espero que eu possa colaborar com seu crescimento profissional! Tenha uma excelente leitura!

1. Introduction to Machine Learning with Python: A Guide for Data Scientists — Andreas C. Muller, Sarah Guido

Nível de conhecimento requerido: Em Machine learning não requer conhecimento anterior. O livro utiliza Python e dá uma breve explicação dos pacotes utilizados (Numpy, Pandas, Matplotlib e Scikit-learn etc.) mas precisa de um conhecimento prévio na ferramenta.

Introduction to Machine Learning with Python: A Guide for Data Scientists

Muito bem escrito, sendo um bom livro para iniciar no aprendizado de ML. Parte conceitual bem didática, mas sem focar em fundamentos matemáticos ou de computação. Possui muitos modelos de visualização, em vez de focar só em códigos Python.

Trata-se de um livro bem introdutório mesmo, que passa pelos principais tipos de aprendizado (supervisionado e não supervisionado), tratamento de dados e seleção de atributos e avaliação e melhoria de modelos. Também tem um tópico bem interessante sobre text mining.

Disponível na Amazon.

2. Machine Learning with R — Brett Lantz

Nível de conhecimento requerido: Básico

Machine Learning with R

Excelente tutorial de quase 400 páginas para quem está começando a estudar os conceitos de aprendizado de máquina em R. Considero esse um dos livros mais didáticos que li até o momento. Contém todo o passo a passo desde pré-processamento até a avaliação de performance no final.

Possui um capítulo introdutório sobre Machine learning e R, passos para aplicar metodologias de ML nos dados utilizados, e como instalar o R.

Também possui um capítulo beeeeem consistente de exploração, entendimento e visualização dos dados, tanto numéricos quanto categóricos (pra mim, a etapa mais importante).

Além disso, possui três capítulos dedicados aos problemas de classificação usando:

  • Algoritmo kNN (Nearest Neighboorhood) para detecção de câncer de mama;
  • Algoritmo de Naive Bayes para detecção de spam;
  • Árvores de decisão para detecção de riscos em empréstimos bancários.

Um dos melhores livros para quem está começando a estudar sobre o assunto (e para os fãs de R).

Disponível gratuitamente no site do Packtpub.

Disponível também na Amazon.

3 . The Hundred-Page Machine Learning Book — Andriy Burkov

Nível de conhecimento requerido: Básico (mas não pode ter medo de matemática 🤯🤯🤯 )

The Hundred-Page Machine Learning Book

O livro já começa polêmico, dizendo que máquinas não aprendem 😱😱😱 e que esse nome (Machine Learning) não passa de uma estratégia de marketing de uma grande empresa de tecnologia para atrair clientes e talentos.

E a analogia utilizada até que faz sentido pois ele diz que se um usuário (humano, no caso) aprende a jogar videogame olhando diretamente para uma tela, também seria um bom jogador se a tela fosse ligeiramente virada. No caso de uma máquina, isso não aconteceria porque se algoritmo fosse treinado “olhando diretamente” para a tela, não conseguiria jogar caso ocorresse uma mudança de sentido da tela. 🤯🤯🤯

Se você gosta de colocar a mão na massa em Python ou R, esse não é o livro pra você. Entretanto, é simplesmente impressionante e encantador como o autor consegue explicar todos os conceitos técnicos e matemáticos de uma forma tão organizada, didática e concisa.

Se você tem medo de matemática e conceitos muito técnicos (muitas pessoas têm verdadeiro pânico do assunto), sugiro que leia livros que te deixem mais à vontade antes de começar a mexer com algoritmos de aprendizado de máquina. Não será impossível aprender ML mas a explicação de determinados conceitos ficará bem limitada em alguns casos.

O autor disponibilizou uma versão online no modelo leia agora, compre depois, no site do livro (http://themlbook.com).

Também disponível na Amazon.

4. Practical Machine Learning with Python — Dipanjan Sarkar, Tushar Sharma, Raghav Bali

Nível de conhecimento requerido: Básico

Practical Machine Learning with Python

Outro livro fantástico sobre o assunto! São 12 capítulos divididos em 3 partes: Parte I — Conceitos de Machine Learning, Parte II — Pipeline de Machine Learning, Parte III — Estudos de caso reais.

Na primeira parte entra em importantes conceitos, incluindo matemática, estatística, data mining e inteligência artificial. Possui uma parte introdutória de aproximadamente 100 páginas com principais aspectos relacionados à pacotes, módulos, metodologias e formas de utilização.

A parte II, Pipeline de Machine Learning, foca em tratamentos das bases de dados, seleção de atributos, desenvolvimento, validação e interpretação de modelos.

Na parte III, de estudos de caso reais, os autores dedicam 6 capítulos à aplicação, do início ao fim, das metodologias estudadas nas 2 partes anteriores, contendo exemplos, tais como: análise de tendências em compartilhamento de bicicletas, análise de sentimentos em críticas de filmes, segmentação de clientes, tipos e qualidade de vinho, tendências e recomendações musicais e previsão de preços de ações e commodities.

Um dos meus livros favoritos!

Disponível na Amazon.

5. Building Machine Learning Systems with Python — Willi Richert,‎ Luis Pedro Coelho

Nível de conhecimento requerido: Intermediário

Building Machine Learning Systems with Python

Livro interessante, bem prático e com aplicações reais e bastante foco em problemas de classificação e text mining.

Tem um capitulo introdutório sobre uso e instalação do Python, assim como NumPy, SciPy e Matplot e também traz uma aplicação rápida com todos os passos de modelagem (leitura, pré-processamento e limpeza de dados, escolha do modelo, treinamento e teste).

Por ser um livro com foco em aplicação prática, requer um conhecimento básico de Python (funções, loops, manipulação de matrizes, arrays e listas, gráficos) e determinados conceitos técnicos de modelagem (regressão logística, k-means, validação cruzada, Support Vector Machines, feature selection, precisão, recall, AUC). Quem não tem esse conhecimento, melhor começar por outro livro.

Uma maravilha pra quem tem interesse em problemas de classificação (muuuuuitos exemplos), cluster, análise de sentimentos, regressão e processamento de texto.

Com relação a este último tópico, os autores realizam uma análise de cluster com dados do twitter, incluindo toda a fase de pré-processamento (conversão em bag of words, contagem de palavras, normalização do vetor de contagem de palavras, remoção de palavras não relevantes e steeming). Trata-se de um grande tutorial de Machine Learning em 14 capítulos.

Disponível gratuitamente no site do Packtpub.

Também disponível na Amazon.

6. Python Machine Learning — Second Edition — Sebastian Raschka, Vahid Mirjalili

Nível de conhecimento requerido: Intermediário. Requer conhecimentos matemáticos (funções, matrizes, somatórios, modelos matemáticos, cálculo, estatística básica).

Python Machine Learning

Uaaaauuu, que livro! São 16 capítulos muito bem escritos, com excelente conceituação de tópicos de aprendizado supervisionado, não supervisionado e por esforço. Os códigos em Python também são muito bem detalhados e explicados.

Foca tanto em conceitos matemáticos como em aspectos práticos e é bem detalhado em ambos.

Já no início do livro, treina algoritmos de aprendizado de máquina para classificação, usando perceptron e Adaline.

Possui um capítulo bem interessante de construção de bons conjuntos de treinamento (pré-processamento de dados), com tratamento de missings e dados categóricos para utilização em algoritmos de ML, normalização de atributos e seleção de atributos relevantes para construção do modelo.

Um dos capítulos mais legais, e as vezes pouco aprofundado em livros, é o capítulo 6, “Aprendendo as Melhores Práticas para Avaliação de Modelos e Ajuste de Hiperparâmetros”, no qual são abordados assuntos como overfitting e underfitting no processo de validação, matriz de confusão, curva ROC e tratamento de dados desbalanceados.

Além disso, tem uma seção bem interessante sobre análise de sentimentos na base de filmes do IMDb no capítulo 8, com todas as etapas desde limpeza e preparação dos dados de texto, construção dos vetores e treinamento de ML para classificar as críticas positivas e negativas.

Para quem curte Deep Learning, o livro possui 5 capítulos de implementação de redes neurais com Tensorflow.

Acesso muitos livros por meio de assinatura do Packtpub (super recomendo) mas confesso que tive até vontade de comprar uma cópia física desse livro de tão bom que é.

Resumindo, uma excelente combinação entre teoria e prática.

Disponível no site do Packtpub.

Também disponível na Amazon.

7 . Hands-On Machine Learning with Scikit-Learn and TensorFlow — Aurélien Géron

Nível de conhecimento requerido: Em Machine learning não requer conhecimento anterior. Nesse ponto é bem didático. Em Python, já é requerido um conhecimento intermediário pois faz uso das principais bibliotecas (Numpy, Pandas, Matplotlib e Scikit-learn, claro).

Hands-On Machine Learning with Scikit-Learn and TensorFlow

Livro bem completo, quase 600 páginas com conteúdo dividido em 2 partes: Parte 1 — Fundamentos de Machine Learning (com Scikit-learn) e Parte 2 — Redes Neurais e Deep Learning com Tensorflow.

Para quem quer colocar a mão na massa, esse é o livro! Suuuuuuuper prático! Vai explicando os conceitos na prática (sem muita matemática envolvida), como se cada assunto fosse um miniprojeto.

Outra parte interessante são os exercícios de fixação ao final de cada capítulo.

A parte II é majoritariamente focada em redes neurais e suas derivadas (Deep Neural Nets, Convolutional Neural Networks, Recurrent Neural Networks), o que também é bem interessante mas um pouco mais complexo.

Disponível na Amazon.

Resumindo: Qualquer um dos livros acima vai te ajudar consideravelmente no seu processo de aprendizado. Recomendo fortemente ler dois ou três deles, pois alguns aspectos não abordados (ou abordagem superficialmente) em um determinado livro, certamente aparecem em outro de forma conceitual ou prática.

O importante é ler sempre e dar continuidade aos estudos!!! Como diria o mestre Warren Buffett:

Não precisamos ser mais inteligentes que os outros; precisamos ser mais disciplinados que os outros.

Todos os livros acima estão em inglês e disponíveis na Amazon ou no Packtpub (links acima).

Para quem tem dificuldade no idioma, aguarde: Em breve, darei início a Liga Machine Learning aqui no Medium.

E aí, vocês já leram os livros acima? Possuem outras sugestões? Mandem seus comentários!

Gostou? Clique nos aplausos — eles vão de 1 a 50 — e deixe o seu comentário!❤

Nos siga no Facebook, Instagram e no nosso Site.

--

--

Renata Galdino

Responsável pelo blog Seshat Analytics (www.seshatanalytics.com.br) com objetivo de promover o uso de técnicas avançadas de Data Science, Machine Learning e AI.