O que é Machine Learning?
Machine Learning ou Aprendizado de Máquina é um método de análise de dados que automatiza o desenvolvimento de modelos analíticos. Usando algoritmos que aprendem interativamente a partir de dados, o aprendizado de máquinas permite que os computadores encontrem insights ocultos sem serem explicitamente programados para procurar algo específico.
Aqui estão alguns exemplos amplamente divulgados de aplicações do Machine Learning com os quais você pode já estar familiarizado:
- Os carros autônomos do Google que dirigem sozinhos? A essência do aprendizado de máquina.
- Ofertas de recomendações on-line como as da Amazon e Netflix? Aplicações de aprendizado de máquina na vida cotidiana.
- Saber o que os clientes estão dizendo sobre você no Twitter? Aprendizado de máquina combinado com a criação de regra linguística.
- Detecção de fraudes? Um dos usos mais óbvios e importantes em nosso mundo de hoje.
TIPOS DE ALGORITMOS
Supervisionados
São apresentadas ao computador exemplos de entradas e saídas desejadas, fornecidas por um “professor”. O objetivo é aprender uma regra geral que mapeia as entradas para as saídas.
- Regressão Linear (Código Python)
- Regressão Logística (Código R | Código Python)
- Classificação Naïve Bayes (Código Python)
- Árvores de Decisão (Código Python)
- Random Forest (Código Python)
- KNN — K-Nearest Neighbour (Código Python)
- SVM — Support Vector Machine (Código Python)
- Redes neurais (Código Python | Playground )
- Deep Learning (Código Python)
Os algoritmos destacados em negrito tem o código fonte no final do artigo. :)
Não Supervisionados
Nenhum tipo de etiqueta é dado ao algoritmo de aprendizado, deixando-o sozinho para encontrar estrutura nas entradas fornecidas. O aprendizado não supervisionado pode ser um objetivo em si mesmo (descobrir novos padrões nos dados) ou um meio para atingir um fim
- K-Means —Clustering - Algoritmos de Agrupamento (Código Python)
- Análise de Componentes Principais (PCA)
- Análise de componentes independentes
- Redes neurais
- Deep Learning
Semi-supervisionado
Em que o professor fornece um sinal de treinamento incompleto: um conjunto de dados de treinamento com algumas (muitas vezes várias) das saídas desejadas ausentes. A transdução é um caso especial deste princípio, em que o conjunto inteiro das instâncias do problema é conhecido no momento do aprendizado, mas com parte dos objetivos ausente.
Aprendizado por reforço
Um programa de computador interage com um ambiente dinâmico, em que o programa deve desempenhar determinado objetivo (por exemplo, dirigir um veículo). É fornecido, ao programa, feedback quanto a premiações e punições, na medida em que é navegado o espaço do problema. Outro exemplo de aprendizado por reforço é aprender a jogar um determinado jogo apenas jogando contra um oponente.
Outros (Em imagem)
Maiores detalhes em: Tipos de Aprendizado e mais aqui!
Evolução dos algoritmos
NLP
Natural Language Processing é um campo da Inteligência Artificial que dá às máquinas a capacidade de ler, entender e extrair significado das linguagens humanas.
Código exemplo:
Visão Computacional
Visão computacional é um campo da inteligência artificial responsável pelo treinamento de computadores em busca da compreensão e interpretação do mundo visual. Isso ocorre através do deep learning com o uso de imagens que permitem às máquinas reagirem e tomarem decisão de acordo com o que elas enxergam.
A tecnologia avança em uma velocidade que muitas vezes não conseguimos acompanhar. Literalmente da noite para o dia, aquilo que se tinha como referência e uma certeza de inovação, pode ficar defasado e deixar de fazer sentido.
Repetir os gestos humanos e especialmente a forma como tomamos decisões é algo que a ciência constantemente busca.
Através do uso de software e hardware, isso é possível. E, a este sucesso, damos o nome de visão computacional.
Veja um exemplo de reconhecimento facial (em python):
Balanceamento de Carga
Explicando com um exemplo… situações onde o desbalanceamento é quase certo são problemas de detecção de fraude e diagnóstico médicos — é intuitivo pensar que existem mais transações lícitas que criminosas, ou que o conjunto de pessoas diagnosticadas com câncer é bem menor que o conjunto de pessoas sem a doença.
Ignorar esse fato e treinar um algoritmo em cima do conjunto de dados original, pulando uma etapa intermediária de balanceamento dos dados, pode ter impactos diretos no seu projeto de Data Science.
Métricas
Ao construir um classificador usando machine learning, deve se perguntar o quão bom é seu modelo para predição. Assim, ao treinar um modelo de aprendizagem algumas métricas podem ser utilizadas para avaliação. A métrica utilizada para determinação do “melhor modelo” depende do problema analisado.
- Precision
- Recall
- F1-score
- Acurácia
- Validação cruzada
- Curva Roc
- Avaliação do Modelo de Classificação
- …
Fontes de dados para Estudo
Aqui, são relacionadas alguns fontes de dados que podem utilizar em seus estudos, realizarem seus testes de algoritmos e etc… são fontes de diversas áreas de atuação, confiram!
Projetos usando Machine Learning (Algoritmos)…
Confira alguns algoritmos passo a passo, bons estudos:
Referências:
- Mais sobre Ciência de Dados — acesse esse post, ele tem diversas informações bem detalhadas por tópico. (Aprendendo Data Science)
- Scikit-Learn library
Agradeço pela leitura e espero que tenha sido útil…
Obrigado! Antes de você ir:
· 👏 Deixe suas palmas o story e me siga para mais assuntos
· 📰 Vejam mais conteúdos como este Blog do Souza
· 📰🚀 Diariamente dicas rápidas sobre dados 👉Alex Souza
· 💰 Venham conhecer a Comunidade de Análise de Dados
· 🔔 Sigam: Twitter (X) | LinkedIn | Instagram | Youtube | mais…