O que é Machine Learning?

Published in

blog do zouza

7 min readApr 25, 2022

--

Machine Learning ou Aprendizado de Máquina é um método de análise de dados que automatiza o desenvolvimento de modelos analíticos. Usando algoritmos que aprendem interativamente a partir de dados, o aprendizado de máquinas permite que os computadores encontrem insights ocultos sem serem explicitamente programados para procurar algo específico.

Inteligência Artificial — Uma breve história

Inteligência Artificial (IA) — é a inteligência similar à humana exibida por mecanismos ou software. Também é um campo…

medium.com

Aqui estão alguns exemplos amplamente divulgados de aplicações do Machine Learning com os quais você pode já estar familiarizado:

Os carros autônomos do Google que dirigem sozinhos? A essência do aprendizado de máquina.
Ofertas de recomendações on-line como as da Amazon e Netflix? Aplicações de aprendizado de máquina na vida cotidiana.
Saber o que os clientes estão dizendo sobre você no Twitter? Aprendizado de máquina combinado com a criação de regra linguística.
Detecção de fraudes? Um dos usos mais óbvios e importantes em nosso mundo de hoje.

Machine Learning esta contido em IA, Redes Neurais em Machine Learning e Deep Learning em Redes Neurais.

TIPOS DE ALGORITMOS

Supervisionados

São apresentadas ao computador exemplos de entradas e saídas desejadas, fornecidas por um “professor”. O objetivo é aprender uma regra geral que mapeia as entradas para as saídas.

Regressão Linear (Código Python)
Regressão Logística (Código R | Código Python)
Classificação Naïve Bayes (Código Python)
Árvores de Decisão (Código Python)
Random Forest (Código Python)
KNN — K-Nearest Neighbour (Código Python)
SVM — Support Vector Machine (Código Python)
Redes neurais (Código Python | Playground )
Deep Learning (Código Python)

Os algoritmos destacados em negrito tem o código fonte no final do artigo. :)

Não Supervisionados

Nenhum tipo de etiqueta é dado ao algoritmo de aprendizado, deixando-o sozinho para encontrar estrutura nas entradas fornecidas. O aprendizado não supervisionado pode ser um objetivo em si mesmo (descobrir novos padrões nos dados) ou um meio para atingir um fim

K-Means —Clustering - Algoritmos de Agrupamento (Código Python)
Análise de Componentes Principais (PCA)
Análise de componentes independentes
Redes neurais
Deep Learning

Semi-supervisionado

Em que o professor fornece um sinal de treinamento incompleto: um conjunto de dados de treinamento com algumas (muitas vezes várias) das saídas desejadas ausentes. A transdução é um caso especial deste princípio, em que o conjunto inteiro das instâncias do problema é conhecido no momento do aprendizado, mas com parte dos objetivos ausente.

Aprendizado por reforço

Um programa de computador interage com um ambiente dinâmico, em que o programa deve desempenhar determinado objetivo (por exemplo, dirigir um veículo). É fornecido, ao programa, feedback quanto a premiações e punições, na medida em que é navegado o espaço do problema. Outro exemplo de aprendizado por reforço é aprender a jogar um determinado jogo apenas jogando contra um oponente.

Um rede neural jogando Mário…

Outros (Em imagem)

https://www.datageeks.com.br/machine-learning/

Maiores detalhes em: Tipos de Aprendizado e mais aqui!

Evolução dos algoritmos

NLP

Natural Language Processing é um campo da Inteligência Artificial que dá às máquinas a capacidade de ler, entender e extrair significado das linguagens humanas.

About Natural Language Processing — NLP

O Processamento de Linguagem Natural ou do inglês NLP — Natural Language Processing é um campo de Inteligência…

medium.com

News Classification using Machine Learning (with code python)

Given the large amount of information generated in the world today, here we will focus on news…

medium.com

Código exemplo:

Cientista-de-Dados/NLP - Classificação de Notícias Curtas PTB at master ·…

Repositório de Projetos em Análises de Dados (buscando valor em dados!!!) - Cientista-de-Dados/NLP - Classificação de…

github.com

Visão Computacional

Visão computacional é um campo da inteligência artificial responsável pelo treinamento de computadores em busca da compreensão e interpretação do mundo visual. Isso ocorre através do deep learning com o uso de imagens que permitem às máquinas reagirem e tomarem decisão de acordo com o que elas enxergam.

A tecnologia avança em uma velocidade que muitas vezes não conseguimos acompanhar. Literalmente da noite para o dia, aquilo que se tinha como referência e uma certeza de inovação, pode ficar defasado e deixar de fazer sentido.

Repetir os gestos humanos e especialmente a forma como tomamos decisões é algo que a ciência constantemente busca.

Através do uso de software e hardware, isso é possível. E, a este sucesso, damos o nome de visão computacional.

Veja um exemplo de reconhecimento facial (em python):

Visão Computacional

Algoritmo passo a passo para reconhecimento de face

colab.research.google.com

Balanceamento de Carga

Explicando com um exemplo… situações onde o desbalanceamento é quase certo são problemas de detecção de fraude e diagnóstico médicos — é intuitivo pensar que existem mais transações lícitas que criminosas, ou que o conjunto de pessoas diagnosticadas com câncer é bem menor que o conjunto de pessoas sem a doença.

Ignorar esse fato e treinar um algoritmo em cima do conjunto de dados original, pulando uma etapa intermediária de balanceamento dos dados, pode ter impactos diretos no seu projeto de Data Science.

Classificação desbalanceada (Imbalanced Classification)

Esse é um problema enfrentado diariamente por profissionais da área de dados de uma forma geral, mas os profissionais…

blogdozouza.wordpress.com

Métricas

Ao construir um classificador usando machine learning, deve se perguntar o quão bom é seu modelo para predição. Assim, ao treinar um modelo de aprendizagem algumas métricas podem ser utilizadas para avaliação. A métrica utilizada para determinação do “melhor modelo” depende do problema analisado.

A precisão é o grau de variação gerado por diferentes medições. Dessa forma, quanto mais preciso um processo, menor será a variação entre os valores obtidos. Já a acurácia é uma espécie de soma entre exatidão e precisão. Ou seja, na acurácia, os resultados obtidos por uma experiência, por exemplo, não apenas podem ser precisos, mas também precisam estar perto do valor de referência ou valor real usado como base.

Métricas de Avaliação em Machine Learning: Classificação

Métricas escolhidas de forma incorreta para avaliação de modelos de machine learning podem afetar diretamente a tomada…

medium.com

Interpretando Modelos de Machine Learning

Uma introdução

medium.com

Trade-off entre a qualidade das predições e a interpretabilidade do modelo. (Fonte: Marcos Silva)

Fontes de dados para Estudo

Aqui, são relacionadas alguns fontes de dados que podem utilizar em seus estudos, realizarem seus testes de algoritmos e etc… são fontes de diversas áreas de atuação, confiram!

DATA SOURCES

Below, some data sources for studies and analysis, subdivided by categories:

medium.com

Projetos usando Machine Learning (Algoritmos)…

Confira alguns algoritmos passo a passo, bons estudos:

Seu primeiro Projeto de Machine Learning em Python (Passo a Passo)

Aqui você irá montar seu primeiro projeto de Machine Learning (Aprendizado de máquina) usando a linguagem Python. O que…

blogdozouza.wordpress.com

Algoritmo de Regressão Linear

Exemplo passo a passo

colab.research.google.com

Algoritmo de Regressão Logística em R

Exemplo passo a passo e documentação

colab.research.google.com

Algoritmos de Regressão Logística em Python

Exemplo passo a passo e matemática

colab.research.google.com

Algoritmo Naive Bayes em Python (dataset: detecção câncer)

Exemplo passo a passo para área de saúde

colab.research.google.com

Algoritmo de Árvore de Decisão (concessionária de carro)

Exemplo passo a passo, EAD, visualização da árvore…

colab.research.google.com

Algoritmo de Random Forest (Concessionária de carro)

Exemplo passo a passo, comparação com Árvore de decisão

colab.research.google.com

Algoritmo de Clusterização (K-Means)

Clusterização de Clientes — Exemplo passo a passo (gastos de clientes)

colab.research.google.com

Algoritmo de Clusterização (K-means)

Clusterização de Documento — Exemplo passo a passo

colab.research.google.com

Algoritmo KNN

Passo a passo do K-Nearest Neighbors

colab.research.google.com

Algoritmo SVM — Support Vector Machine

Passo a passo do funcionamento — Iris Dataset

colab.research.google.com

Deep — Learning com Google Colaboratory

Deep Learning para Classificação (Data Source: Iris e MNIST)

colab.research.google.com

News Classification using Machine Learning (with code python)

Given the large amount of information generated in the world today, here we will focus on news…

medium.com

K-DIJKSTRA4DOC: A representation and clustering of documents using directed graph

Regarding text mining problems, document clustering is a problem that consists of finding groups of documents, given a…

medium.com

Referências:

Mais sobre Ciência de Dados — acesse esse post, ele tem diversas informações bem detalhadas por tópico. (Aprendendo Data Science)
Scikit-Learn library

Obrigado pela leitura! Espero que tenha contribuído em algo no seu aprendizado!

Agradeço pela leitura e espero que tenha sido útil…

Obrigado! Antes de você ir:

· 👏 Deixe suas palmas o story e me siga para mais assuntos

· 📰 Vejam mais conteúdos como este Blog do Souza

· 📰🚀 Diariamente dicas rápidas sobre dados 👉Alex Souza

· 💰 Venham conhecer a Comunidade de Análise de Dados

· 🔔 Sigam: Twitter (X) | LinkedIn | Instagram | Youtube | mais…

O que é Machine Learning?

Inteligência Artificial — Uma breve história

Inteligência Artificial (IA) — é a inteligência similar à humana exibida por mecanismos ou software. Também é um campo…

TIPOS DE ALGORITMOS

Supervisionados

Não Supervisionados

Semi-supervisionado

Aprendizado por reforço

Outros (Em imagem)

Evolução dos algoritmos

NLP

About Natural Language Processing — NLP

O Processamento de Linguagem Natural ou do inglês NLP — Natural Language Processing é um campo de Inteligência…

News Classification using Machine Learning (with code python)

Given the large amount of information generated in the world today, here we will focus on news…

Código exemplo:

Cientista-de-Dados/NLP - Classificação de Notícias Curtas PTB at master ·…

Repositório de Projetos em Análises de Dados (buscando valor em dados!!!) - Cientista-de-Dados/NLP - Classificação de…

Visão Computacional

Visão Computacional

Algoritmo passo a passo para reconhecimento de face

Balanceamento de Carga

Classificação desbalanceada (Imbalanced Classification)

Esse é um problema enfrentado diariamente por profissionais da área de dados de uma forma geral, mas os profissionais…

Métricas

Métricas de Avaliação em Machine Learning: Classificação

Métricas escolhidas de forma incorreta para avaliação de modelos de machine learning podem afetar diretamente a tomada…

Interpretando Modelos de Machine Learning

Uma introdução

Fontes de dados para Estudo

DATA SOURCES

Below, some data sources for studies and analysis, subdivided by categories:

Projetos usando Machine Learning (Algoritmos)…

Seu primeiro Projeto de Machine Learning em Python (Passo a Passo)

Aqui você irá montar seu primeiro projeto de Machine Learning (Aprendizado de máquina) usando a linguagem Python. O que…

Algoritmo de Regressão Linear

Exemplo passo a passo

Algoritmo de Regressão Logística em R

Exemplo passo a passo e documentação

Algoritmos de Regressão Logística em Python

Exemplo passo a passo e matemática

Algoritmo Naive Bayes em Python (dataset: detecção câncer)

Exemplo passo a passo para área de saúde

Algoritmo de Árvore de Decisão (concessionária de carro)

Exemplo passo a passo, EAD, visualização da árvore…

Algoritmo de Random Forest (Concessionária de carro)

Exemplo passo a passo, comparação com Árvore de decisão

Algoritmo de Clusterização (K-Means)

Clusterização de Clientes — Exemplo passo a passo (gastos de clientes)

Algoritmo de Clusterização (K-means)

Clusterização de Documento — Exemplo passo a passo

Algoritmo KNN

Passo a passo do K-Nearest Neighbors

Algoritmo SVM — Support Vector Machine

Passo a passo do funcionamento — Iris Dataset

Deep — Learning com Google Colaboratory

Deep Learning para Classificação (Data Source: Iris e MNIST)

News Classification using Machine Learning (with code python)

Given the large amount of information generated in the world today, here we will focus on news…

K-DIJKSTRA4DOC: A representation and clustering of documents using directed graph

Regarding text mining problems, document clustering is a problem that consists of finding groups of documents, given a…

Referências:

Written by Alex Souza