Machine Learning — O que é, tipos de aprendizagem de máquina, algoritmos e aplicações

Camila Waltrick
Camila Waltrick
Published in
6 min readMay 7, 2020

--

Machine Learning: O que é, tipos de aprendizagem de máquina, algoritmos e aplicações
Photo by Franck V. on Unsplash

Nessa publicação, você vai encontrar uma introdução sobre Machine Learning, abordando o que é Machine Learning, quais são os tipos de aprendizagem de máquina existentes, seus algoritmos e alguns exemplos de aplicação deles na prática;

O que é Machine Learning?

Para começar, é interessante a gente retomar como funciona a jornada de descoberta do conhecimento, através dos dados.

Processos que compõem a jornada de descoberta do conhecimento através de dados.
Jornada de descoberta do conhecimento a partir de um input de dados.

Conforme a imagem acima, temos na parte superior as etapas do processo e, na parte inferior, as saídas de cada um desses processos, ou seja, os resultados deles.

É, na quarta etapa, chamada de Mineração de Dados que, entre outros procedimentos aplicáveis, iremos nos deparar com o uso do aprendizado de máquina — ou aprendizagem de máquina, como preferir.

Classifica-se a aprendizagem de máquina como uma ramificação da Inteligência Artificial que, por sua vez, é uma das áreas da Ciência da Computação. De modo geral, Machine Learning (ML) é uma automatização de modelos analíticos, a qual permite a criação de modelos que analisam conjuntos de dados e aprendem a reconhecer padrões/realizar predições; ML é baseada na aplicação de algoritmos que dão aos modelos a capacidade de identificação e/ou predição, a depender do tipo de aprendizado envolvido na aplicação.

Os algoritmos de aprendizado de máquina foram inspirados no processo de aprendizado humano, eles aprendem de modo iterativo com os dados e permitem que o sistema encontre informações ocultas nesses dados. Assim sendo, podemos dizer que o aprendizado de máquina segue o mesmo processo que uma criança de 4 anos usa para aprender, entender e diferenciar o que quer que seja.

Aplicando Machine Learning é possível produzir, de modo rápido e automático, modelos capazes de analisar maiores volumes de dados — até os mais complexos, e ainda entregar resultados com maior rapidez e precisão, mesmo em grande escala.

Desta forma, ao construir modelos precisos, uma organização, por exemplo, tem mais chances de identificar oportunidades lucrativas — ou de evitar riscos desconhecidos.

Tipos de aprendizagem de máquina

  • 1️⃣ Aprendizagem supervisionada;
  • 2️⃣ Aprendizagem não supervisionada;
  • 3️⃣ Aprendizagem por reforço.

Vamos conhecer um pouco mais sobre cada uma:

1️⃣ Aprendizagem supervisionada

No aprendizado supervisionado, o modelo será, literalmente, ser ensinado sobre o que deve ser feito. Explico: será fornecido um conjunto de dados rotulados para o nosso modelo aprender o que é cada classe/categoria e esses dados serão particionados entre porções para treinamento e teste — devo escrever esse assunto em outro post, por hora, foco nesse overview! 😅

Esse tipo de aprendizado é, geralmente, aplicado quando o objetivo é prever ocorrências futuras. Além disso, é subdividido entre as técnicas de classificação e regressão, as quais possuem características diferentes que devem ser observadas na estruturação do seu modelo de predição.

Exemplo gráfico de classificação, um dos métodos de aprendizagem supervisionada em Machine Learning.

👉🏾 Classificação: é o método de predição de uma classe discreta ou categoria. Por exemplo, imagine que seu algoritmo já aprendeu as características que definem os seguintes tipos de automóveis: sedan, hatch e SUV. Se você apresentar um Volkswagen Up para esse algoritmo, ele vai saber classificá-lo como um hatch, visto que ele já aprendeu com os rótulos, anteriormente mostrados para ele. Alguns algoritmos de classificação: KNN, Árvores de Decisão, SVM e Regressão Logística.

Exemplo gráfico de regressão, um dos métodos de aprendizagem supervisionada em Machine Learning.

👉🏾 Regressão: é o método de predição de um valor contínuo: Por exemplo, digamos que você vai investir o seu dinheiro na compra de um imóvel. Não seria interessante você saber qual casa vai valorizar mais no futuro, ou qual bairro terá o maior crescimento urbano? Então, para prever valores contínuos, conforme o caso, utiliza-se algum algoritmo desse tipo, como: Regressão linear simples, regressão linear múltipla e regressão não linear.

2️⃣ Aprendizagem não supervisionada

Diferentemente do aprendizado anterior, aqui será fornecido um conjunto de dados não rotulados e nós não vamos ensinar ao modelo qual é o objetivo final. Na real, no aprendizado não supervisionado, nem a gente sabe exatamente o que vai extrair do dados, mas a gente vai, digamos assim, apertar eles para que nos digam algo que faça sentido! 😆

Esse tipo de aprendizado é baseado em busca e reconhecimento de padrões e relacionamentos. De um modo geral, ele é utilizado para encontrar peculiaridades implícitas nos dados.

Exemplo gráfico de clustering/agrupamento, um dos métodos de aprendizagem não supervisionada em Machine Learning.

👉🏾 Agrupamento: esse método busca a similaridade entre os dados e, após identificar, segrega os itens entre clusters (grupos) específicos. Com o uso de alguns algoritmos, você ainda pode definir o número exato de clusters que você deseja. Pode ser utilizado para segmentação de mercado (tipos de clientes, fidelidade), compactação de imagem, analisar e rotular novos dados, detectar comportamento anormal, entre outros casos. Alguns algoritmos de agrupamento são: K-means, Mean-Shift, DBSCAN, Single Linkage e Complete Linkage.

Exemplo gráfico de associação, um dos métodos de aprendizagem não supervisionada em Machine Learning.

👉🏾 Associação: Amplamente utilizada quando você tem um sequência de algo e deseja encontrar padrões. Isso inclui técnicas para analisar carrinhos de compras, automatizar estratégia de marketing e outras tarefas relacionadas a eventos. Um exemplo clássico é a análise da cesta de mercado, que é uma técnica baseada na teoria de que se você compra um determinado grupo de itens, é mais provável que você compre outro grupo de itens também. Outros exemplos: Diagnóstico médico: paciente com o sintoma X e Y, tende a ter o sintoma Z; Navegação na internet: pessoa que visitou a página X de um site, provavelmente, irá se interessar pela página Y. Alguns técnicas utilizadas em regras de associação: Apriori, Carma e Sequência.

👉🏾 Redução de dimensão: é o processo de redução do número de variáveis ​​aleatórias em consideração, a fim de obter um conjunto de variáveis ​​principais. Ou seja, é simplesmente o processo de redução da dimensão do seu conjunto de recursos. Utilizado em sistemas de recomendação, análise de imagem falsa e gerenciamento de riscos. Algumas técnicas: Principal Component Analysis (PCA), Singular Value Decomposition (SVD), Latent Dirichlet allocation (LDA), Latent Semantic Analysis (LSA, pLSA, GLSA), t-SNE (para visualização).

3️⃣ Aprendizagem por reforço

O objetivo desse tipo de aprendizado é encontrar um modelo de ação adequado que maximize a recompensa acumulada total do agente. Diferentemente dos aprendizados anteriores, Reinforcement Learning é usado nos casos em que seu problema não é, basicamente, relacionados a conjunto de dados, mas você tem um ambiente para lidar, como um o cenário de um game ou uma cidade onde circulam carros autônomos.

“Sobreviver” em um ambiente é uma ideia central do aprendizado por reforço, que buscará “obter o máximo de pontos possíveis” através do seu agente que, por sua vez, será conduzido por um supervisor externo. Utiliza o método tentativa e erro: Acerto = recompensa; Erro = punição. Por isso, um exemplo que melhor explica o funcionamento do aprendizado por reforço são os games, mas ele também é utilizado em outras aplicações, como a robótica. Alguns algoritmos: Q-learning e SARSA (Estado-Ação-Recompensa-Estado-Ação).

Obrigada pela visita! ✌️

--

--