O que é machine learning?

Italo José
aibrasil
Published in
2 min readFeb 24, 2018

A aprendizagem de máquina (do inglês Machine learning) é um assunto dentro do campo de inteligência artificial que nasceu do estudo de reconhecimento de padrões.

Simplificando, machine learning é a prática do uso da matemática para reconhecer padrões e com eles, fazer predições ou classificações.

Para esclarecer, um exemplo:

Para o nosso exemplo vamos usar uma base de dados de um hospital.

Dentro dessa base de dados, cada coluna corresponde a uma característica de um paciente.

Id -> Identificador numérico inteiro;

Nome -> Identificador NÃO único (Nome do paciente repetível);

Idade -> Dado numérico (inteiro);

Sexo -> Dado classificatório de cada pessoa M/F(Sigla);

Peso -> Dado numérica (reais);

Manchas -> Dado classificatório (Concentradas, Inexistente, Espalhadas e Uniforme);

Temperatura -> Dado numérico (real);

Internações -> Dado numérico(inteiro);

Estado -> Dado classificatório(Sigla);

Diagnóstico -> Dado de saída/classe com base nas informações acima (doente e saudável);

Temos essa base de dados que também chamamos de conjunto de treinamento (ou dataset), é através dela que nós iremos induzir hipóteses para diagnósticos de novos pacientes.

A partir de diagnósticos passados, queremos saber se um paciente está saudável ou doente através dos valores dos atributos dessa pessoa, para isso iremos usar os padrões dos casos que já ocorreram no passado (no caso, nossa base de dados), cada linha nesse conjunto de dados (também conhecido como objeto, exemplo, amostra, registro ou padrão) é um paciente e cada um está classificado como, ou saudável ou doente, imagine que alguém foi lá e classificou um por um, alguém imputou nesta tabela as características dessas pessoas(atributos de entrada) e o diagnóstico delas(Saída, alvo ou meta).

Essa informação de “saída” deve ser definida a partir de outros atributos de entradas (também conhecidos como atributos preditivos)

Feito isso, um algoritmo de machine learning pegará esses dados, irá identificar seus padrões e dado um novo registro ele dirá se esse novo paciente está saudável ou doente.

O que é atributo de entrada?

Atributo de entrada são aqueles valores que nós usamos para definir a saída.

Nós devemos usar todos esses atributos?

Não, veja só, nós temos os atributos de identificação (id e nome) e se você pensar um pouquinho eles não possuem relação alguma com o diagnóstico, para que você vai usar o id e o nome para saber se ela o paciente está doente ou saudável? Então são atributos descartáveis, nome e id não importa, já o sexo, peso, idade, temperatura corporal, quantidade de internações e estado onde o paciente mora podem sim importar, o estado por exemplo pode indicar se eles vêm de uma zona de risco ou não.

Caso você tenha achado o conceito simples, sim, o conceito de machine learning não é tão simples quanto suas implementações, mas pode se preparar pois futuramente iremos encher o medium da AI-Brasil com implementações de algoritmos de machine learning

--

--