Explicando aprendizado supervisionado para uma criança (ou seu chefe)

Traduzido por Thomas Chi do original de Cassie Kozyrkov

Agora que você sabe o que é aprendizado de máquina, vejamos o tipo mais fácil. Meu objetivo aqui é deixar humanos de todas classes e (quase) todas idades confortáveis com o jargão básico: instância, etiqueta, variável, modelo, algoritmo e aprendizado supervisionado.

Instâncias

Observe: quatro instâncias!

Instâncias são chamadas também de ‘exemplos’ ou ‘observações’.

Tabela de dados

Com o que estes exemplos parecem quando os colocamos em uma tabela? Seguindo com a convenção (porque boas maneiras é importante), cada linha é uma instância.

Os dados não são bonitos? Mas o que estamos olhando exatamente? Vamos começar com duas colunas especiais: ID único e, porque tivemos sorte dessa vez, uma etiqueta para cada instância.

Etiquetas

Uma etiqueta é a resposta correta. Em bases de dados coletadas, você a verá com a palavra ‘Etiqueta’ como na base de dados acima. Isso é a saída o que nós gostaríamos que os computadores aprendessem a gerar quando apresentamos uma fotografia como esta, que é o por quê algumas pessoas preferem o termo ‘alvo’, ‘saída’ ou ‘resposta’. Aqui as etiquetas são palavras inventadas, elas não significam nada no inglês original tampouco. Esse é o ponto. Nós (e as máquinas) ainda podemos aprendê-las.

Variáveis

O que temos nas outras colunas? Pixels coloridos. Ao contrário de você, o computador olha as imagens como números, não como luzes bonitas. O que você está vendo são os valores vermelho-verde-azul para pixels (em inglês: R para vermelho/red, G para verde/green e B para azul/blue) começando no canto superior esquerdo da imagem e indo até embaixo. Não acredita em mim? Tente inserir valores da minha tabela nesta página de cores RGB e veja quais as cores resultantes. Quer saber como obter os valores do pixel de uma foto? Olhe sobre meu ombro em meu código aqui.

Você sabe o que é muito legal? Toda vez que você olhar para uma foto digital, você estará analisando dados, obtendo significado de algo que é armazenado como um monte de números. Não importa quem você é, você já é um analista de dados. Você, rockstar, você!

Você já é um analista de dados!

Estes valores de pixel são entradas das quais o computador irá aprender. Não sou uma grande fã do nome que aprendizado de máquina dá para eles (variáveis) porque essa palavra significa todos tipos de coisas em todos tipos de disciplinas. Você pode ver pessoas usando outras palavras em contrapartida: ‘entradas’, ‘variáveis’ ou ‘preditores’.

Modelo e algoritmo

Nossas variáveis formarão a base do modelo (que é uma palavra chique para receita) que o computador usará para traduzir pixels coloridos para etiquetas.

Mas como? Esse é o trabalho do algoritmo de aprendizado de máquina. Por agora, vamos usar um algoritmo existente e impressionante: seu cérebro!

Aprendizado supervisionado

Eu gostaria que você fosse meu sistema de aprendizado de máquina. Olhe para as instâncias de novo e aprenda algo! O que é isso?

Classifique esta imagem usando o que você aprendeu dos exemplos acima.

“Blorkle”? Correto. Você tirou de letra esta! O que você fez for aprendizado supervisionado, impressionante! Você agora já vivenciou o tipo de aprendizado mais fácil que existe. Se você conseguiu enquadrar seu problema como aprendizado supervisionado, essa é uma boa ideia. Os outros são mais difíceis… Logo, vejamos mais um: aprendizado não supervisionado.

Resumo: Você está lidando com aprendizado supervisionado se o algoritmo tem a etiqueta correta à mão para cada instância. Depois, ele usará o modelo ou receita para etiquetar novas instâncias, exatamente como você fez.

Aprenda mais sobre ciência de dados e inteligência artificial em português.