Ciência de Dados para Negócios: Treinamento e Inferência

Adriano Moala
Porto
Published in
2 min readOct 2, 2023

Diferenças entre aprender e executar para um modelo de aprendizado de máquina.

Escrito por Adriano Moala.

Fonte: ideogram.ai. Robô durante treinamento.

Muitas vezes ouço que, em determinado uso de um algoritmo, a IA vai “aprender”, quando, na verdade, ela está utilizando o que aprendeu e você está apenas pedindo uma resposta ou inferência.

Qualquer modelo possui os dois formatos, um para treinar — e aqui é importante ter um volume razoável de dados — e outro de inferência (usar a calculadora), que é o modo de utilização.

Vamos considerar que temos uma inteligência artificial treinada a partir de dados rotulados, ou seja, temos um treinamento supervisionado, no qual alguém diz o que é certo ou errado.

Quando esse modelo for ligado para gerar inferências teremos a informação daquilo que o modelo considerou como a resposta de maior probabilidade, mas não sabemos se aquela predição estava certa ou errada. Com isso, o dado que a rede está recebendo não pode ser automaticamente consumido para um “autoaprendizado”. Isso só seria possível com um feedback logo em seguida. Além disso, o feedback pode ser complicado, como fazer um desenho em uma imagem e renomear os elementos incorretos.

Imagine que essa rede tenha sido treinada com 50 mil dados, ela vai aprender por causa de apenas 1 novo caso que tenha errado? Não funciona dessa forma. Durante o processo de treinamento existe um parâmetro matemático chamado taxa de aprendizado, que vai reduzindo conforme o treinamento avança a fim de consolidar o que foi aprendido.

Isso significa que uma hora não vai adiantar incluir mais dados porque o processo já ficou saturado. Então, se pensarmos em incluir 1 novo dado na rede neural, ele não fará diferença, porque a taxa de aprendizado não permite “absorver” um novo conhecimento. Por que ela deveria dar tanta importância para 1 dado novo? Os outros 50mil não valem nada?

A forma como isso é feito na prática seria consolidando um novo conjunto e retreinando o modelo, reiniciando a taxa de aprendizagem e ainda avaliando se esse novo conjunto vai gerar uma resposta melhor, o que não é uma garantia. Talvez o modelo tenha chegado a um ponto em que seja necessário testar uma nova arquitetura ou aumentar o números de parâmetros que podem ser ajustados.

Agradecimentos

Revisão: Reputação e Live Mkt.

--

--