Treinando modelos customizados no IBM Watson utilizando machine learning

Renato dos Santos Leal
As Máquinas que Pensam
3 min readMar 28, 2017

Imagina ensinar uma máquina a ler milhares de artigos científicos e a partir daí extrair correlações que podem ajudar a descobrir novas proteínas e tratamentos para doenças? Talvez não seja tão fácil como nos filmes, mas, de certo modo, já podemos fazer isso hoje.

Uma das soluções mais impressionantes com que trabalho no meu dia-a-dia ao construir as demonstrações de soluções cognitivas é o Watson Knowledge Studio (WKS). Com ele posso treinar a máquina para reconhecer entidades e relacionamentos específicos para certos domínios utilizando modelos de machine learning e regras sem escrever uma linha de código sequer.

Retirado de: Cognitive Capabilities — The Future of Cyber Security

A “mágica” do WKS é substituir a complexidade dos sistemas de NLP por uma interface amigável, de modo que o especialista possa treinar a máquina sem ter o conhecimento prévio em computação.

Como isso é possível?

No decorrer dos próximos dias pretendo escrever uma série de artigos explicando o funcionamento de cada etapa do WKS. Nesse artigo apresento uma visão simplificada do processo de treinamento do Watson e alguns casos de uso reais.

O Passo-a-Passo

Podemos simplificar a utilização do WKS em cinco etapas:

Modelo (Type System)

Tudo começa com um verdadeiro entendimento do domínio a ser estudado e a real necessidade do cliente (devemos nos atentar a aquela informação que desejamos extrair do texto, não é necessário marcar tudo que conhecemos).

A definição de um sistema de entidades e relacionamentos que queremos identificar no texto (chamamos de Type System) é uma atividade nada trivial e que se realizada de forma errada causará retrabalho no futuro.

Você pode conhecer mais sobre esta etapa neste post: Definindo um Type System para o Watson Knowledge Studio

Ingestão de Documentos

O segundo passo é selecionar documentos representativos que servirão de base para ensinar o Watson.

Apesar de parecer uma etapa simples, ela exige bastante atenção e trabalho. Devemos nos atentar se aqueles documentos realmente trazem as informações que queremos treinar a máquina e muitas vezes é necessário fazer um pré-processamento no arquivo para depois realizar a ingestão.

Você pode conhecer mais sobre esta etapa neste post: Inserindo dados no Watson Knowledge Studio

Anotação Humana

A terceira etapa, e talvez a mais importante, é a anotação humana: nela o(s) especialista(s) irá(m) analisar o texto, selecionar os termos importantes e então designar significados a eles. É um processo bastante semelhante a passar um marca texto em um texto escrito e puxar uma seta explicando que aquele termo se refere a, por exemplo, um modelo de carro.

Você pode conhecer mais sobre esta etapa neste post: Como especialistas podem ensinar o Watson? Anotações humanas no WKS.

Geração do Modelo

A geração do modelo de anotações é feita com apenas um clique, depois disso algumas métricas serão retornadas e você poderá refazer suas anotações para melhorar o seu modelo (você realizará esse processo algumas vezes até chegar em um bom score).

É importante ter em mente que esse é um processo iterativo e que exigirá a anotação de centenas de documentos para obter um resultado ótimo.

Utilização do Modelo

A utilização do modelo é feita fora do WKS e pode ocorrer de três formas:

  • via API Watson Natural Language Understanding (NLU) que é stateless e funciona como um motor de processamento de texto que recebe um texto e retorna as informações encontradas no mesmo.
  • via API Watson Discovery Service (WDS) que apesar de semelhante ao NLU, permite o armazenamento e realização de querys nos documentos processados.
  • via Watson Explorer, solução on premisses da IBM de busca e mineração de textos.

E onde posso utilizar isso?

Bom, as possibilidades são quase que infinitas. Alguns casos de uso reais que temos hoje são o treinamento do Watson para reconhecer incidentes de segurança cibernética, leitura de relatórios de acidentes automobilísticos e até a leitura de milhares de documentos médicos.

Mas com uma inteligência como essa podemos até ensinar o Watson a ler decisões judiciais ou coisas mais simples como comentários sobre produtos em sites de compra.

--

--