Natural Language Understanding (NLU)

O que é e como utilizamos no dia a dia?

Elint
ElintTech
Published in
2 min readMay 26, 2022

--

Natural Language Understanding (em português Compreensão de Linguagem Natural) é um subtópico de Natural Language Processing (NLP), e pode ser definido como a compreensão por computadores da estrutura e significado da linguagem humana (por exemplo, inglês, espanhol, japonês), permitindo que os usuários interajam com o computador usando frases “naturais”.

Em outras palavras, NLU é a Inteligência Artificial que utiliza um software de computador para interpretar texto e qualquer tipo de dados não estruturados. Assim, NLU pode “entender” um texto, traduzi-lo em linguagem de computador e produzir uma saída em uma linguagem que os humanos possam entender. Dessa forma, a compreensão da linguagem natural não se trata apenas de analisar o texto livre em um sentido literal e criar dados estruturados; trata-se também de entender o seu significado e extrair insights.

Existem diversos exemplos de aplicação de NLU no dia a dia. Um muito comum são os serviços de atendimento ao consumidor, como chatbots e produtos comerciais que modelam o entendimento da linguagem natural. Por exemplo, as assistentes virtuais Siri da Apple ou a Alexa da Amazon realizam um trabalho de compreensão de linguagem natural no contexto de ouvir e decifrar as entradas do usuário. Além disso, as técnicas utilizadas em NLU são capazes de:

  • Compreender dados estruturados e não estruturados, o que inclui interpretar conceitos, palavras-chave, funções semânticas de qualquer texto etc.
  • Compreensão dos sentimentos: a análise não fica somente no campo da interpretação dos significados. A tecnologia NLU consegue identificar sentimentos e emoções a partir do texto analisado. Isto oferece uma análise mais profunda do que se passa pela mente dos clientes e público-alvo, por exemplo.
  • Compreensão em vários idiomas.

Recentemente a Microsoft teve avanços significativos em seu modelo DeBERTa (Decoding-Enhanced BERT with Disentangled Attention) que superou a pontuação humana de 89,8 no teste SuperGLUE com pontuações de 89,9 para um modelo de 48 camadas e 1,5 bilhão de parâmetros e 90,3 para um modelo de 48 camadas e 3,2 bilhões de parâmetros.

Este resultado é significativo dada a complexidade deste teste, pois avalia quesitos como resposta a perguntas dada uma premissa, inferência de linguagem natural e resolução de co-referências, entre outras.

Um pouco antes da Microsoft, o modelo T5 + Meena da equipe Google Brain também havia superado a pontuação humana com um valor de 90,2 — levemente inferior ao melhor resultado da equipe da concorrente. Estes resultados mostram a evolução deste campo que deve estar cada dia mais presente em nosso cotidiano.

--

--