Aplicações e modelos de IA que surpreendem — Parte 1

Gabriel Aparecido Fonseca
Ambev Tech
Published in
10 min readMay 3, 2023

A ideia inicial era colocar diversas áreas de aplicação de IAs em um só artigo, mas notei que talvez isso ficaria grande e cansativo para leitura. Portanto, resolvi dividir em partes. Cada uma falando de alguma área distinta. Fica de olho, logo mais temos as próximas!

Photo by Markus Winkler on Unsplash

A Inteligência Artificial (IA) tem sido um dos campos mais emocionantes e promissores da tecnologia nos últimos anos. Desde chatbots, que podem conversar com você como se fossem humanos, até carros autônomos que podem dirigir por si próprios, a IA está transformando a maneira como vivemos, trabalhamos e interagimos com o mundo ao nosso redor. Com cada avanço, a capacidade da IA de entender e responder aos nossos desejos e necessidades cresce exponencialmente. No entanto, à medida que a IA se torna cada vez mais presente em nossas vidas, também surgem preocupações sobre seu impacto a longo prazo. Será que estamos prontos para lidar com as consequências de uma IA cada vez mais poderosa?

É notável o crescimento do uso das inteligências artificiais nos últimos anos. O aumento do poder computacional, a computação em nuvem, a melhoria no armazenamento de dados, tudo isso permitiu que modelos matemáticos que funcionariam só em teoria também tivessem aplicações práticas. Dado isso, a velocidade de desenvolvimento de modelos de IA tem ocorrido em uma velocidade assustadora. Assim, cada grande empresa de tecnologia (as big techs) quer uma fatia do bolo e busca fazer um modelo melhor, mais eficaz e preciso que supere a concorrência. Nesse artigo, vou falar de algumas aplicações e modelos de linguagem natural que são assustadoramente interessantes e curiosos. Boa leitura.

IAs usadas em linguagem natural

Photo by Brett Jordan on Unsplash

O primeiro tópico dessa série de artigos mostra aplicações e modelos de IA no processamento e entendimento de linguagem natural, os chamados “grandes modelos de linguagem” (large language models — LLM). Basicamente a linguagem natural é a língua falada ou escrita que nós seres humanos usamos pra nos comunicar. Portanto, uma sequência de caracteres ditos ou escritos que em conjunto possuem um sentido e transmitem uma mensagem. Como deve-se imaginar um computador não é capaz de realmente entender a linguagem natural, para isso é necessário converter as frases, palavras, letras em uma sequência numérica para usar nos modelos. Os novos modelos de IA nessa área são complexos e utilizam uma infinidade de dados de texto escrito pelas pessoas durante a história, com isso eles são capazes de reproduzir, entender o contexto, dar sugestões e responder perguntas. Pois é, isso parece coisa de ficção científica, mas apesar de necessitar de aperfeiçoamento isso já é uma realidade.

GPT

Photo by Shantanu Kumar on Unsplash

Esse talvez seja o modelo que tem ganhado mais destaque recentemente na área de linguagem natural. Principalmente porque ele foi utilizado em uma aplicação que se tornou famosa recentemente, o ChatGPT.

O ChatGPT é um chatbot criado pela OpenAI, um laboratório de pesquisa de inteligência artificial dos Estados Unidos que realiza pesquisas e desenvolve modelos de IA para diversos fins. Recentemente, a empresa recebeu um investimento bilionário da Microsoft, que está incorporando alguns dos modelos criados em seus produtos, como o motor de busca Bing e o pacote Office.

A primeira versão do ChatGPT utilizou um modelo chamado GPT-3 que possui 175 bilhões de parâmetros e que foi treinado com uma massiva quantidade de dados. Por si só, esse número já é surreal, mas a nova versão do ChatGPT que utiliza o GPT-4 possui incríveis 1 trilhão de parâmetros. Isso é incrível e foi necessário a criação de um supercomputador na Microsoft Azure para treinar o modelo.

E como ele funciona? Basicamente você passar pra ele um texto (prompt), pode ser uma pergunta ou uma solicitação sobre qualquer assunto. Ele irá te responder em linguagem natural, na maioria das vezes quase indistinguível do que um humano diria. Você pode pedir para ele sugerir correção ou otimização em códigos, para que ele explique algum termo complexo como se você fosse uma criança, para ele criar um poema no estilo de um autor famoso, etc. As possibilidades são inúmeras.

O uso do GPT-4 vai ser ainda mais um game changer. Ele é mais criativo, permite respostas mais longas e é mais preciso com outros idiomas. Além disso ele tem melhor performance e é capaz de ter inputs visuais, não somente texto.

Concorrentes

Photo by Markus Spiske on Unsplash

Poderia citar n empresas que desenvolveram ou estão desenvolvendo modelos semelhantes, mas assim esse artigo seria infinitamente grande. No entanto, cabe destacar mais alguns modelos. Depois do sucesso que foi o ChatGPT, toda grande empresa de tecnologia foi atrás de criar o seu próprio modelo na área de linguagem natural.

A Google desenvolveu o Bard, que apesar de estar apenas no início está circundado de polêmicas. Alguns funcionários da Google demonstraram preocupação com o modelo dizendo que ele é “mentiroso patológico” e “constrangedor”. Apesar do aviso desses funcionários, a Google lançou o modelo mesmo com os aviso de falta de ética e responsabilidade.

A Meta (antigo Facebook Inc.) também não poderia ficar atrás na corrida das big techs pra criar o seu próprio LLM. Assim ela lançou o LLaMA (Large Language Model Meta AI), modelo que possui 65 bilhões de parâmetros, treinado com 7 datasets públicos em 20 idiomas. A sua vantagem é ser um modelo menor e mais eficiente o que permite que seja usado por comunidades científicas que não tenham acesso a grandes infraestruturas.

Além das big techs, uma empresa brasileira chamada Maritaca AI (ótimo nome inclusive) desenvolveu um modelo de linguagem natural focado em português. O modelo chamado Sabiá-65B (outro bom nome) foi treinado com 14 datasets em português possuindo 65 bilhões de parâmetros. Segundo os desenvolvedores o modelo possui o desempenho um pouco abaixo do GPT-4 mas um pouco superior ao GPT-3.5-turbo.

Open Source

Photo by Richy Great on Unsplash

Além desses modelos comerciais, pesquisadores do mundo todo têm desenvolvido LLM de código aberto. Um deles é o Bloom, um modelo open source com 176 bilhões de parâmetros que é capaz de processar 46 idiomas e 13 linguagens de programação. Ele surgiu a partir da colaboração de centenas de pesquisadores do mundo todo. Você pode testá-lo gratuitamente no hugging face.

A Databricks lançou também um modelo chamado Dolly 2.0. Esse é um modelo de 12 bilhões de parâmetros que foi ajustado exclusivamente em um novo conjunto de dados de alta qualidade coletado entre os funcionários da empresa. Esse dataset chamado de databricks-dolly-15k é composto por 15000 prompts de alta qualidade gerados por humanos e seus respectivos pares de respostas projetados especificamente para ajustar modelos de linguagem de grande porte em seguir instruções. Qualquer pessoa pode modificar ou estender esse dataset e usá-lo para qualquer propósito.

É simplesmente impossível falar em um único artigo de todos os modelos de LLM. Para saber ou conhecer mais sobre outros dê uma olhada nesse repositório do github, lá vc vai ter muitas informações interessantes sobre o assunto.

Aplicações em áreas variadas

Apesar de ter citado aplicações de propósito geral para LLMs, existem diversas aplicações em nichos e com finalidades específicas. Na medicina, por exemplo, existe o DeepScribe, uma ferramenta que usa machine learning, processamento de linguagem natural e reconhecimento de voz para reescrever como documentação médica é feita. O propósito do DeepScribe é principalmente diminuir o tempo necessário para documentação durante o trabalho clínico, fazendo assim com que o profissional tenha mais atenção e cuidado ao ouvir o paciente.

Em produtividade existe o Sheet Plus, ele permite escrever fórmulas do excel/google sheets a partir de um texto. É somente necessário colocar uma descrição da fórmula e o modelo gera ela com precisão em segundos. Além disso, se você tiver uma planilha que possui uma fórmula complexa, basta passar ela pro modelo que ele irá fornecer uma explicação passo a passo de cada componente e o que ele faz.

O ChatPDF possui as funcionalidades do ChatGPT mas em arquivos PDF. Ele permite analizar documentos, relatórios e textos, podendo criar resumos e extrair insights de grandes arquivos PDF. Além disso, é possível fazer perguntas específicas dos arquivos passados e obter respostas rapidamente, o que evita a necessidade de ler todo texto para entender questões específicas.

Na área de programação uma das ferramentas de AI mais conhecidas é o GitHub Copilot. Ele foi treinado com bilhões de linhas de código e assim é capaz de fazer sugestões de código em tempo real para dezenas de linguagens de programação. Ele compartilha recomendações baseadas no contexto do projeto e convenções de estilo. O que torna muito mais eficiente o trabalho do desenvolvedor.

A plataforma da Viable permite que você entenda profundamente seu público e acompanhe as mudanças semanais com base em suas ações no mundo real. Ela integra de forma prática às grandes plataformas de suporte do cliente como por exemplo o Zendesk. A partir disso, ela faz resumos, análise de sentimentos, analisa avaliações textuais e numéricas para compreender precisamente o comportamento e sentimento do cliente.

Outras ferramentas que valem ser mencionadas:

  • DocuWriter é uma ferramenta para gerar automaticamente documentação abrangente e precisa a partir de arquivos de código-fonte.
  • Rose.ai permite integração perfeita com os principais provedores de dados do mundo e usa o que há de mais recente em LLMs de código aberto e processamento de linguagem natural para analisar e visualizar informações com base em prompts de linguagem humana. Ela torna cada etapa de análise de dados fácil e transparente para todos os tipos de usuários e públicos, permitindo puxar e visualizar dados.
  • A Sentieo é uma plataforma que utiliza modelos avançados de processamento de linguagem natural para realizar pesquisas, agregar conteúdos e processar documentos do mercado financeiro. Com isso, é possível obter informações precisas e coerentes, que auxiliam na tomada de decisões assertivas.
  • A Kensho é especializada em trabalhar com dados de linguagem natural, utilizando tecnologias avançadas de machine learning para construir modelos que adicionam estrutura a dados não estruturados e semiestruturados. Esse processo melhora significativamente a amplitude e velocidade da coleta de dados, além de transformar informações anteriormente não estruturadas em insights de negócio valiosos e significativos.
  • O Taplio é uma ferramenta que utiliza modelos de machine learning para otimizar o uso do LinkedIn. Com ela, é possível criar conteúdos de alta qualidade de forma mais eficiente, economizando tempo na escrita de postagens na plataforma. Além disso, o Taplio fornece novas ideias para posts, mantém os usuários atualizados com as últimas notícias e tendências, o que contribui para criar conteúdo de forma rápida e eficaz.
  • A AdCreative.ai é uma plataforma que utiliza inteligência artificial para criar anúncios eficazes de maneira simples e eficiente. Ao informar o público-alvo e a plataforma na qual o anúncio será veiculado, a ferramenta o cria com linguagem adequada para essa plataforma e com foco nas necessidades do público-alvo, gerando assim anúncios mais efetivos.
  • A Beautiful.ai é uma ferramenta de inteligência artificial focada em apresentações, que simplifica todo o processo de criação. Com a utilização de designs prontos e inúmeros templates disponíveis, é possível criar apresentações incríveis em questão de minutos. Além disso, a plataforma oferece a possibilidade de personalização, permitindo que os usuários alterem os designs e templates para atender às suas necessidades específicas.
  • Poised é basicamente um treinador de comunicação alimentado por IA que ajuda o usuário a falar com confiança e clareza. Essa ferramenta fornece feedback em tempo real sobre tudo, desde as palavras mais faladas até as palavras de preenchimento, confiança, energia, empatia e muito mais. Além disso com ela é possível acompanhar o progresso, analisar tendências da fala ao longo do tempo e melhorar as falas nas reuniões mais importantes.
  • A Rationale é uma plataforma que utiliza modelos de inteligência artificial para ajudar empresários, gerentes e indivíduos a tomarem decisões difíceis. Ao inserir uma decisão ou opções nas quais existe indecisão, a ferramenta utiliza o contexto fornecido para listar os prós e contras, gerar análises SWOT, conduzir análises multicritérios ou causais, a fim de auxiliar na avaliação de opções e tomada de decisão. Com isso, ela fornece uma visão ampla e estruturada das opções disponíveis, ajudando a avaliar cada alternativa de maneira clara e objetiva para que a melhor decisão seja tomada.

Como é possível notar existem incontáveis aplicações hoje em dia que utilizam LLM, é simplesmente impossível citar todas. Trouxe aqui algumas que achei interessante, e como deve ter sido possível de notar, muitas das ferramentas existentes atualmente focam no público empresarial e no ganho de produtividade.

Conclusão

Ufa, finalmente chegamos no fim da parte 1 dessa série de artigos sobre IA. Espero que não tenha sido muito cansativo, mas aqui eu trouxe só a pontinha do iceberg. A área de processamento de linguagem natural tem crescido em uma velocidade assustadora. É praticamente impossível falar sobre tudo, já que todo dia surgem novos modelos e novas aplicações.

Gostou do artigo? Alguma crítica ou sugestão? Faltou alguma coisa? Pode me falar aí. Ahhhh e a propósito, um parágrafo desse texto foi feito utilizando o ChatGPT, você consegue identificar e dizer qual é? 😉

--

--

Gabriel Aparecido Fonseca
Ambev Tech

Data Scientist — Master Degree @ UFLA — Bachelor degree in Mechatronics Engineer @ CEFET — Python and data scientist enthusiast