Agentes de IA

Uma revolução sem limites?

Bernardo Monteiro
Alto-falante de formiga
7 min readMay 30, 2024

--

Se você não é um analista de sistemas envolvido com soluções de Inteligência Artificial nos dias de hoje, você provavelmente usa o ChatGPT 4 ou 4-o; você provou a sedução da voz Sky, idêntica à da Scarlett Johansson no filme Her; encantou-se com a capacidade de resolução de equações de 1º grau escritas à mão em uma folha de papel, e lidas e processadas por meio da câmera de um celular; e talvez tenha acreditado que o ChatGPT 4-o é capaz de ler as emoções de uma pessoa, supostamente estampadas em uma selfie (lamento dizer que aquilo não é possível, ok?). Pois bem… Se você achou impressionantes as capacidades do novo ChatGPT 4-o anunciadas na palestra da Open AI de 13 de maio deste ano, talvez este texto seja para você… pois devo lhe dizer, aqui entre nós…

Eu aposto que você ainda não viu nada do que tem sido feito de realmente impressionante com Inteligência Artificial nos últimos meses. A grande explosão de aplicações da IA no mundo inteligente não virá necessariamente do GPT 4-o ou do GPT 5… ou 6. Virá da combinação de ferramentas IA mais simples que, ao interagirem entre si de forma autônoma e reiterada dezenas de vezes, já são capazes de gerar resultados e soluções mais adequadas para problemas complexos ou que dependem da análise de grandes quantidades de dados.

Achou que aqueles robôs antiguinhos estavam ultrapassados? Achou errado…

AGENTES de IA. É deles que eu estou falando. Os ASSISTENTES, como o ChatGPT, são realmente impressionantes, mas os AGENTES de IA, desculpem o meu anglicismo, são mind blowing 🤯

Pra começar esta apresentação, eu gostaria de fazer uma distinção entre 3 tipos de LLM: chat bot, assistente virtual e agente de IA.

O chat bot é aquele robozinho que responde algumas perguntas previstas no sistema com respostas pré definidas. É aquele robô do site de plano de saúde que responde a perguntas dos clientes desde que o cliente faça corretamente uma pergunta que o robô foi programado para responder. Os LLMs usados nesses chat bots são os mais simples, embora possam ter alguma capacidade de processamento de linguagem natural (NLP).

Já o assistente virtual é um LLM com maior capacidade de processamento de linguagem natural (NLP), cuja interação com usuários se assemelha a uma conversa entre pessoas adultas. Para que opere dessa forma, normalmente inclui tecnologias de aprendizado de máquina e de redes neurais. O assistente pode aprender com as interações e melhorar suas respostas ao usuário enquanto a conversa progride em várias iterações. Na classe de assistentes virtuais estão incluídos Siri, Google Assistant e Alexa, entre os mais simples, e ChatGPT, Claude, LLama e Mistral como exemplos dos mais avançados.

E os agentes de IA? Se você gosta de IA, você deveria tentar entender o que são agentes de IA, e como eles diferem do seu assistente de IA. Os analistas de sistemas e os programadores mais inteligentes e capacitados usam ChatGPT 3.5 (ou LLMs similares de baixo custo), pelo menos vinte vezes mais barato que o ChatGPT 4, para fazer tarefas que talvez só o ChatGPT 5, que ainda nem foi lançado, será capaz de fazer sozinho. Esses LLMs simples interagem entre si repetidas vezes, seguindo algoritmos próprios de cada agente, organizados em uma arquitetura engenhosa para produzir mais e melhor a um custo igual ou mais baixo que os LLMs mais complexos. Pesquisadores de IA procuram saber como podem fazer para que os LLMs adquiram e produzam conhecimento de forma mais eficiente. E a combinação de agentes parece ser uma maneira de desenvolver soluções variadas nesse campo, com muita plasticidade e criatividade.

Andrew Ng em sua palestra: What’s next for AI agentic workflows

Andrew Ng, professor da Universidade de Stanford, fundador da DeepLearning.AI e envolvido em várias outras iniciativas, palestrou na Sequoia Capital’s AI Ascent em 26 de março de 2024, acerca do que vem por aí no campo dos fluxos de trabalho com agentes de IA, que têm um potencial de impulsionar os avanços de IA de forma significativa, ou mesmo ultrapassar hoje o impacto das próximas gerações de LLMs, como o ChatGPT 5. Uma versão comentada dessa palestra, que facilita bastante o entendimento dos conceitos, pode ser encontrada neste link.

Podemos ler sobre um exemplo interessante do potencial desses agentes no artigo The Research Agent: Addressing the Challenge of Answering Questions Based on a Large Text Corpus”, por Rahul Nayak. Inspirado pelo processo de pesquisa humana, Nayak projetou um agente que procura imitar a maneira como os humanos realizam pesquisas. Este agente anota a pergunta original, busca respostas parciais e gera novas perguntas intermediárias, refinando continuamente suas respostas.

Atualmente, existem diversos tipos de agentes de IA, cada um projetado para diferentes aplicações e ambientes. Se você pedir exemplos ao ChatGPT, ele poderá responder o seguinte:

Agentes Reativos: operam com base em regras pré-definidas e respondem diretamente a estímulos do ambiente. Eles não têm memória de estados passados. Exemplo: Agentes utilizados em jogos simples, como o Pac-Man, onde as ações são baseadas em regras fixas.

Agentes Baseados em Modelo: mantêm uma representação interna do estado do mundo, permitindo-lhes tomar decisões com base em estados passados e prever estados futuros. Exemplo: Agentes em jogos mais complexos ou sistemas de navegação que utilizam mapas e trajetos passados.

Agentes de Objetivo: projetados para atingir um ou mais objetivos específicos. Eles tomam decisões que os aproximam do cumprimento desses objetivos. Exemplo: Sistemas de planejamento automatizado que buscam otimizar rotas de entrega ou agendar tarefas de maneira eficiente.

Agentes de Utilidade: além de atingir objetivos, esses agentes avaliam as diversas opções com base em uma função de utilidade, escolhendo a ação que maximiza a utilidade esperada. Exemplo: Sistemas de recomendação que sugerem produtos aos usuários com base em suas preferências e histórico de compras.

Agentes de Aprendizado: utilizam técnicas de aprendizado de máquina para melhorar suas ações e decisões ao longo do tempo com base em experiências passadas. Exemplo: Agentes de aprendizado por reforço em jogos de tabuleiro, como AlphaGo, que aprendem estratégias vencedoras através de simulações repetidas.

Agentes Multiagentes: compostos por múltiplos agentes que interagem e colaboram para atingir objetivos comuns ou individuais. Eles podem coordenar e negociar entre si. Exemplo: Sistemas de gerenciamento de tráfego onde múltiplos agentes controlam semáforos para otimizar o fluxo de veículos.

Agentes Autônomos: capazes de operar de maneira independente e tomar decisões complexas sem intervenção humana, muitas vezes em ambientes dinâmicos e não estruturados. Exemplo: Veículos autônomos que navegam e tomam decisões em tempo real no trânsito.

Agentes Cognitivos: modelam processos de raciocínio humano, como percepção, memória e tomada de decisão. Eles são projetados para simular a inteligência humana. Exemplo: Assistentes virtuais avançados que realizam tarefas complexas e interagem de maneira natural com os humanos.

Você consegue encaixar esses tipos de agentes nos quatro padrões mencionados por Andrew Ng na palestra de 24 de março que mencionei acima? Os quatro padrões estão na fotografia da apresentação do Andrew que ilustra este artigo (Reflection, Tools use, Planning e Multi-agent collaboration).

Como você deve ter percebido, o uso de agentes de IA tem aplicações variadas e depende muito da criatividade e engenhosidade humanas. Aparentemente é também um campo fértil para criações da própria IA, que em breve possivelmente criará novas arquiteturas de agentes de IA, ou ao menos nos auxiliará nessa tarefa.

Vejamos alguns poucos exemplos de vários agentes que já atuam em nosso mundo real:

ChatDev: Este projeto utiliza múltiplos agentes de IA que assumem diferentes papéis em uma organização tradicional de desenvolvimento de software. Cada agente colabora para lidar com diversas tarefas, desde o design de software até a escrita de código e documentação. O ChatDev demonstra como agentes de IA podem ser programados para interagir e trabalhar juntos de forma autônoma, simulando uma equipe de desenvolvimento completa.

AutoGen: Desenvolvido pela Microsoft, o AutoGen é uma estrutura open-source que permite a criação e implantação de múltiplos agentes de IA que podem trabalhar juntos para atingir objetivos de forma autônoma. Esta plataforma facilita a comunicação entre agentes, minimiza erros e maximiza o desempenho de modelos de linguagem de grande escala (LLMs).

MetaGPT: Similar ao ChatDev, o MetaGPT estrutura vários agentes de IA com papéis específicos, como gerentes de produto, gerentes de projeto e engenheiros, para colaborar em tarefas de codificação definidas pelo usuário. Embora ainda em fase de testes, este projeto mostra a promessa de agentes de IA que podem colaborar de forma autônoma em tarefas moderadamente complexas.

Ficou claro o potencial dos agentes de IA?

Se você entendeu que podemos estar diante de uma grande revolução que pode subverter a noção de trabalho humano, como você explicaria o que é um agente de IA?

Eu diria que agente de IA é um programa de computador que pode operar de maneira autônoma, recebendo dados que podem ser captados por sensores que percebem o mundo das coisas à nossa volta, ou podem ser introduzidos por outros softwares que interagem com o agente (ou entre agentes), reduzindo a necessidade de intervenção humana, podendo processar de forma mais eficiente dados e questões de maior complexidade, quando comparado com o app triste e solitário do ChatGPT no seu celular, por exemplo.

Espero que este artigo tenha ajudado você a entender em que mundo estamos vivendo e o que nos espera nos próximos meses.

O conceito de agente de IA tem mais de 60 anos. A expressão “agente de IA” está intimamente ligada ao trabalho de pesquisadores como John McCarthy, Marvin Minsky, Allen Newell e Herbert A. Simon, que foram pioneiros em formalizar o estudo da inteligência artificial durante a Conferência de Dartmouth em 1956. Esses pesquisadores começaram a desenvolver programas que poderiam ser considerados agentes de IA, capazes de agir de maneira autônoma para resolver problemas específicos. Nos anos 1980, o conceito foi expandido com a introdução de sistemas especialistas, como o “Dendral” e o “Mycin”, que eram projetados para tomar decisões em áreas específicas do conhecimento. Rodney Brooks, na mesma década, introduziu a ideia de agentes reativos, enfatizando que agentes não precisavam de modelos complexos do mundo para agir de forma inteligente, mas poderiam responder diretamente aos estímulos do ambiente.

Embora a ideia de agente de IA já tenha algumas décadas, no início de 2023, após a popularização do ChatGPT, o potencial dos agentes de IA explodiu. E como as máquinas de IA mais simples são suficientes para produzir trabalhos fascinantes quando colocadas para interagir de forma autônoma, a evolução dos agentes de IA parece não ter limites. Prepare-se.

– Bernardo Monteiro

--

--

Bernardo Monteiro
Alto-falante de formiga

Advogado e biólogo por formação. Cozinheiro por paixão.