Westworld, chatbots e 2047

Ricardo Blumer Grobel
Bots Brasil
Published in
6 min readJan 7, 2017

O ano de 2016 foi um ano diferente para a Inteligência Artificial. O assunto voltou com força, empurrado principalmente pela tendências de interfaces conversacionais, os famigerados chatbots. O Facebook liberou chatbots para o Messenger, o Slack reservou um fundo de investimento para bots dentro de sua plataforma, o KiK que já é um fenômeno entre os adolescentes americanos conta também com uma grande plataforma de bots, o fenômeno do WeChat na China, entre outros. Em paralelo, tivemos algumas séries voltadas para este tema de robôs, dentre elas, a extremamente detalhista Westworld.

O mundo de Westworld é mágico para qualquer pessoa, mas talvez seja mais espetacular para quem está surfando nesta nova onda tecnológica. Os anfitriões, como chamam os robôs na série, que interagem entre si em uma narrativa em looping, dentro de eventos que ocorrem com certa periodicidade é algo com que cientistas de Inteligência Artificial sonham todos os dias.

Dolores, uma das anfitriões.

Westworld trás algumas ideias bem interessantes desde como os anfitriões mantêm algum tipo de contexto temporal de interação com os convidados (usuários), até como estas máquinas podem um dia adquirir consciência de sua própria existência.

Dias de hoje e os chatbots

Mas nossa realidade em 2017, está bem distante daquela apresentada na série de ficção científica.

BMO — A Hora de Aventura

A área acadêmica ainda está em discussão se realmente é possível uma máquina atingir o nível de Inteligência Artificial Forte, onde a máquina pode aprender com experiências passadas e utilizá-las para se melhorar ou se é apenas possível máquinas com Inteligência Artificial Fraca, que baseada em domínios de conhecimentos específicos o programador humano modela um algoritmo onde a máquina pode encontrar novos parâmetros.

Ferramentas como processamento de linguagem natural, reconhecimento de imagens ou voz, extração de sentimentos que são utilizadas hoje para dar um “ar” de inteligência para os chatbots, são todas baseadas em Inteligência Artificial Fraca, e até que fazem um bom trabalho para uma ação específica de um problema CONHECIDO, mas estas ferramentas não conseguem extrapolar os modelos previamente gerados. Em suma, as máquinas não estão aprendendo.

Bender domina a linguagem natural… ou a ética :)

Algumas experiências feitas por nós na Harlio Bots indicam que os modelos que utilizamos hoje para processamento de linguagem natural ainda não estão prontos para oferecer uma boa experiência aos usuários. Raramente estas ferramentas criam uma fluidez de conversação que satisfaça o usuário. Estes problemas podem ser observados inclusive nas soluções de grandes corporações como o Siri (Apple), Cortana(Microsoft) e Allo (Google).

O passo que a inteligência artificial precisa dar para criar uma inteligência realmente cognitiva e consequentemente criar produtos atraentes para os usuários envolve muito mais do que algoritmos de machine learning, aumento de capacidade de processamento ou modelos matemáticos.

Precisamos entender nós mesmos!

Somos nós um apanhado de algoritmos de modelos de aprendizado de domínios específicos, que funcionam em sinergia com milhões e milhões de pentabytes guardados desfragmentados em diversos neurônios, que perdem a ligação quando não exercemos mais aquela função?
A máquina precisa ter consciência para conseguir entender e interpretar linguagens naturais?
A máquina pode sentir e ter sentimentos?
Como nossa mente trabalha quando encara novas experiências em sinergia com as antigas? Elas são mutáveis ou reescritas novamente?

Se pretendemos um dia chegar no nível de um anfitrião de Westworld, precisaremos de no mínimo áreas como Filosofia, Neurociência, Ciência de Computação e Antropologia trabalhando juntos a fim de desvendar os mistérios por trás das mentes “naturais”.

Westworld e suas teorias

Assistindo a série podemos notar o alto domínio que estas máquinas tem em entendimento de linguagem natural, contexto em qual o anfitrião está inserido, reconhecimento auditivo e visual, fora todos os reconhecimentos sensoriais que eles simulam (ou realmente sentem).

Vou citar abaixo algumas coisas que mais me chamaram a atenção na série:

Árvore de diálogo

Em certo momento, podemos notar que a geração de frases dos anfitriões é na verdade uma árvore de decisão montada palavra-a-palavra. Os modelos “geracionais” de texto hoje seguem mais ou menos o mesmo conceito.
Rodrigo Siqueira, criador do lendário robô Ed da Petrobras, lembrou de algumas informações interessantes dessa árvore de diálogo: “A interface de gerenciamento e visualização do engine de chat mostra a árvore de diálogo (dialogue tree) que lembra um pouco uma cadeia de Markov e mostra que o conteúdo da base de conhecimento (knowledge base) passa para um inference engine e vai para um sistema processamento com fases tipo: Organization / Dialogue Tree / Auditory Systems / Fuzzy Logic / Algorithms / Neural Net”

O Analysis Mode dos robôs é muito interessante. Os “programadores” dos anfitriões na verdade exercem uma função muito mais de psicólogos do que de programadores em si. Talvez no futuro estes algoritmos sejam tão complexos, que a única forma de acessá-los e obter alguma informação em caso de erro seja através de um debbuger por voz, isso era algo que eu queria ter hoje pra saber o que aconteceu com meu código Python! =D

Durante a primeira temporada da série, são apresentadas algumas teorias de como os anfitriões chegaram a este nível, um deles é o triângulo de Arnold. Arnold, um dos inventores dos anfitriões imaginou uma pirâmide onde a base era a memória, logo acima é a improvisação e depois interesse próprio. Legal pensar na variável de improvisação nos chatbots de hoje. Será que esse é um dos atributo para criarmos melhores chatbots?

Triângulo de Arnold

Outra idéia interessante é a aplicação tal da bicameral mind nos anfitriões, uma teoria apresentada pelo filósofo Julian Jaynes em 1976, onde ele afirma que os seres humanos antes de adquirirem consciência plena, ouviam “vozes” em sua cabeça, que para Jaynes, era um lado do cérebro ordenando ações para o outro lado (mente bicameral). Em certo momento da história, o ser humano percebeu que aquelas vozes eram na verdade dele mesmo, portanto, aos olhos de Jaynes, este foi o momento em que o homem adquiriu a verdadeira consciência.

Arnold utiliza essa teoria para criar uma “melhora contínua” dentro dos próprios anfitriões onde um algoritmo gera “comandos” para outra parte do algoritmo com o objetivo de buscar a tão sonhada consciência plena. O que podemos tirar dessa ideia é que os anfitriões são feitos de diversos algoritmos que podem se comunicar e se alterar durante o tempo.

2047

Levando em consideração a Lei de Moore, que a capacidade computacional dobra a cada 18 meses, estamos falando que em 2047 teremos um processador com velocidade perto de 5,5 petahertz. Seria ele suficiente para simular um cérebro humano? Acredito que sim, mas cabe um outro ponto: nós saberemos utilizar toda essa potência computacional? Já teríamos descoberto como o cérebro humano funciona ou vamos partir definitivamente para teorias como da múltipla realizabilidade onde não será necessário saber como a mente humana funciona?

O caminho é longo para chegar lá, mas uma coisa eu tenho certeza, a abertura dada aos chatbots em 2016 é um marco na história. Milhares de pessoas estão neste momento quebrando a cabeça para entregar melhores experiências para os usuários dos chatbots, seja utilizando as ferramentas que temos em mãos hoje, seja inventando novas maneiras.

Precisamos avançar muito para chegarmos ao nível dos anfitriões do Westworld , e ao mesmo tempo fica uma dúvida: é isso mesmo que queremos para o futuro?

Se quiser saber mais sobre chatbots acesse a comunidade ChatBot Brasil e veja a maior lista de chatbots brasileiros em: BotsBrasil.com.br

--

--