Competir ou cooperar: AI nos ensina o caminho.

Christian Zambra
productmanagerslife
7 min readNov 3, 2021

Em 2017, um experimento do Laboratório Deep Mind, utilizando agentes conduzidos por algoritmos de Inteligência Artificial — Reinforcement Learning, nos demonstrou que até agentes puramente racionais são capazes de aprender a cooperar. Décadas antes o trabalho de John Nash nos demonstrou que tal cooperação depende da capacidade de ver além da própria individualidade. E mais de mil anos antes Sun Tzu nos trouxe um princípio claro: O conflito (ou a guerra) destrói valor para todos que participam dela. Nesta história de Jack ilustraremos a necessidade de cooperação através de uma aventura em um navio, e esperamos inspirar muitas aventuras corporativas a valorizarem mais a cooperação que a competição.

Ilustração por Christian Zambra

O dilema de Jack

Há algum tempo Jack colocou os marujos para competir, e o resultado foi desastroso

Jack é um pirata. Um bom pirata. Apreciador de rum, da brisa do mar e de aventuras. Ele ama a adrenalina que corre por suas veias ao avistar o perigo, ao se deparar com desafios. Porém às vezes a aventura não dá muito certo, e ele precisa de alguém para explicar.

Em uma manhã de sol lá estava ele, sentado no píer, pensativo olhando para o mar. E seu fiel papagaio AI veio conversar com ele. Jack lhe contou que estava pensando em uma nova aventura, a busca do tesouro do Navio Santa Rosa. Ele naufragou no litoral brasileiro próximo da região de Pernambuco no ano de 1726, com uma grande carga de ouro.

Porém essa região não traz boas lembranças a Jack. Há alguns anos, em busca de outro navio, o Prince, afundado em 1752 também na região de Pernambuco, Jack quase andou pela prancha, prestes a dançar sua última valsa com os tubarões.

Naquela ocasião, ele teve uma infeliz ideia: Uma competição agressiva poderia incentivar os marujos a se esforçarem mais, e atingirem os objetivos do navio. A ideia era muito simples: O marujo que individualmente se esforçasse mais pela empreitada ganharia o tesouro todo. Sabendo que a parte mais difícil da viagem seria ter que remar quando não houvesse vento, este seria o principal indicador.

Sendo um pirata moderno e justo, e super inspirado nas mais recentes invenções do ambiente competitivo, Jack instalou contadores a laser nos remos para saber a quantidade exata de remadas de cada pirata, e só por precaução também colocou uma câmera filmando as salas.

E na 4ª noite de viagem, ele viu de seu quarto, pelo monitor das câmeras, a viagem começar a desandar.

Sabendo que a recompensa seria individual e que todos estavam competindo, alguns piratas começaram a atrapalhar os outros. Começaram jogando sementes e pedras uns nos outros, para desconcentrar. E conseguiram. Porém remar em um barco é algo que exige sincronia, então quando alguns erraram, os remos se entrelaçaram e o barco ficou à deriva. Começou uma briga generalizada entre os marujos, até que eles notaram que havia água entrando pelas aberturas dos remos. Eles haviam perdido o rumo e entraram em uma região de mar revolto, onde para piorar a situação estava começando uma tempestade.

Após horas sacudindo no mar e rezando em desespero, eles ouviram um forte barulho no casco. Bons ventos os levaram até uma ilha deserta, e assim que a tempestade passou eles puderam sair.

E quando saíram, passada a adrenalina se deram conta de que quase perderam a vida por causa de uma competição idiota. E a ideia da competição havia sido de quem?

Os marujos saíram pela praia correndo atrás de Jack, o capturaram e quase o mataram ali.

Porém, ele conseguiu se safar com um ótimo argumento: Alguém precisaria explicar como concertar o barco, que estava encalhado na areia da ilha, e bem como conduzi-los no caminho de volta para casa.

Obviamente Jack não pretende passar por isso de novo, mas na verdade ele ainda não entendeu o que deu de errado. E ao perguntar para AI, obteve a seguinte resposta:

— Teoria dos Jogos, Teoria dos Jogos!

Ilustração por Christian Zambra

O dilema do prisioneiro: E se Jack e Bill fossem presos?

A teoria dos jogos nos ensina que a competição destrói valor

Assim, AI fala do trabalho de grandes matemáticos como John von Neumann e por fim John Nash, buscando compreender o comportamento humano através da teoria dos jogos. Além da cena (teoricamente duvidosa) do filme Uma Mente Brilhante, onde Nash utiliza sua teoria para conduzir seus amigos a uma estratégia vencedora, com o objetivo de chegar nas meninas no bar da faculdade (link pra cena no final), existem exemplos mais fieis a teoria, sendo o mais clássico deles o Dilema do Prisioneiro. Vamos ilustrá-lo a partir de uma situação hipotética, onde Jack e seu colega pirata Bill são presos pela Companhia das Índias.

A companhia das Índias não possui testemunhas de que Jack ou Bill tenham cometido delitos, só alguns documentos de procedência duvidosa. Caso nenhum deles confesse, ambos ficarão presos por 1 ano. Porém se um confessar e acusar o outro, aí a coisa muda de figura.

Assim, eles fazem a seguinte proposta à Jack (e depois fazem a mesma proposta a Bill):

Jack, você tem as seguintes opções:

  • Não confessar, nem acusar: Se você não confessar e Bill te acusar, te deixaremos preso aqui por 3 anos, por não ter cooperado conosco.
  • Confessar e acusar Bill: Se você confessar e acusar Bill:

— Caso ele não confesse nem te acuse, você estará livre.

— Caso ele confesse e te acuse, você ficará aqui por 2 anos.

Considerando individualmente as opções, e tirando a cooperação ou confiança no amigo, a opção individual que minimiza o prejuízo de Jack é confessar e acusar Bill. Assim, assim como os marujos que ao invés de cooperar começaram a competir e jogar pedras uns nos outros, Jack e Bill se acusam, e curtem uma temporada de 2 anos na prisão. Porém, vamos ver todas as opções deste cenário:

Ilustração por Christian Zambra

Se considerarmos como o objetivo o tempo na prisão, temos o seguinte:

Individualmente, e considerando que um trairia o outro, ambos escolheram a menor pena possível (-2 anos, menor que -3). Porém, considerando as penas totais, eles acabaram caindo no pior cenário, pois somando as penas eles cumprirão 4 anos, mais do que em qualquer uma das outras opções.

Pensando que esse dilema se aplica a diversos outros cenários, a não cooperação resulta em destruição de valor, e como vimos no exemplo inicial, direciona esforços que deveriam cooperar para um objetivo único para destruir valor dentro do próprio navio, e isso obviamente traz prejuízo para todos.

AI e o dilema dos algoritmos

Experimentos de Inteligência Artificial nos ensinam que a não-escassez promove a cooperação

Jack não entendeu muito bem a questão, mas viu que tinha que fazer os marujos cooperarem. Mas ainda não ficou claro o que tinha dado de errado na última viagem. E AI ilustra através de um experimento recente feito pela DeepMind.

Em um experimento recente, dois agentes, que podemos simplificar para personagens de vídeo game controlados por algoritmos de inteligência artificial, (deep reiforcement learning), foram colocados para atuar em um jogo. Um deles controla um personagem vermelho, e o outro controla um personagem azul. Eles recebem recompensas de acordo com as maçãs coletadas no jogo (assim como os marujos, de acordo com as remadas). Um pode jogar um grão no outro para temporariamente removê-lo do jogo (assim como os grãos e pedras que os piratas jogaram uns nos outros), porém o puro arremesso dos grãos não provoca recompensa nenhuma.

O resultado, após milhares de partidas, foi que:

· Quando haviam maçãs o suficiente para ambos, os agentes focavam em fazer o seu trabalho (coletá-las) ao invés de atacar o outro.

· Quando havia falta de maçãs (assim como no caso do navio, onde só um seria premiado com o tesouro) os agentes passavam a atacar os demais.

Assim, até algoritmos puramente racionais são capazes de aprender a cooperar, e o segredo foi a não escassez de recursos.

Para deixar mais claro para Jack, AI explica que as metas dos agentes não podem existir em detrimento dos demais. Elas devem possibilitar o esforço em conjunto, assim eles poderão cooperar, e se literalmente estiverem todos remando para o mesmo lado, chegarão ao destino mais rápido.

Jack inicia uma aventura cooperativa

Jack inicia uma aventura diferente, incentivando os marujos a cooperar

E eis que Jack inicia uma aventura diferente. Inspirado pelos seus colegas cooperativos do Vale do Silício, ele incentiva a cooperação ao máximo. Chega da ideia de vencedores ou perdedores (ou ainda Vikings ou Vítimas como dirá Brené Brown), ou ainda o ganhador leva tudo. Agora esse navio-startup acredita nas pessoas, e na capacidade que elas têm de fazer grandes coisas quando agindo em conjunto. Além de uma sala de jogos com bilhar e vídeo game, o navio incorporou metas conjuntas, uma cultura cooperativa e a valorização das decisões em conjunto. Graças a isso, por exemplo, um marujo salvou o barco de uma colisão à noite, quando avistou uma rocha e ele mesmo desviou o barco, sem ter que alinhar com ninguém.

E assim eles navegaram felizes em direção às águas brasileiras, conseguiram encontrar o tesouro que tanto buscavam nas águas de Pernambuco, e aproveitaram para curtir a vida, bebendo água de coco na praia de boa viagem!

Ilustração por Christian Zambra

Referências:

Naufrágios — Santa Rosa e Prince: https://www.oficina70.com/2021/01/naufragios-na-costa-brasileira-que.html

Teoria dos Jogos:

John Nash: https://www.nobelprize.org/uploads/2017/05/nash-lecture.pdf

Dilema do Prisioneiro: https://en.wikipedia.org/wiki/Prisoner%27s_dilemma

Experimento de AI pela DeepMind: https://deepmind.com/blog/article/understanding-agent-cooperation

Uma mente brilhante — Cena do Bar (Adam Smith estava errado): https://www.youtube.com/watch?v=2d_dtTZQyUM

Brené Brown — A Coragem de Ser Imperfeito Capítulo 4 — O Escudo Viking ou Vítima.

https://brenebrown.com/

https://www.amazon.com.br/coragem-ser-imperfeito-Bren%C3%A9-Brown/dp/8543104335

--

--

Christian Zambra
productmanagerslife

Passionate to learn; believes that new products are made to change people’s life for better; Fuzzy AND Techie :) B. Engineering & Advertising. Alma Matter: USP