O xadrez, a mente humana e o AlphaFold

Felipe de Rossi Audibert
Revista Brado
Published in
5 min readJan 17, 2021

“Este trabalho computacional representa um esplêndido avanço no problema do enrolamento de proteínas, um desafio de 50 anos na biologia. Ocorreu décadas antes do que muitas pessoas na área previram. Será interessante ver as muitas maneiras em que irá mudar fundamentalmente as pesquisas biológicas”. (Professor Venki Ramakrishnan, laureado Nobel e presidente da Royal Society).

Foto: Reprodução/O Gambito da Rainha/Netflix

A minissérie fictícia “O Gambito da Rainha”, lançada em outubro pela Netflix, retrata a vida de Beth Harmon, uma garota órfã prodígio do xadrez que desafia inúmeros obstáculos e se torna uma das melhoras enxadristas do planeta. A obra foi um enorme sucesso, figurando entre uma das séries de maior sucesso do serviço de streaming e fazendo as pesquisas por curiosidades e dicas para jogar xadrez explodirem pelo mundo. Alguns dos jogos de Beth Harmon na ficção foram desenvolvidos por Garry Kasparov, considerado por muitos o maior enxadrista de todos os tempos. E é aqui que este texto — que não é sobre Harmon, Kasparov e nem mesmo o xadrez — se inicia.

Reprodução/Revista Veja

Em 1997, Kasparov tinha seu segundo confronto com o supercomputador DeepBlue, da IBM. No sexto e último jogo, após um deslize do então campeão mundial o desafio veio ao fim com um placar final de 3,5 a 2,5. Tal acontecimento não só foi marcante para o desenvolvimento da tecnologia como também demonstrou a “força bruta” dos computadores modernos, que diante da complexidade do mundo real viria a revelar-se insuficiente.

A questão é que as combinações, muito presentes na natureza, tendem a crescer exponencialmente. O próprio xadrez possui por volta de 10¹²⁰ (10 elevado a 120) jogos possíveis, número muito maior que o número de átomos no universo (aproximadamente 10⁸⁰) e não é nada difícil sistemas crescerem ainda mais. Ao confrontar cifras arbitrariamente grandes como essa, as 200 milhões (2x10⁸) de jogadas por segundo calculadas pelo DeepBlue se intimidam.

O confronto entre a força computacional e a genialidade humana de Kasparov deixa claro apenas uma coisa: para ir além é necessário usar o que cada um tem de melhor para oferecer. Com essa noção se deu um processo muito comum na ciência: observar na natureza padrões uteis desenvolvidos através de milhões de anos de evolução. Baseado no cérebro foram criadas as redes neuronais, basicamente neurônios programados, unidades básicas que recebem números dos neurônios anteriores e com base neles passa um valor para frente.

Esboço de uma rede neuronal com 4 entradas (X1-X4), 3 saídas (Y1-Y3) e ainda 5 camadas aonde cada bolinha representa um neurônio. Fonte: http://www.opennn.net

Sozinha essa estrutura não possui utilidade nenhuma, primeiro deve-se selecionar uma grande quantidade de dados e treina-la, isso é, ajustar os valores dentro de cada “bolinha” até que ela possa executar a função desejada, buscando codificar nesses números e suas ligações a complexidade dos padrões presentes no treinamento. Claro, isso é só o conceito, e sobre ele existem décadas de estudo e um grande grupo de profissionais avançando a teoria e a aplicação.

Nesse mercado, a empresa inglesa DeepMind, fundada em 2010 e comprada pelo Google em 2014, vem produzindo importantes resultados. Foram capazes de derrotar Lee Sedol, considerado na época o melhor jogador de Go, o xadrez do Oriente, que ainda se mantinha imbatível para os computadores e possui mais possibilidades de jogos (10⁷⁶¹), repetindo o mesmo feito no popular jogo online DOTA 2. Segundo os desenvolvedores, esses projetos, apesar de não possuírem aplicação prática, foram importantes para desenvolver a tecnologia em ambientes controlados, possuindo marcos testáveis, além, é claro, da publicidade. Tantas barreiras quebradas culminaram na mais importante realização deles até agora: o sucesso do projeto AlphaFold 2 no problema de enrolamentos de proteínas.

Duas das simulações da AlphaFold2 comparando o resultado experimental em verde e o simulado pelo programa em azul. Fonte: Site oficial da DeepMind

As proteínas são cordas de aminoácidos cuja sequência é determinada pelo DNA, porém depois de sua construção essa corda se enrola em uma estrutura tridimensional complexa e após esse processo elas realizam diversas funções fundamentais nos seres vivos, como estrutural, catalisadores químicos, trabalho motor, etc. Além disso, estão presentes em quase todos os processos celulares, incluindo a síntese de outras proteínas.

Uma molécula da proteína cinesina “caminhando” ao longo de um filamento do citoesqueleto e assim carregando uma vesícula sináptica.

Pensando em resolver esse problema, a competição CASP (Critical Assessment of protein Structure Prediction) acontece a cada dois anos procurando por candidatos à solução capaz de prever como será a estrutura final das proteínas. A biologia sempre se mostrou uma área de difícil acesso para simulações, devido ao alto grau de complexidade presente nas formas de vida orgânicas. Os processos para estudar esse enrolamento são extremamente custosos e demorados, sendo o mais comum a cristalografia.

Gráfico explicitando os resultados obtidos pelos ganhadores de cada CASP medida em GDT (global distance test). Fonte: Site oficial da DeepMind

Sendo presentes e importantes para a vida, é natural que o mecanismo de muitas doenças passe por algum tipo de proteína, ou seja, diretamente causado por sua má formação, como é o caso da anemia falciforme, na qual um aminoácido trocado causa a deformação dos glóbulos vermelhos. A ferramenta possibilita pesquisas de remédios e tratamentos no médio prazo e abre as portas para programas cada vez mais poderosos, capazes de entender relações mais complexas entre proteínas e o ambiente, assim expandindo ainda mais o domínio da espécie humana sobre a vida.

Resultados importantes em tempos como esses, lembrando que um vírus é basicamente um saco de proteína com material genético dentro, trazem novas esperanças e deixam de lição duas coisas fundamentais. A primeira é valorizar a grande fonte de conhecimento que carrega a vida com seus milhões de anos e infindáveis testes e a segunda é sempre investir e se maravilhar na capacidade de 7,8 bilhões das mais complexas e efetivas “redes neuronais” que o universo produziu.

Arquitetura geral da rede neuronal AlphaFold2. Fonte: Site oficial da DeepMind

Para mais textos relacionados:

--

--

Felipe de Rossi Audibert
Revista Brado

eng-elétrica UFES, Aluno LabTel, membro da Vitória Baja e colunista de ciência e tecnologia da revista Brado.