Um tratamento médico realmente especializado

Nosso código fonte

Será que em algum dia poderemos aplicar uma espécie de git blame a uma parte do nosso DNA e verificar a origem da cor dos nossos olhos ou como foi o merge entre o DNA dos nossos pais? Que tal então fazer um push request de um fix para aplicar em seres humanos? Fazer esses exercícios de imaginação faz parte do meu passatempo. É bom imaginar como a tecnologia pode melhorar as nossas vidas no futuro… entretanto, o que vou falar a respeito agora está muito próximo de se tornar real.

A maioria sabe que o DNA contém uma espécie de código fonte que especifica todas as nossas características. E toda a diversidade que existe entre os seres humanos acontece através de um processo bastante inteligente de mescla de moléculas de DNA dos pais que geram os filhos. Infelizmente algumas vezes esse git merge provoca problemas ou mantém um débito técnico dos pais que precisa ser contornado, como uma propensão a ter alguma doença ao longo da vida.


O Windows 3.1, lançado em 1993 e desenvolvido por cerca de 250 programadores possui entre 4 e 5 milhões de linhas de código. Um dos melhores sistemas operacionais da Microsoft na minha opinião foi o XP, escrito em 50 milhões de linhas de código. O Kernel do Linux possui metade disso enquanto o Facebook já beira as 10 milhões de linhas de código. Uma molécula de DNA possui cerca de de 6 bilhões de par de bases, o que podemos fazer uma analogia a uma linha de código. Só que, diferente de uma linha de código em uma linguagem de alto nível, o DNA sequenciado ainda precisa ser melhor entendido. Na verdade então, é como se fossem 6 bilhões de linhas de código dos quais não sabemos qual é a sintaxe.

O esforço para sequenciar o genoma humano foi muito grande e agora, com o advento da nuvem, inteligência artificial e a consequente redução dos custos no processamento de grandes quantidades de dados, está começando a ser viável o sequenciamento de uma quantidade enorme de indivíduos (ou forks do código). E isso nos permitirá entender melhor as informações que estão ali escondidas e ter o tratamento correto.

Em termos de dados, cada DNA sequenciado significa algo como 100 GB e o governo americano está, através de um programa chamado PMI (Precision Medicine Initiative), buscando sequenciar o DNA de 1 milhão de americanos. Espera-se entender, através das micro-variações em cada um desses indivíduos, o que cada gene representa em termos de doença. Para você ter ideia do esforço computacional envolvido nisso, o processo de sequenciamento levou 9 meses no ano 2000, quando o primeiro sequenciamento do genoma humano foi feito. Hoje leva 1 dia e a tendência é que isso leve horas em breve.

E o que isso significa? Além de um diagnóstico antecipado de algumas doenças (e o tratamento preventivo), também permitirá que uma doença corrente possa ser tratada através de medicamentos corretos e na quantidade necessária para aquele paciente. Não haverá mais a necessidade de testar medicamentos ou sofrer efeitos colaterais pesados sabendo como cada componente afeta o organismo do portador daquelas características genéticas.


O sequenciamento de DNA trás uma série de questões éticas a tona, afinal será impossível esconder certas características pessoais, já que seu código fonte estará aberto. Mas apesar disso, é impossível não ficar otimista quanto a seu uso pela pela medicina no futuro próximo. Inteligência artificial e análise de uma maciça quantidade de dados, desafios cada vez mais corriqueiros nos dias de hoje, estão sendo cada vez mais acessíveis graças a nuvem.

Como curiosidade, você pode dar uma olhada no serviço 23andMe, que através de uma amostra de saliva consegue mostrar suas origens, possíveis parentes (que também estão na base de dados deles) e dados de doenças prováveis.

O git blame está cada vez mais próximo!