Ancestralidade, bem estar e identificação massiva na coleta de DNA — solução ou armadilha?

Coding Rights
Coding Rights
Published in
12 min readJan 19, 2021

--

Os testes comerciais de ancestralidade e saúde pessoal somados à ampla coleta de material genético nos sistemas de segurança pública, formam um banco de dados sem precedentes na história da humanidade. Mas ao mesmo tempo em que se desenvolvem pesquisas científicas que podem fazer a diferença entra a vida e a morte, a coleta massiva de DNA coloca o direito à privacidade na berlinda.

Por Mariana Tamari, em colaboração com Joana Varon, para a série Das Telas aos Corpos|From Devices to Bodies*

Nos últimos anos, testes de análise genética feitos por empresas privadas explodiram em popularidade, em especial por serem oferecidos a preços relativamente baixos. Eles prometem desenhar sua ancestralidade, contribuir para que você faça uma dieta mais eficiente ou alertar sobre predisposições a doenças, do câncer à diabetes. De acordo com a MIT Tech Review, até o início de 2019 mais de 26 milhões de pessoas haviam se submetido a esse tipo de testes comerciais. Mantendo esse ritmo, a expectativa é de que até o final do ano de 2021 mais de 100 milhões de pessoas no mundo todo tenham tido seu DNA coletado e analisado. Trata-se de um banco de dados sem precedentes na história da humanidade — nas mãos de empresas privadas, que lucram muito com o acúmulo dessas informações.

No Brasil, a exploração comercial do sequenciamento genético é mais recente, mas também avança a passos largos. A Genera, uma das empresas brasileiras mais populares no ramo, que se autodenomina um “laboratório de genômica pessoal”, oferece testes de ancestralidade e saúde personalizada a partir de R$199 (valor anunciado no site em janeiro de 2021). São valores como este que tornam possível que milhões de pessoas, de curiosos a enfermos, submetam-se a essas análises.

Mas mesmo uma pessoa que nunca tenha se submetido a qualquer tipo de testagem genômica pode ter seu DNA exposto e ser, assim, identificada. Os dados genéticos são conexões compartilhadas com a família de maneira involuntária e imutável e, por isso, por um método conhecido como testagem familiar é possível encontrar similaridades no DNA entre parentes distantes. Se um número suficiente de familiares de 3º grau dessa pessoa submeteu seu DNA a teste, é possível identificá-la por similaridade. Para uma população que compartilha algum tipo de ancestralidade comum (estadunidenses brancos, por exemplo), com apenas 2% de amostras de DNA é possível encontrar qualquer pessoa por similaridade genética.

Há quem exponha voluntariamente os dados do seu DNA em grandes bases abertas na internet, na esperança de encontrar familiares perdidos ou de entender melhor sua saúde (é o caso de plataformas como GEDmatch, Family Tree DNA e iSearchme). Mas muitas pessoas acabam tendo seus dados compartilhados sem nem saber, quando aceitam os termos e condições dos testes comerciais, que, em muitos casos, determinam que o usuário abra mão de sua propriedade, privacidade e direitos sobre o material genético fornecido. Ao aceitar altruisticamente participar de “pesquisas”, o consumidor autoriza essas empresas privadas a fornecerem seus dados a “terceiros”, definição frequentemente nebulosa. Ao abrir mão dos seus dados, é quase impossível ter controle do que será feito com eles.

Em entrevista recente, Ricardo Di Lazzaro, co-CEO da Genera, disse que o objetivo da empresa não é a venda de dados. Ele afirma que todos os dados coletados dos usuários são armazenados em nuvem, de forma criptografada, e que seguem a Lei Geral de Proteção de Dados Pessoais (LGPD). A empresa, contudo, diz operar as bases de dados para análises, mas de forma anonimizada. De acordo com os termos e condições firmados por quem faz esses testes, a empresa garante que o cliente pode pedir a exclusão dos seus dados da base. Contudo, segundo Lazzaro, na entrevista que concedeu em novembro de 2020, até então, nenhum cliente havia buscado a empresa pedindo que apagassem suas informações. Lazzaro também informou que nenhuma ordem judicial exigindo o acesso às informações da base de dados da Genera foi emitida, pelo menos até aquele momento.

Sequenciamento genético como saída da pandemia

A pandemia mundial da COVID-19 levou as práticas de coleta de dados do corpo a outro patamar. A tecnologia e os avanços na ciência são fundamentais para barrar as doenças infecciosas massivas e podem significar a diferença entre a vida e a morte de milhões de pessoas. Mas, ao mesmo tempo, o direito à privacidade, já tão fragilizado pela evolução da vida digital, está na berlinda por práticas como o reconhecimento facial, o “contact tracing” (rastreamento por contato) e a exposição e o amplo intercâmbio de dados sobre saúde, todas implementadas amplamente com o objetivo nobre de barrar o vírus, mas sem que uma discussão sobre salvaguardas caminhe em paralelo.

Foi justamente com a intenção de conter o avanço da COVID-19 que pesquisadores do mundo todo voltaram suas atenções para soluções ligadas ao sequenciamento genético, e vimos avanços científicos em tempo recorde. Tanto é assim, que duas das vacinas mais eficazes até o momento contra a COVID-19 se baseiam em RNA, o composto genético que transmite a mensagem da vida.

O Brasil é o segundo país do mundo em número de mortos por COVID-19. A condução por parte do governo de Jair Bolsonaro da pandemia é aterrorizante e irresponsável e, nesse sentido, a testagem em massa da população, feita de forma organizada pelo poder público, nunca aconteceu. Grande parte da testagem para detecção da doença atualmente é feita por laboratórios e hospitais privados.

Um tipo de testagem que está se popularizando no Brasil, ainda restrito a poucos grandes centros urbanos, é o teste caseiro baseado em saliva. A empresa MeuDNA, ligada ao grupo Mendelics e em parceria com o Hospital Sírio-Libanês, é hoje a principal fornecedora desse tipo de teste, que usa como base de diagnóstico a tecnologia PCR-LAMP (Amplificação Isotérmica Mediada por Loop), o que torna o teste economicamente mais acessível. É possível adquirir o kit por R$169, no site da empresa ou em redes de farmácias credenciadas. O próprio consumidor pode fazer a coleta de saliva em casa, em um tubo estéril que vem no kit. A empresa informa que tem capacidade para fazer até 110 mil testes por dia.

Desde o início de dezembro de 2020, a Universidade de São Paulo também começou a oferecer a testagem baseada em saliva. Desenvolvido pelo Centro de Estudos do Genoma Humano e Células-Tronco do Instituto de Biociências, em parceria com o Instituto de Química, o teste utiliza uma técnica semelhante, chamada RT-Lamp. O custo é baixo em comparação aos demais testes do mercado (a partir de R$90), mas a escala de aplicação é muito reduzida. Na fase inicial, o exame estará disponível apenas na capital paulista para 90 indivíduos por dia.

Na política de privacidade do teste oferecido pela MeuDNA, a empresa informa que os dados dos clientes ficam armazenados na base de dados da Mendelics, uma empresa presente em vários países da América Latina. Assim como no caso da Genera, a não ser que o usuário peça a retirada de suas informações do banco de dados, estes podem ser utilizados para “pesquisas científicas, as quais podem ser desenvolvidas internamente ou patrocinadas, conduzidas ou realizadas em colaboração com terceiros, como organizações sem fins lucrativos, instituições acadêmicas ou empresas, com base no seu consentimento e respeitadas as exigências sobre proteção de dados pessoais requeridas pela legislação aplicável”. Conforme o documento, tudo sempre “nos limites do seu consentimento e respeitadas as exigências sobre proteção de dados pessoais requeridas pela legislação aplicável”. Mas o tema não é simples assim.

Ou seja, por um lado, vendem o teste genético. Por outro, dizem que podem compartilhar os dados com “parceiros” ou “terceiros” que podem ser centros de pesquisa públicos ou grandes conglomerados químicos, ou do setor de saúde. Não há garantia de que as informações sobre os genes de quem foi testado não serão usadas, mesmo que anonimamente, para geração de mercadorias de valor bilionário para a indústria farmacêutica, para o patenteamento de sequências genômicas exploradas comercialmente, ou para qualquer outra finalidade escusa, antiética ou com a qual simplesmente não se tenha acordo.

Anonimização e consentimento para tratamento de dados genéticos — desafios para a Lei Geral de Proteção de Dados

A definição de dados pessoais da Política de Privacidade da Mendelics é a seguinte: “Para fins desta Política e das leis aplicáveis, a Mendelics entende como dado pessoal qualquer informação que identifique você ou permita identificá-lo. Por outro lado, dados anonimizados não são considerados dados pessoais”. A Lei Geral de Proteção de Dados (LGPD) define que dado pessoal é “informação relacionada a pessoa natural identificada ou identificável” e que dados anonimizados não serão considerados dados pessoais. A princípio, as definições da lei e da política de privacidade em questão aparentam estar em consonância, mas o tema não é tão simples assim.

A LGPD dispõe que para que o dado possa ser considerado anonimizado é necessário que se considere a “utilização de meios técnicos razoáveis e disponíveis” para a anonimização. E no seu artigo 12 determina que dados aparentemente anonimizados serão considerados dados pessoais se “o processo de anonimização ao qual foram submetidos for revertido” ou quando, “com esforços razoáveis, puder ser revertido”. Outro ponto importante: dados genéticos são considerados dados sensíveis, e, como tal, sujeitos a maior nível de proteção legal. Ou seja, pela formulação dessa política de privacidade, os dados de DNA podem passar de dados sensíveis, dados com maior nível de proteção, para dados anonimizados e, portanto, não protegidos pela lei. Mas como se anonimiza dados de DNA, já que são inerentemente identificáveis?

Alguns estudos atestam a grande dificuldade de desidentificar dados biométricos, ainda mais com o aumento de poder computacional e desenvolvimento de inteligência artificial. De acordo com estudo publicado no Journal of the American Medial Association, pesquisadores chineses utilizando dados de atividade física de dispositivos wearable (sensores de monitoramento de saúde) puderem chegar em dados de saúde que tinham sido desidentificados por meio do uso de machine learning (aprendizagem de máquina). A precisão na reidentificação foi de 95% dos adultos que compunham a base de dados. No caso específico de dados de DNA, estudos demonstram que menos de 100 SNP (single nucleotide polymorphisms) são suficientes para distinguir a DNA de um indivíduo.

Além disso, entre as hipóteses de tratamento de dados pessoais sensíveis, a LGPD prevê tanto a anonimização como requisito para a realização de estudos, como o consentimento. Mas, se dados genéticos também trazem informação de familiares, outra questão importante para legislações de proteção de dados, que são focadas em indivíduos, seria: até onde vai nosso consentimento para processamento de dados genéticos, se eles também dizem respeito a outras pessoas?

Muitas questões estão em aberto e, desde a aprovação da lei, ainda não temos nem a formação de uma Autoridade Nacional de Proteção de Dados, nem regulamentação específica para dados sensíveis, embora seja o previsto na legislação.

Os benefícios e riscos da soma dos bancos de DNA públicos e privados

A exploração econômica de nossos dados genéticos por grandes corporações representa apenas uma parte da contradição na coleta massiva de DNA. Há cenários em que o poder público pode ter acesso a essas bases de dados privadas, seja por que estão abertas na internet, seja por acordo direto com as empresas ou até por ordem judicial. É cada vez mais frequente que bancos de DNA públicos e privados se mesclem com o intuito de solucionar crimes em que amostras de material genético são elementos chave. Há casos nos Estados Unidos de crimes solucionados tendo como base a soma de bancos públicos e privados. O NDIS (The National DNA Index) do FBI (equivalente à Polícia Federal) que utiliza um sistema chamado CODIS, possui uma base de quase 20 milhões de perfis genéticos, provenientes do sistema de segurança pública, carcerário e forense.

Apesar de ser uma ferramenta científica na resolução de investigações criminais, em geral, é importante ressaltar algumas preocupações em relação ao direito à privacidade e à garantia da justiça quando se fala na coleta de DNA. A primeira delas é que existem falsos positivos em testagens genéticas, mais ainda na análise feita por similaridade. Assim, alguém pode acabar alvo de investigação ou até mesmo acusado por um crime que não cometeu. Outra questão é o que fazer com casos de roubo de identidade por meio de dados biométricos, diferentemente de senhas, que podemos trocar. Por fim, já existem casos em discussão nos Estados Unidos sobre correlacionar dados genéticos com finalidades discriminatórias, por exemplo, em processos de busca de emprego ou contratação de seguro de saúde e até um caso de criança que não foi aceita em uma escola por “predisposições comportamentais.

No Brasil de Bolsonaro, DNA como ferramenta de controle

O Banco Nacional de Perfis Genéticos (BNPG) foi criado pelo Decreto 7950/2013, tendo em vista a Lei 12.654/2012, que previu coleta de prefil genético como forma de identificação criminal. Instituída no âmbito do Ministério da Justiça, essa base de dados congrega material genético coletado em cenas de crimes e de condenados por crimes dolosos com violência de natureza grave ou por crimes hediondos, que legalmente devem fornecer seu DNA quando são julgados culpados.

O Brasil não possui enquadramento jurídico específico para a coleta de dados de DNA para além da área de Segurança Pública. Há um entendimento de que essas informações são consideradas dados sensíveis e passam a ser regulamentadas pela Lei Geral de Proteção de Dados-LGPD (Lei 13.709/18), que entrou em vigor em 18 de setembro de 2020 e, em caso de perfil genético para fins de identificação criminal, deve-se levar em conta as previsões legais acerca do BNPG. Além disso, o ex-Ministro da Justiça Sérgio Moro conseguiu aprovar uma Lei bastante controversa, conhecida como a Lei Anticrime (Lei 13.964/19), que trouxe algumas mudanças na coleta de DNA para o Banco Nacional de Perfis Genéticos. O ponto mais polêmico na discussão era a tentativa do ex-ministro de incluir dados de todos condenados por crimes dolosos, mesmo aqueles com recursos ainda pendentes. No texto aprovado, a negativa do apenado em fornecer material genético passou a ser considerada falta grave.

Como parte de suas promessas de campanha, o despresidente ultraconservador Jair Bolsonaro, aumentou os recursos para a área de Segurança Pública, e uma das iniciativas beneficiadas com esse incremento foi o BNPG. No período de um ano, entre 2018 e 2019, o número de perfis registrados no Banco pulou de 18 mil para mais de 70 mil, um aumento de 288% da base de dados.

Sem abandonar a linha do projeto político deste governo, é interessante notar que o BNPG estoca os perfis genéticos coletados no Brasil numa estrutura que utiliza o CODIS (Combined DNA Index System), sistema criado e utilizado pelo FBI (Federal Bureau Investigation), e que cruza essas informações eletronicamente com material genético obtido em cenas de crimes.

Mas essa não é a única relação do governo brasileiro com o “law enforcement” dos Estados Unidos. No dia 18 de março de 2019, durante uma visita a Washington do ex-Ministro Sérgio Moro junto com o ex-Diretor da Polícia Federal Maurício Valeixo foi assinado um contrato com o Bureau para intercâmbio de informação biométrica de “grupos criminosos” e “terroristas” dos dois países, com o propósito de contribuir com investigações criminais. Deve-se levar em consideração que naquele momento ambos os países encontravam-se sob regimes ultraconservadores de governo, que ainda persiste no Brasil, com conduções questionáveis, que alimentam a desinformação, descrença na ciência e provando-se imparciais quando tratando dos interesses pessoais de seus dirigentes. Portanto, é também legítimo questionar quais são os critérios usados por esses dois governos para enquadrar grupos e indivíduos nessas categorias e quais seriam os verdadeiros usos das informações biométricas trocadas pelos dois países. De acordo com o FBI, esses dados biométricos serão inseridos em bases de dados nacionais americanas, às quais outras agências do governo federal e governos estaduais têm acesso.

Por fim, cabe destacar que, no final de 2019, foi criado no Brasil, por decreto presidencial, o Cadastro Base do Cidadão, que facilita o compartilhamento de dados entre diferentes bases de dados da administração pública. Em dezembro do ano passado a Coding Rights lançou estudo analisando seu estado de implementação e inconsistências com a LGPD. Ainda que os chamados “atributos genéticos” não integrem essa base de dados, nada impede o cruzamento dessas duas bases em processos de investigação. O que denota um grande potencial de abuso em práticas de vigilância.

As contradições expostas

Do reconhecimento facial, leitura de íris, biometria e coleta de DNA às medições do nível de stress e frequência dos batimentos cardíacos, a compilação dos dados que emanam da “nossa própria carne” prometem uma vida “mais segura”, “mais saudável”, “mais eficiente” e “mais inteligente”.

Essas narrativas legitimam a transformação dos nossos corpos em dados e carregam em si enormes contradições. Enfrentamos a falta de regulamentação jurídica em todos os níveis. Replicamos desigualdades sociais, de gênero e raça nos processos de coleta e manipulação de dados sensíveis. Soma-se a isso a tendência ao abuso tanto por parte de governos como do setor privado, para aumentar o controle social e a exploração de vantagens econômicas. E, se já havia questionamentos em relação à autorização “por um clique” dos termos de uso e políticas de privacidade nas plataformas digitais, o consentimento em relação à coleta de dados dos nossos corpos é ainda mais complexo e nebuloso.

Ao mesmo tempo em que o DNA pode ser uma das principais saídas da vida pandêmica, a coleta massiva de informação genética é um dos pontos mais controversos quando tratamos dos dados dos nossos corpos. O DNA é a receita da nossa essência. Ele revela muito sobre nossa ancestralidade e predisposição a doenças, ajudando a ciência na luta da vida contra a morte, mas é também um elemento de identificação individual quase inquestionável. É possível mudar a senha do banco, o número do cartão de crédito, até mesmo alterar nosso nome. Mas a informação genética é imutável ao longo da vida. Por isso, decifrar o código de uma população e de seus indivíduos pode garantir seu bem-estar e longevidade, mas é também uma poderosa ferramenta econômica e de controle social, e pode ser a última fronteira do anonimato e da privacidade.

========

*Gostou? Quer saber mais?

Das Telas aos Corpos|From Devices to Bodies é também uma websérie de curtas produzida pela Coding Rights que reúne conversas fascinantes com mulheres e pessoas não-binárias, pesquisadoras que visam ampliar os debates sobre a implementação de biotecnologias e tecnologias digitais que funcionam baseadas na coleta de dados sobre nossos corpos. Você pode assistir todos os episódios, em inglês e português, no youtube da Coding Rights. O episódio 1 também foi sobre Coleta de dados de DNA nos EUA, Reuno Unido e Brasil.

--

--