Genes de resistência antimicrobiana e Bioinformática — Parte 2

Kethlin Ferreira
omixdata
Published in
6 min readDec 15, 2021

Olá pessoal!

Esta semana daremos continuidade no nosso post sobre genes de resistência antimicrobiana (RAM) e bioinformática. Anteriormente foram citadas algumas ferramentas envolvidas na detecção de genes RAM, e agora falaremos um pouco sobre as metodologias de avaliação dessas ferramentas.

Benchmarking

É uma técnica desenvolvida e muito utilizada por indústrias para monitorar a concorrência, comparar o desempenho de resultados e melhorar a eficiência de processos.

Descrição das 5 principais categorias de benchmarking

Os exercícios de benchmarking são importantes para avaliar o desempenho e a confiabilidade das ferramentas de bioinformática disponíveis, que têm diferentes complexidades em design e função.

A utilização do benchmarking para avaliar ferramentas de bioinformática para detectar determinantes de RAM ainda é um grande desafio. Visto que o objetivo principal de um exercício de benchmarking é avaliar a capacidade da ferramenta de bioinformática em fornecer uma análise confiável do conteúdo do gene RAM. Nessa abordagem 6 pontos são muito significativos:

1- A origem dos dados testados;

2- Conjuntos de dados de referências sustentáveis;

3- Qualidade dos genomas do teste;

4- Quais determinantes incluir num conjunto de dados;

5- Resultado esperado;

6- Limites e desempenho.

Seguindo essas premissas a avaliação do desempenho das ferramentas de bioinformática é frequentemente baseada em uma comparação entre os resultados genotípicos e fenotípicos e um cálculo da especificidade, sensibilidade, valores preditivos positivos e valores preditivos negativos, precisão (Coeficiente de Correspondência Simples) e desempenho (coeficiente de correlação de Matthew) seguido por uma comparação desses parâmetros entre as diferentes ferramentas de bioinformática.

Apesar de sua utilização ser muito importante, apenas alguns estudos compararam as ferramentas de bioinformática umas com as outras para detectar os determinantes RAM. Onde foram usados dois conjuntos de dados de extremidade de pares publicados anteriormente de 196 genomas de quatro espécies e 143 genomas de duas espécies (cinco espécies no total), respectivamente, e analisado com KmerResistance vers e ResFinder vers. 2.0. Para conferir mais sobre essa pesquisa, clique aqui!

KmerResistance vers

A genotipagem de cepas com k-mers, em que cada sequência de comprimento k encontrada em um genoma é um determinante da resistência, que permite contornar o conhecimento dos genes envolvidos na resistência aos antibióticos. Esta abordagem oferece os benefícios adicionais de ser livre de alinhamento e capaz de capturar vários tipos de determinantes genéticos, como a presença de genes, bem como polimorfismos de nucleotídeo únicos e INDELs (inserções e deleções) que podem estar localizados em regiões codificantes ou não codificantes. Essas representações baseadas em k -mer são, portanto, vem sendo cada vez mais populares na bioinformática, tanto para estudos de associação do genoma e modelagem preditiva. A estrutura probabilística oferecida pelo modelo de regressão logística também é atraente. Em primeiro lugar, ele combina naturalmente vários determinantes genômicos em um modelo preditivo global com pesos modulando seus respectivos efeitos, quantificando assim seu poder preditivo relativo e refletindo o fato de que eles podem estar associados a diferentes níveis de resistência. Também fornece uma previsão probabilística, que permite quantificar a confiança que o usuário pode ter nos resultados fornecidos.

Algumas abordagens de aprendizado de máquina podem ser utilizadas para prever fenótipos categóricos de resistência a antibióticos de k -mer. As regras de predição resultantes são baseadas na detecção de possivelmente vários k -mers, que são selecionados automaticamente pelo algoritmo e são respectivamente combinados por meio de operações lógicas (conjunções ou disjunções) ou uma combinação linear.

Resfinder

ResFinder é um banco de dados que captura genes de resistência antimicrobiana de conjuntos de dados de genoma completo . O banco de dados usa o BLAST para fazer isso. A base de dados permite que as entradas do pleno sequências , parciais sequências , ou curta sequência lê a partir de outras plataformas de sequenciamento. Além disso, os usuários podem definir seus próprios limites de detecção. Por padrão, é 100% ID. ResFinder extrai de outro banco de dados, como o banco de dados Marilyn Roberts, o banco de dados Lahey (agora extinto) e ARDB. Outras fontes incluem literatura publicada, incluindo revisões.

Repositórios on-line de dados

Atualmente há uma vasta quantidade de dados sendo produzidos, juntamente de testes tradicionais de susceptibilidade aos antimicrobianos. Sendo eles conduzidos em paralelo e em grande escala.

Até recentemente, só era possível enviar e armazenar dados de sequência de DNA no International Nucleotide Sequence Database Collaboration (INSDC), enquanto todos os dados eram armazenados separadamente em repositórios locais ou nacionais fechados. Além disso, nem todos os dados genômicos são submetidos aos repositórios genômicos abertos online do INSDC e compartilhados globalmente devido a dificuldades de envio, falta de apreciação por seu valor, acesso a repositórios locais ou nacionais, medo de serem dados sendo publicados por outros, ou privacidade dos dados. No entanto, hoje o NCBI e o Instituto Europeu de Bioinformática (EMBL-EBI) podem acomodar dados junto com as informações sequenciamento de nova geração, para facilitar um monitoramento global de RAM em bactérias para fortalecer a saúde pública global.

Centro Nacional de Informações sobre Biotecnologia (NCBI)

O NCBI é o membro americano do INSDC e parte dos Institutos Nacionais de Saúde dos Estados Unidos e abriga centenas de milhares de genomas bacterianos de todo o mundo. As sequências são enviadas de estudos de pesquisa globais, mas a maioria é de programas nacionais de vigilância em saúde pública com esquema de amostragem sistemática. Com a expansão da capacidade do WGS, espera-se que o número de envios de genomas aumente em breve para mais de 100.000 por ano, somente das fontes dos Estados Unidos.

Vigilância RAM usando metagenômica

O metagenoma, é o material genético total presente em uma amostra complexa, que geralmente possui milhares de microrganismos diferentes, como por exemplo como bactérias, fungos e vírus. A partir do metagenoma é possível estimar o conjunto e as proporções de espécies de microrganismos presentes em uma amostra, sendo este denominado microbioma. A vigilância RAM atual frequentemente se concentra em poucos patógenos, principalmente com base em relatórios passivos de resultados de laboratório fenotípico para alguns patógenos específicos selecionados, como no sistema de monitoramento dinamarquês, DANMAP , levando a um estreito espectro de patógenos que não capturar todos os genes AMR relevantes. A maioria dos genes RAM podem estar presentes na flora bacteriana comensal de humanos e animais saudáveis ​​ou do meio ambiente.

Comparação resumida dos processos de identificação taxonômica pelo método tradicional de cultivo (esquerda) e pela metagenômica (direita).

As técnicas de metagenômica, junto dos dados de sequenciamento de última geração de leitura curta, se beneficiam da capacidade de quantificar milhares de genes de resistência especialmente transmissíveis em uma única amostra, sem qualquer seleção prévia de quais genes procurar. Além disso, pode fornecer informações adicionais sobre a presença de espécies bacterianas, patógenos e genes de virulência e os dados podem ser reanalisados, se novos genes de interesse forem identificados.

Para saber mais sobre metagenômica, temos um post que pode lhe ajudar, acesse clicando aqui!

A metagenômica sequenciará todo o DNA presente na amostra, incluindo o DNA do alimento e do hospedeiro, o que pode resultar em baixa sensibilidade. Procedimentos quantitativos de PCR, incluindo metodologias de captura de PCR em grande escala, foram desenvolvidos, provavelmente proporcionando maior sensibilidade. No entanto, essas metodologias não foram comparadas com relação à sensibilidade e especificidade.

No futuro, a aplicação da metagenômica diretamente em amostras de indivíduos e animais saudáveis ​​e clinicamente doentes, bem como reservatório potencial, podem resultar na vigilância definitiva de uma saúde de RAM, permitindo a determinação de todos os genes de resistência e seu contexto em todos os reservatórios. No entanto, como para isolados individuais, diferentes pipelines e bancos de dados também são usados ​​para tais estudos metagenômicos e há uma necessidade de padronização global.

--

--