Conceitos Básicos em Modelagem de proteínas

Alessandra Neis
omixdata
Published in
3 min readSep 18, 2019

Olá pessoal! Iniciando nossa série de posts sobre Bioinformática Estrutural voltada às proteínas, iremos abordar basicamente o que é a predição de estruturas, os tipos de abordagens e as melhores ferramentas para isso!

Por que modelar estruturas?

Os métodos experimentais de determinação de estruturas fornecem informações de qualidade sobre a estrutura de subconjunto de proteínas (BAKER; SALI, 2001) . As técnicas padrão para o estabelecimento de uma estrutura proteica incluem a cristalografia de raios X e Ressonância Magnética Nuclear (NMR) (LESK, 2014). Embora técnicas efetivas, são laboriosas, demandam tempo e grandes recursos, além do fato de que muitas proteínas não formam cristais, no caso da primeira técnica, ou requerem reagentes caros e radioativos, como em NMR. Assim, os métodos de predição computacional fornecem informações valiosas em muito menos tempo e com poucos recursos para uma grande parte de sequências cujas estruturas não podem ser determinadas experimentalmente ou serão parte de screening prévio antes de um experimento.

As sequências que ainda não possuem estruturas disponíveis nos bancos de dados podem ser modeladas através de uma diversidade de softwares que possuem diferentes abordagens computacionais. As predições de estrutura tradicionalmente foram categorizadas em modelagem comparativa (modelagem por homologia e threading) e ab initio. Alguns critérios levados em conta para essas designações são:

Homologia

A modelagem por homologia se baseia na disponibilidade de um homólogo próximo e alinhamento de sequências. Geralmente considera-se que a modelagem de uma proteína de estrutura desconhecida, com 40% ou mais resíduos idênticos a um homólogo de estrutura conhecida fornece modelo quase completo e de qualidade boa o suficiente para inferir sua função. De modo geral, quanto maior a similaridade da sequência, mais preciso é o modelo. Os servers de homologia são o método mais rápido para a obtenção de estruturas 3D e os mais comumente empregados são SWISS-MODEL (https://swissmodel.expasy.org/interactive) e RaptorX (http://raptorx.uchicago.edu/).

Threading

No caso do threading, a principal diferença é a fragmentação dessa sequência e busca por homólogos estruturais ao invés do alinhaemnto da sequência de aminoácidos. Se nenhum homólogo estrutural conhecido apresentar similaridade com 40% ou mais de identidade por resíduo, ainda será possível atribuir um padrão geral de conformação à proteína. Dada uma biblioteca de estruturas conhecidas e a sequência de uma proteína de estrutura desconhecida, constroem-se diversos modelos aproximados usando diferentes alinhamentos possíveis destas sequências (BAKER; SALI, 2001). A modelagem por homologia se concentra em um conjunto de alinhamentos, tendo como objetivo um modelo muito detalhado; já o threading explora muitos alinhamentos possíveis e lida com modelos aproximados; e podem às vezes revelar relações mais distantes do que métodos puramente baseados em sequência (ZHANG, 2009). Deve ser possível prever sua estrutura secundária com uma precisão de 70 a 80% numa base resíduo-por-resíduo. O software mais utilizado para predições por este método é o I-TASSER (https://zhanglab.ccmb.med.umich.edu/I-TASSER/), classificado diversas vezes como o melhor preditor de estruturas tridimensionais nas avaliações CASP.

Ab initio

Se nenhum homólogo de estrutura conhecida for reconhecível a partir das sequências, é possível utilizar método de previsão geral para lidar com novas conformações. Isso requer a utilização de softwares baseados no conhecimento estrutural de proteínas, previsão de ângulos de torção e inserção dos átomos através de métodos matemáticos (LESK, 2014; ZHANG, 2009). É o tipo de modelagem mais lento e geralmente é limitado pelo tamanho da proteína, não sendo indicado para moléculas maiores que 200 aminoácidos. Existem softwares online que possibilitam a predição ab initio, como QUARK (https://zhanglab.ccmb.med.umich.edu/QUARK/) e Robetta (https://web.archive.org/web/20150819163428/http://www.robetta.org/).

Avaliações dos softwares

Os softwares de predição e qualidade da estrutura passam por uma avaliação bienal que realiza testes cegos entre diferentes grupos que disponibilizam essas ferramentas, chamado CASP (Critical Assesment of Structure Prediction). Ocorre também a avaliação contínua dos mesmos através do CAMEO (Continuous Automated Model EvaluatiOn), sendo disponibilizados os melhores servers em seus respectivos websites.

Referências

BAKER, D.; SALI, A. Protein structure prediction and structural genomics. Science, v. 294, n. 5540, p. 93–96, 2001.

LESK, A. M. Introduction to Bioinformatics. 4. ed. Oxford, UK: Oxford University Press, 2014.

ZHANG, Y. Protein structure prediction: when is it useful? Current opinion in structural biology, v. 19, n. 2, p. 145–55, abr. 2009.

--

--

Alessandra Neis
omixdata

Doutoranda no Laboratório de Bioinformática e Proteômica pelo Programa de Pós-graduação em Biotecnologia da Universidade Federal de Pelotas.