Entendendo o SWISS MODEL

Guilherme Sousa
omixdata
Published in
7 min readAug 18, 2021

Olá pessoal! No post desta semana vamos falar sobre um servidor muito utilizado para modelagem comparativa e automatizada de estruturas tridimensionais (3D) de proteínas, o SWISS MODEL.

O SWISS MODEL

A modelagem de estruturas de proteínas por homologia tornou-se uma técnica de rotina para geração de modelos 3D de proteínas que não apresentam estruturas experimentais definidas ou disponíveis. Nesse sentido, a utilização de servidores automatizados, gratuitos e com uma interface fácil de usar, como o SWISS MODEL, permite gerar modelos confiáveis e sem a necessidade do uso de softwares complexos ou download de grandes bancos de dados.

A biblioteca de modelos do SWISS MODEL fornece anotações da estrutura quaternária de proteínas, ligantes e cofatores essenciais que permitem a construção de modelos estruturais completos, incluindo sua estrutura oligomérica. O conhecimento sobre a estrutura tridimensional (3D) fornece informações valiosas sobre a base molecular da função da proteína, permitindo um projeto eficaz de experimentos, como mutagênese dirigida, estudos de mutações relacionada a doenças ou algum projeto baseado na estrutura de inibidores específicos.

O SWISS MODEL foi a ferramenta pioneira no campo da modelagem automatizada em meados dos anos 90 e tem sido continuamente aprimorada durante os últimos 28 anos. No ano de 2002, o servidor computou 120.000 solicitações de usuários para modelos 3D de proteínas. Atualmente, o SWISS MODEL gera aproximadamente 3000 modelos por dia (~ 2 modelos por minuto), tornando-se um dos servidores de modelagem de estrutura mais usados em todo o mundo e seu desempenho é continuamente avaliado e comparado com outros servidores de última geração na área.

A biblioteca de modelos SWISS MODEL (SMTL)

A modelagem por homologia (modelagem comparativa) depende de estruturas evolutivamente relacionadas para gerar um modelo estrutural de uma proteína alvo e esse processo corresponde as seguintes etapas: identificação do modelo, seleção do modelo, construção e estimativa de qualidade. A estrutura da proteína a ser determinada experimentalmente é feita por mecanismos de pesquisa sensíveis para identificar proteínas que estão relacionadas evolutivamente à proteína de interesse. Com isso, se um ou mais modelos são identificados, as informações do alinhamento do alvo e as sequências do modelo em conjunto com as coordenadas 3D, são usadas para construir um modelo estrutural para a proteína de interesse.

Para isso, a biblioteca de modelos do SWISS MODEL (SMTL) agrega informações de estruturas experimentais do Protein Data Bank (PDB). Ao depositar uma estrutura no PDB, as coordenadas e informações ali contidas são processadas e importadas para a biblioteca de modelos, sendo que as entradas SMTL são organizadas a partir das prováveis montagens de estrutura quaternária, chamadas de “biounits”, que são criadas de acordo com os estados oligoméricos anotados pelo autor e pelo software descritos na deposição ao PDB.

Fluxo de trabalho na modelagem: seleção e construção de modelos

Com o intuito de selecionar os modelos mais adequados, o procedimento implementado no SWISS MODEL usa as propriedades do alinhamento do modelo-alvo, como identidade de sequência, similaridade de sequência, pontuação HHblits, avaliação entre a estrutura secundária prevista do alvo e do modelo e avaliação entre a acessibilidade ao solvente prevista entre o alvo e o modelo, permitindo assim prever a qualidade esperada da estrutura resultante. Os modelos são classificados de acordo com a qualidade esperada dos modelos resultantes, conforme estimado pelo Global Model Quality Estimate (GMQE) e Quaternary Structure Quality Estimate (QSQE). A pontuação QSQE é um número entre 0 e 1, que reflete a precisão esperada dos contatos entre as cadeias da proteína para um modelo construído, com base em um determinado alinhamento e modelo. Em geral, um valor de QSQE maior é “melhor”, enquanto um valor acima de 0,7 pode ser considerado confiável para seguir a estrutura quaternária prevista no processo de modelagem. Destaca-se que o QSQE só é calculado se for possível construir um oligômero e apenas para os modelos mais bem classificados.

O que é a pontuação HHblits? Permite avaliar a sensibilidade da busca da sequência e da precisão dos alinhamentos de sequência resultantes. Comparado com a ferramenta de busca de sequência PSI-BLAST, o HHblits é mais rápido devido ao seu pré-filtro de perfil discretizado, tem uma sensibilidade maior (50–100%) e gera alinhamentos mais precisos.

Após a seleção dos modelos para a construção da estrutura de interesse, o alinhamento é usado como entrada para gerar um modelo de todos os átomos para a sequência alvo usando o ProMod -II ou o MODELLER. De forma padronizada, os modelos são construídos usando a estrutura homo-ligomérica do modelo, conforme anotado na SMTL, desde que a estrutura oligomérica seja prevista como conservada.

É importante salientar que uma das partes mais importantes de todo o processo de modelagem é a estimativa de precisão do modelo de proteína, que irá fornecer ao usuário informações sobre suas possíveis aplicações. Neste caso, a qualidade do modelo é avaliada com a função de pontuação QMEAN, que usa potenciais estatísticos de força média para gerar estimativas de qualidade globais e por resíduo. Dessa maneira, as características geométricas do modelo (distâncias atômicas, acessibilidade a solventes e ângulos de torção) são comparadas com distribuições estatísticas, onde cada resíduo é atribuído a uma pontuação de confiabilidade entre 0 e 1 (números mais altos indicam maior confiabilidade), descrevendo assim, a similaridade esperada para a estrutura de interesse.

Como usar o SWISS-MODEL para modelagem comparativa?

Neste tópico, trouxemos um exemplo passo a passo sobre como construir um modelo de homologia para a proteína Frutalina (Lectina de Artocarpus incisa), utilizando sua sequência FASTA contida no banco de dados GenBank: 4WOG_A. Esta proteína apresenta diversas atividades biológicas, atuando como um potente mitógeno de linfócitos humanos e apresentando efeito terapêutico em tecidos lesionados cirurgicamente por feridas cutâneas.

Sequência FASTA da Frutalina contida no banco de dados GenBank sob o número de acesso 4WOG_A.

Etapa 1: Seleção da proteína-molde

Clique no botão “Start Modelling” para iniciar um novo projeto de modelagem. Após isso, deve-se inserir a sequência alvo e clicar em “Search For Template. A opção “Build Model” também pode ser usada, mas a escolha do molde, em geral, é feita pelo programa de forma automática. Formatos de entrada alternativos podem ser selecionados usando o menu suspenso apropriado.

Página do SWISS-MODEL para busca de um molde a partir da sequência da proteína alvo.

Etapa 2: Alinhamento e construção do modelo

Deve-se selecionar o melhor molde. Os critérios de seleção da estrutura usada como referência devem estar voltados para o valor de identidade (>25%) entre as sequências, melhor cobertura, E-value baixo, e melhor resolução cristalográfica (quanto menor melhor).

Resultado do SWISS-MODEL para a busca do molde da proteína a partir da sequência alvo.

Ao clicar na caixa de seleção, diferentes estruturas de modelo podem ser visualizadas e comparadas por sobreposição de estrutura no visualizador 3D. Neste caso, foi possível observar diversos templates que compartilham uma alta identidade de sequência com o a proteína alvo (Identidade variando entre 90–100%). Como esperado, as estruturas também parecem muito semelhantes, pois se sobrepõem muito bem.

Algumas diferenças locais entre os moldes e a proteína alvo podem ser observadas, principalmente no nível das regiões de loop. Normalmente, devido à sua maior variabilidade em termos de sequência e estrutura em comparação com o resto da proteína, os loops são as regiões mais suscetíveis a erros de modelagem. Por outro lado, eles estão frequentemente envolvidos na função da proteína, portanto, modelar com precisão sua estrutura é de importância crucial.

Resultado do SWISS-MODEL para a busca do molde da proteína a partir da sequência alvo.

É possível também obter uma visão geral da semelhança entre os modelos selecionados, clicando na guia “Sequence similarity”, onde um gráfico interativo mostra a relação entre os modelos no espaço de similaridade de sequência, na qual proteína-alvo é representada como um círculo vermelho preenchido. As estruturas sobrepostas dos modelos selecionados serão instantaneamente exibidas em 3D, onde você pode inspecionar suas diferenças estruturais.

Opção “Sequence similarity” do SWISS MODEL.

Na aba “Alignment” é possível verificar se as sequências dos modelos selecionados são muito semelhantes ou diferentes entre elas e ao comparar com a sequência do alvo, eles mostram algumas inserções e deleções, bem como algumas substituições de aminoácidos. Ao clicar no ícone de engrenagem, você pode alterar o esquema de cores do alinhamento, selecionando uma das muitas opções disponíveis.

Opção “Alignment” do SWISS MODEL.

Etapa 3: Avaliação do modelo

O SWISS-MODEL possui as próprias ferramentas de avaliação do modelo. Para isso, deve-se clicar na opção “Structure Assessment”.

Aba referente a página da opção “Structure Assessment” para avaliação do modelo.

Nesta avaliação será obtido os resultados voltados para os valores de QMEAN (Qualitative Model Energy ANalysis) e GMQE (Global Model Quality Estimation). O QMEAN é um estimador conhecido como z-score, sendo que quando o valor z está próximo de 0, significa que o modelo é considerado confiável e que existe uma boa concordância entre o modelo alvo e os templates resultantes. Já o GMQE, se encontra em uma faixa de 0 a 1. Quanto mais alto esse valor, mais preciso é o modelo em relação ao alinhamento e a cobertura do alvo.

Avaliação do modelo.

Por fim, é possível obter um gráfico de Ramachandran na página web do SWISS MODEL. O gráfico de Ramachandran representa as possíveis combinações de ângulos diédricos Ψ (psi) e φ (phi) nos aminoácidos de um polipeptídeo, permitindo determinar a provável estrutura secundária de um peptídeo (formada pela ligação de dois ou mais aminoácidos) e a forma final (conformação) das estruturas das proteínas.

Gráfico de Ramachandran disponibilizado pelo SWISS-MODEL referente ao modelo gerado.

Mais informações podem ser encontradas no site do SWISS MODEL.

Se você tiver alguma sugestão de post, ou queira que seja abordado mais tópicos relacionados a esta ferramenta, por favor, deixe nos comentários, que iremos anotar 😃😃

--

--

Guilherme Sousa
omixdata
Editor for

Biotechnologist | Master’s student at PPG in Biotechnology -Bioinformatics and Proteomics Laboratory