Introdução a Engenharia de Proteínas

Guilherme Sousa
omixdata
Published in
4 min readNov 3, 2021

Olá pessoal! O post de hoje aborda uma introdução à área de Engenharia de Proteínas, uma ferramenta poderosa que vem contribuindo significativamente para o desenvolvimento da biologia sintética e da engenharia metabólica, buscando projetar ou descobrir proteínas com propriedades úteis para aplicações tecnológicas, científicas ou médicas.

O que é Engenharia de Proteínas?

A Engenharia de proteínas é uma abordagem que visa mudar a sequência de aminoácidos nativa de uma proteína, afim de introduzir uma nova propriedade ou melhorar uma função já existente. Essa alteração normalmente consiste substituir, remover ou alterar um ou mais aminoácidos. O sucesso dessa abordagem vêm gerando variantes de enzimas com atividade catalítica melhorada, especificidade de substrato ampliada ou alterada, bem como adaptação delas para para reter sua atividade em temperaturas elevadas e para funcionarem na presença de solventes orgânicos, sais e valores de pH distantes das condições fisiológicas. A engenharia de proteína pode ser dividida em três métodos: evolução dirigida, design racional e design semi-racional, sendo a escolha do método dependente do alvo que se quer trabalhar e também as informações disponíveis sobre a proteína de interesse.

Evolução dirigida

Atualmente, a evolução dirigida é a técnica mais utilizada na engenharia de proteínas. A evolução direcionada, como também é chamada, leva a um acúmulo de mutações benéficas por meio de um protocolo iterativo de mutação e seleção. A utilização deste método não depende do conhecimento sobre a proteína alvo ou de sua estrutura tridimensional, mas sim no uso do gene que expressa essa proteína. Esse gene vai ser submetido a diversas técnicas de mutagênese como error-prone PCR e recombinação genética para criação de uma biblioteca de genes modificados. Por fim, esses genes mutados passam por um rigoroso processo de seleção, onde são escolhidos de acordo com a função desejada e submetidos novamente por um processo de mutagênese. Destaca-se que a evolução dirigida encontra ótimos locais por meio de buscas de regiões repetidas, aproveitando a promiscuidade funcional e o agrupamento de sequências funcionais no espaço de sequência.

Design racional

É uma técnica que surgiu por consequência do grande aumento de informação sobre dados biológicos, como sequencias de DNA, aminoácidos, estrutura tridimensional de proteínas, rotas metabólicas entre outros, elucidando a relação sequência-estrutura de uma proteína. Por meio desta abordagem, os aminoácidos de uma sequência de proteína são selecionados e mutados, com finalidade de introduzir características específicas à proteína alvo. Nesse sentido, será possível alterar, remover ou adicionar um único ou um conjunto de aminoácidos em uma posição específica da proteína de interesse, o que o consequentemente poderá alterar sua função. O design racional é dividido em métodos baseados na sequência da proteína alvo, que é alinhada a sequência homólogas para identificar aminoácidos que, quando alterados resulte na mudança de função. O outro método é baseado na estrutura, na qual a proteína alvo pode ter sua estrutura alterada afim de melhorar alguma função.

Comparação das estratégias de design racional e de evolução dirigida. Fonte: “Methods of Directed Evolution and Their Application for Engineering of Haloalkane Dehalogenases”. DOI: http://dx.doi.org/10.13140/2.1.3648.0006

Design semi-racional

Já o método de design semi-racional utiliza-se da combinação das técnicas de evolução dirigida e design racional, visando suprir as limitações de ambos, visto que em muitos casos a mudança desejada não pode ser obtida através do uso de nenhum desses métodos separadamente, como por exemplo, a modificação em vários aminoácidos de forma simultânea.

Machine Learning na Engenharia de Proteínas

Atualmente, técnicas computacionais avançadas como Machine Learning(aprendizado de máquinas) são utilizados para alterar proteínas de acordo com características desejadas, além do uso de técnicas de bioinformática para testar essas proteínas in silico. Os métodos de aprendizado de máquina aprendem as relações funcionais a partir dos dados podendo ser preditivos mesmo quando os mecanismos biofísicos subjacentes não são bem compreendidos. Com isso, o uso de Machine Learning permite utilizar essas informações para acelerar a evolução e expandir o número de propriedades que podem ser otimizadas por meio da seleção inteligente de novas variantes para a triagem, atingindo assim níveis de aptidão mais elevados do que apenas por meio da evolução direcionada, design racional e design semi-racional.

Créditos: https://phys.org/news/2021-10-deep-learning-algorithm-aims-protein.html

Ao escolher como alternativa o aprendizado de máquina, duas etapas principais deve ser consideradas: (I) construir um modelo de função de sequência e (II) usar esse modelo para escolher as sequências a serem triadas. Os modelos usados a partir do aprendizado de máquina aprendem com exemplos de sequências de proteínas e as respectivas medições funcionais das das mesmas. Destaca-se que os exemplos que são para construir o modelo determinam o que ele pode aprender de fato.

Existe uma grande variedade de algoritmos de aprendizado de máquina, e nenhum algoritmo único é ideal para todas as execuções dos modelos. Os modelos de aprendizado de máquina mais simples aplicam uma transformação linear aos recursos de entrada, como o tipo de aminoácido em cada posição, a presença ou ausência de uma mutação ou blocos de sequência em uma biblioteca de proteínas quiméricas feitas por recombinação. Esses modelos lineares são comumente usados ​​como preditores de linha de base antes que modelos mais poderosos sejam experimentados. Com isso, conclui-se que os avanços nas técnicas computacionais e experimentais, permitirão uma melhor compreensão dos cenários de aptidão e da diversidade de proteínas.

Se você gostou, curte e compartilhe e se quiser novos posts relacionado ao tema de Engenharia de proteínas ou tiver alguma sugestão de post, por favor, deixe nos comentários, que iremos anotar 😃😃

Referências

Kapoor, S., Rafiq, A., & Sharma, S. (2017). Protein engineering and its applications in food industry. Critical Reviews in Food Science and Nutrition, 57(11), 2321–2329.

Sinha R, Shukla P. Current Trends in Protein Engineering: Updates and Progress. Curr Protein Pept Sci. 2019;20(5):398–407. doi: 10.2174/1389203720666181119120120. PMID: 30451109.

Yang KK, Wu Z, Arnold FH. Machine-learning-guided directed evolution for protein engineering. Nat Methods. 2019 Aug;16(8):687–694. doi: 10.1038/s41592–019–0496–6. Epub 2019 Jul 15. PMID: 31308553

--

--

Guilherme Sousa
omixdata
Editor for

Biotechnologist | Master’s student at PPG in Biotechnology -Bioinformatics and Proteomics Laboratory