Bancos de dados biológicos aplicados ao melhoramento vegetal

Rafaelasformoso
omixdata
Published in
5 min readDec 16, 2020

Olá pessoal! No post de hoje iremos falar como a bioinformática pode ser uma aliada nas pesquisas para melhoramento de plantas. Este post foi escrito pela estudante de doutorado em Biotecnologia Rafaela Formoso (UFPel), a doutora em Fisiologia Vegetal Isabel Lopes Vighi e PNPD pelo Programa de Pós-graduação em Biotecnologia (UFPel) e o doutor em Fisiologia Vegetal Marcelo do Amaral e PNPD pelo Programa de Pós-graduação em Fisiologia Vegetal (UFPel). A ilustração foi produzida pela estudante de Biotecnologia (UFPel) Mabelle Cardia.

É sabido que a chegada da biotecnologia e os avanços na área de engenharia genética permitiram que o desenvolvimento de novas cultivares com características específicas ficasse mais preciso, eficiente e rápido. A genômica e a bioinformática desempenham um papel importante no aumento da taxa de produção de cultivares melhoradas, o que é crucial para identificar e resolver os desafios de reprodução e melhorar a produção agrícola. A cada dia, novos genomas de referência de culturas de alta qualidade estão disponíveis nos bancos de dados permitindo a identificação de regiões genômicas de valor agronômico, facilitando a anotação funcional de genomas e permitindo a fenotipagem de alto rendimento em tempo real de características agronômicas em casa de vegetação e no campo.

A contribuição da genômica e bioinformática no melhoramento vegetal permite que novos mecanismos sejam elucidados, abrindo espaço para que novas questões sejam levantadas, tracionando o emprego destas técnicas cada vez mais.

À medida que a quantidade de dados cresce exponencialmente, há um crescimento paralelo na demanda por ferramentas e métodos em gerenciamento de dados, visualização, integração, análise, modelagem e previsão. Ao mesmo tempo, muitos pesquisadores em biologia não estão familiarizados com os métodos, ferramentas e bancos de dados de bioinformática disponíveis, o que pode levar a oportunidades perdidas ou interpretação incorreta das informações. Assim, os principais objetivos da bioinformática aplicada à biotecnologia vegetal incluem: encorajar o envio de todos os dados de sequência para o domínio público, por meio de repositórios, para fornecer anotação racional de genes, proteínas e fenótipos, e para elaborar relações tanto dentro dos dados das plantas quanto entre as plantas e outros organismos.

Quais as ferramentas e recursos que podem ser usados em uma análise de dados para experimentos de melhoramento de plantas?

Phytozome 12 — Fornece aos usuários do Joint Genome Institute (JGI) e à comunidade científica um hub para acessar, visualizar e analisar genomas de plantas sequenciados pelo JGI, bem como genomas selecionados e conjuntos de dados que foram sequenciados em outro lugar. Integrando uma grande coleção de genomas de plantas em um único recurso e realizando anotações e análises abrangentes e uniformes, o Phytozome facilita estudos genômicos comparativos.

Fonte: https://phytozome.jgi.doe.gov/pz/portal.html

PLAZA — É utilizado para genômica comparativa de plantas centralizando dados genômicos produzidos por diferentes iniciativas de sequenciamento de genoma. Ele integra dados de sequência de plantas e métodos genômicos comparativos e fornece uma plataforma online para realizar análises evolutivas e prospecção de dados dentro da linhagem de plantas verdes (Viridiplantae).

Fonte: https://bioinformatics.psb.ugent.be/plaza/

PlantGDB — É um banco de dados de sequência molecular para todas as espécies de plantas. O objetivo do PlantGDB é estabelecer a base para a identificação de conjuntos de genes comuns a todas as plantas ou específicos a determinadas espécies, integrando uma série de ferramentas de bioinformática que facilitam a predição de genes e comparações entre espécies.

Fonte: http://www.plantgdb.org/

EnsemblPlants — É um recurso integrativo que apresenta informações em escala de genoma para espécies de plantas sequenciadas. Os dados fornecidos incluem sequência do genoma, modelos de genes, anotação funcional e loci polimórficos.

Fonte: https://plants.ensembl.org/index.html

AgriGO v2.0 — É uma ferramenta para análises de ontologias genéticas, baseada no Gene Ontology. Ele se concentra especificamente em espécies agrícolas. O AgriGO v2.0 foi projetado para fornecer suporte profundo para a comunidade agrícola no campo das análises de ontologia.

Fonte: http://systemsbiology.cau.edu.cn/agriGOv2/

AgBase — É um banco de dados que facilita a modelagem dos dados genômicos funcionais. Fornece análises estruturais e funcionais para plantas, animais, microrganismos e genomas de parasitas de importância agrícola.

Fonte: https://agbase.arizona.edu/

Gramene — É um recurso para comparação funcional em culturas e espécie modelo de plantas. Essas informações são de fontes públicas e incluem genomas, estruturas proteicas, sequenciamento, mapeamento genético e físico, localização de QTL e análise funcional.

Fonte: https://www.gramene.org/

PlantCARE — É um banco de dados para elementos regulatórios de plantas. Possui elementos reguladores baseados em matrizes posicionais, sequências consenso e locais individuais em sequências promotoras específicas.

Fonte: http://bioinformatics.psb.ugent.be/webtools/plantcare/html/

ppdb v3.0 — O Plant Promoter db é um banco de dados de promotores de plantas que fornece informações sobre os locais de início da transcrição (TSSs), estrutura do promotor principal (TATA-box, iniciadores, patches Y, elementos GA e CA) e grupos de elementos regulatórios como elementos reguladores transcricionais putativos e abrangentes.

Fonte: http://ppdb.agr.gifu-u.ac.jp/ppdb/cgi-bin/index.cgi

The Arabidopsis Information Resource (TAIR) — No TAIR é possível encontrar a sequência completa do genoma junto com a estrutura dos genes, informações dos produtos do genes, expressão gênica, DNA e estoques de sementes, mapas do genoma, marcadores genéticos, publicações e informações sobre a comunidade de pesquisa de Arabidopsis.

Fonte: https://www.arabidopsis.org/

The rice annotation project (RAP) — Foi fundado em 2004 com a conclusão do sequenciamento do genoma de Oryza sativa ssp. japonica cv. Nipponbare pelo International Rice Genome Sequencing Project com o objetivo de fornecer à comunidade científica uma anotação precisa e oportuna da sequência do genoma do arroz. Um dos principais objetivos deste projeto é facilitar uma análise abrangente da estrutura e função do genoma do arroz com base na anotação.

Fonte: https://rapdb.dna.affrc.go.jp/

E aí, qual ferramenta devo usar?

Todas estas ferramentas podem ser utilizadas nas pesquisas, a escolha por cada uma delas depende do objetivo do trabalho. Em futuros posts será explorada a aplicação destas e outras abordagens de bioinformática na área do melhoramento genético :D.

--

--