Bancos de dados biológicos aplicados ao melhoramento vegetal
Olá pessoal! No post de hoje iremos falar como a bioinformática pode ser uma aliada nas pesquisas para melhoramento de plantas. Este post foi escrito pela estudante de doutorado em Biotecnologia Rafaela Formoso (UFPel), a doutora em Fisiologia Vegetal Isabel Lopes Vighi e PNPD pelo Programa de Pós-graduação em Biotecnologia (UFPel) e o doutor em Fisiologia Vegetal Marcelo do Amaral e PNPD pelo Programa de Pós-graduação em Fisiologia Vegetal (UFPel). A ilustração foi produzida pela estudante de Biotecnologia (UFPel) Mabelle Cardia.
É sabido que a chegada da biotecnologia e os avanços na área de engenharia genética permitiram que o desenvolvimento de novas cultivares com características específicas ficasse mais preciso, eficiente e rápido. A genômica e a bioinformática desempenham um papel importante no aumento da taxa de produção de cultivares melhoradas, o que é crucial para identificar e resolver os desafios de reprodução e melhorar a produção agrícola. A cada dia, novos genomas de referência de culturas de alta qualidade estão disponíveis nos bancos de dados permitindo a identificação de regiões genômicas de valor agronômico, facilitando a anotação funcional de genomas e permitindo a fenotipagem de alto rendimento em tempo real de características agronômicas em casa de vegetação e no campo.
À medida que a quantidade de dados cresce exponencialmente, há um crescimento paralelo na demanda por ferramentas e métodos em gerenciamento de dados, visualização, integração, análise, modelagem e previsão. Ao mesmo tempo, muitos pesquisadores em biologia não estão familiarizados com os métodos, ferramentas e bancos de dados de bioinformática disponíveis, o que pode levar a oportunidades perdidas ou interpretação incorreta das informações. Assim, os principais objetivos da bioinformática aplicada à biotecnologia vegetal incluem: encorajar o envio de todos os dados de sequência para o domínio público, por meio de repositórios, para fornecer anotação racional de genes, proteínas e fenótipos, e para elaborar relações tanto dentro dos dados das plantas quanto entre as plantas e outros organismos.
Quais as ferramentas e recursos que podem ser usados em uma análise de dados para experimentos de melhoramento de plantas?
Phytozome 12 — Fornece aos usuários do Joint Genome Institute (JGI) e à comunidade científica um hub para acessar, visualizar e analisar genomas de plantas sequenciados pelo JGI, bem como genomas selecionados e conjuntos de dados que foram sequenciados em outro lugar. Integrando uma grande coleção de genomas de plantas em um único recurso e realizando anotações e análises abrangentes e uniformes, o Phytozome facilita estudos genômicos comparativos.
PLAZA — É utilizado para genômica comparativa de plantas centralizando dados genômicos produzidos por diferentes iniciativas de sequenciamento de genoma. Ele integra dados de sequência de plantas e métodos genômicos comparativos e fornece uma plataforma online para realizar análises evolutivas e prospecção de dados dentro da linhagem de plantas verdes (Viridiplantae).
PlantGDB — É um banco de dados de sequência molecular para todas as espécies de plantas. O objetivo do PlantGDB é estabelecer a base para a identificação de conjuntos de genes comuns a todas as plantas ou específicos a determinadas espécies, integrando uma série de ferramentas de bioinformática que facilitam a predição de genes e comparações entre espécies.
EnsemblPlants — É um recurso integrativo que apresenta informações em escala de genoma para espécies de plantas sequenciadas. Os dados fornecidos incluem sequência do genoma, modelos de genes, anotação funcional e loci polimórficos.
AgriGO v2.0 — É uma ferramenta para análises de ontologias genéticas, baseada no Gene Ontology. Ele se concentra especificamente em espécies agrícolas. O AgriGO v2.0 foi projetado para fornecer suporte profundo para a comunidade agrícola no campo das análises de ontologia.
AgBase — É um banco de dados que facilita a modelagem dos dados genômicos funcionais. Fornece análises estruturais e funcionais para plantas, animais, microrganismos e genomas de parasitas de importância agrícola.
Gramene — É um recurso para comparação funcional em culturas e espécie modelo de plantas. Essas informações são de fontes públicas e incluem genomas, estruturas proteicas, sequenciamento, mapeamento genético e físico, localização de QTL e análise funcional.
PlantCARE — É um banco de dados para elementos regulatórios de plantas. Possui elementos reguladores baseados em matrizes posicionais, sequências consenso e locais individuais em sequências promotoras específicas.
ppdb v3.0 — O Plant Promoter db é um banco de dados de promotores de plantas que fornece informações sobre os locais de início da transcrição (TSSs), estrutura do promotor principal (TATA-box, iniciadores, patches Y, elementos GA e CA) e grupos de elementos regulatórios como elementos reguladores transcricionais putativos e abrangentes.
The Arabidopsis Information Resource (TAIR) — No TAIR é possível encontrar a sequência completa do genoma junto com a estrutura dos genes, informações dos produtos do genes, expressão gênica, DNA e estoques de sementes, mapas do genoma, marcadores genéticos, publicações e informações sobre a comunidade de pesquisa de Arabidopsis.
The rice annotation project (RAP) — Foi fundado em 2004 com a conclusão do sequenciamento do genoma de Oryza sativa ssp. japonica cv. Nipponbare pelo International Rice Genome Sequencing Project com o objetivo de fornecer à comunidade científica uma anotação precisa e oportuna da sequência do genoma do arroz. Um dos principais objetivos deste projeto é facilitar uma análise abrangente da estrutura e função do genoma do arroz com base na anotação.
E aí, qual ferramenta devo usar?
Todas estas ferramentas podem ser utilizadas nas pesquisas, a escolha por cada uma delas depende do objetivo do trabalho. Em futuros posts será explorada a aplicação destas e outras abordagens de bioinformática na área do melhoramento genético :D.