Introdução às ciências ômicas

Frederico Schmitt Kremer
omixdata
Published in
7 min readJan 27, 2021

As chamadas “ciências ômicas” compreendem áreas interdisciplinares das ciências biológicas que atuam no estudo de caracterização em larga escala dos constitutes de um organismo ou conjunto de organismos. O termo “ômica” (inglês “omic”) é derivado de sufixo “oma” (inglês “ome”) e sua primeira utilização para esta finalidade se deu em 1920 com a definição do conceito de “genoma” por Hans Winkler.

Com o desenvolvimento da biologia molecular, biotecnologia e bioinformática nos anos 80 e 90, novas abordagens analíticas permitiram a caracterização em larga escala de outros constituintes dos seres vivos. Muito deste desenvolvimento se deu tracionado pelo sucesso dos primeiros projetos genoma, que abriram espaço e disponibilizaram dados relevantes para outros estudos de caracterização em larga escala, como a caracterização de transcritos (transcriptômica), proteínas (proteômica), DNA presente em amostras ambientais (metagenoma), dentre outras.

Genômica

A genômica é a caracterização em larga escala do conteúdo genético de um organismo, o que inclui não só as regiões de DNA codificante (coding DNA sequences, “CDS”), mas também regiões não-codificantes, como as responsáveis pela transcrição de muitos RNAs, sequências de DNA repetitivo, regiões regulatórias, dentre outras. Estas sequências estão presentes não apenas nos cromossomos, mas também em sequências extracromossomais, como os plasmídeos de bactérias e as organelas (ex: mitocôndrias e plastídeos) de eucariotos.

A consolidação da genômica como área de estudo se deu nos 90, com o surgimento dos primeiros projetos genoma, iniciativas colaborativas entre múltiplos centros de pesquisa que visavam o sequenciamento completo do genoma de diferentes organismos modelo (ex: Homo sapiens, Oryza sativa, Escherichia coli). Estas iniciativas foram possíveis após grandes avanços no sequenciamento de DNA, que a partir dos anos 80 passou a ser automatizado, e necessárias tendo em vista o baixo throughput dos equipamentos baseados no sequenciamento de Sanger.

Além do sequenciamento de Sanger, outra técnica foi a tecnologia a de microarranjos (microarray) de DNA, que permite a identificação de múltiplas mutações de forma simultânea através da hibridização do DNA presente em uma amostra com sondas dispostas em um chip. Através da hibridização é possível identificar qual alelo para uma determinada região do genoma está presente (desde que seja um alelo já caracterizado). Apesar da popularidade do NGS, esta técnica ainda é utilizada em estudos que envolvem a genotipagem de um grande número de indivíduos por conta do menor custo de análise, como é o caso dos Genome-Wide Association Studies (GWAS).

Chip para análise de microarranjos (microarray) de DNA desenvolvido pela empresa Affymetrix.

Atualmente as plataformas de NGS, descritas em maior profundidade na nossa série de posts “Entendendo o NGS”, vem servindo para um avanço constante da genômica e também da transcriptômica, tendo como principais líderes as tecnologias da Illumina, Oxford Nanopore e Pacific Biosciences (PacBio).

Diferentes linhas de sequenciadores desenvolvimentos pela empresa Illumina.

A metagenômica (ou “genômica ambiental”) é a subárea da genômica que estuda os “metagenomas”, conjuntos de material genético em uma determinada amostra ambiental, geralmente compreendendo múltiplos organismos. O conjunto de espécies presentes em um metagenoma é denominado microbioma (tendo em vista que é composto majoritariamente pelo DNA de microorganismos), e estes podem ser caracterizados tanto através do sequenciamento completo do metagenoma quanto através de técnicas de amplificação por PCR de regiões do genoma que servem como marcadores taxonômicos (ex: 16S, 21S, ITS). Quando o objetivo é a caracterização de vírus usa-se o termo “viroma”.

Transcriptômica

A transcriptômica consiste na caracterização em larga escala dos transcritos de um organismo em uma determinada condição. Diferente do genoma que é virtualmente estático, o transcriptoma (“perfil de expressão gênica”) de um organismo varia a partir da interação com o meio de seus processos regulatórios.

Uma das primeiras abordagens disponíveis para esta análise foram as Expressed Sequence Tags (ESTs), uma metodologia de sequenciamento de bibliotecas de DNA derivadas de mRNA (cDNA) através da técnica de sequenciamento de Sanger. Entretanto, da mesma forma que a caracterização de genomas, o sequenciamento de mRNA com a técnica de Sanger era extremamente laborioso por conta do baixo throughput, além de custo.

Representação das etapas para obtenção de uma biblioteca de cDNA para sequenciamento de ESTs.

Alternativas à abordagem de EST, como Serial Analysis of Gene Expression (SAGE) e suas variações, permitiam que fragmentos curtos de múltiplos transcritos (tags), cujo tamanho era de ~22bp, fossem concatenados, formando sequências maiores que poderiam ser então sequenciadas com uso da técnica de Sanger. Esta abordagem facilitou a quantificação da expressão gênica tendo em vista que um menor número de fragmentos de DNA precisariam ser sequenciados para a obtenção de um panorama geral de expressão gênica se comparado com a técnica de ESTs.

Da mesma forma que na genômica, as técnicas de microarray também desempenharam um papel importante na pesquisa em transcriptômica, sendo usadas para a quantificação da expressão gênica a partir da medida de intensidade luminosa após o processo de hibridização. Esta técnica permitiu que múltiplas amostras — incluindo replicatas — fossem analisadas rapidamente.

Exemplo de análise comparativa de expressão gênica obtida a partir de dados de microarray.

Com o advento do NGS, a principal técnica para análise transcriptômica passou a ser o RNA-Seq, que consiste na utilização de plataformas de nova geração para o sequenciamento de amostras de cDNA ou mesmo RNA diretamente (ex: Oxford Nanopore). Através do RNA-Seq é possível tanto se realizar a reconstrução da sequência de transcritos (montagem) através de técnicas de novo ou baseadas em alinhamento com genoma de referência quanto se inferir a abundância de cada transcrito com base na quantidade de leituras que foram produzidas para cada gene. Com base nas quantificações produzidas a partir de múltiplas amostas é possível se inferir as mudanças no perfil de expressão gênico entre diferentes tratamentos, sendo esta abordagem denominada expressão gênica diferencial.

Gráfico do tipo “vulcão” produzido a partir da análise de expressão gênica diferencial com base em dados de RNA-Seq, onde foram identificadas genes com expressão diminuída (down-regulated) e aumentada (up-regulated) ao se comparar duas amostras.

Proteômica

A proteômica consiste na caracterização em larga escala das proteínas presentes em uma determinada amostra, podendo ser realizada a partir de uma amostra de um organismo isolado ou de uma amostra ambiental (metaproteômica). Para a separação das proteínas presentes em uma amostra é comum o uso de técnicas como a Eletroforese Bidimensional (Two-dimensional gel electrophoresis, 2DE) e Cromatografia Líquida de Alta Performance (HPLC), seguida do uso de espectrometria de massa (MS) para a identificação de cada proteína isolada. Estas técnicas podem ser combinadas através de diferentes “arquiteturas”, sendo a combinação de HPLC com MS denominada Multi-Dimensional Protein Identification Technology (MudPIT).

As técnicas de caracterização proteômica podem ser utilizadas para a identificação e quantificação de proteínas em amostras complexas, detecção de modificações pós-traducionais (ex: glicosilação, fosforilação), caracterização de isoformas, bem como fornecer dados para uma melhor anotação de genes e genomas. Da mesma forma que na transcriptômica, é possível também utilizar as técnicas de proteômica para se realizar análises comparativas de amostras derivadas de organismos submetidos a diferentes condições, de modo a se identificar o seu efeito na perfil de expressão proteico.

Lipidômica e Glicômica

Consistem na caracterização em larga escala de lipídios e glicídeos, respectivamente, sendo ambas baseadas na utilização de técnicas cromatográficas e de espectrometria de massa para a realização do processo analítico. No caso da glicômica é possível também se utilizar microarranjos contendo lectinas, proteínas capazes de reconhecer seletiva e especificamente certos carbohidratos. Uma representação desta metodologia está apresentando abaixo.

Uso de lectinas na caracterização de glicanos em uma amostra.

Metabolômica

A metabolômica consiste na caracterização em larga escala de metabólitos, geralmente moléculas de baixo peso molecular que não são proteínas, lipídeos ou ácidos nucléicos. A análise da distribuição destas moléculas em diferentes condições permite identificar como mudanças no ambiente podem direcionar o fluxo (flux) metabólico, o que pode ser correlacionado com informações de proteômica e transcriptômica para complementar a compreensão sobre os mecanismos de regulação em um determinado organismo ou cultura celular de interesse. Estas análises são geralmente realizada através do uso de MS e metabólitos marcados com isótopos radioativos.

Exemplo de resultado de uma análise de fluxo (flux) metabólico.

Biologia de Sistemas

A biologia de sistemas é uma sub-área da biologia molecular e bioinformática que visa a modelagem de organismos vivos ou seus constituintes através de abstrações matemáticas, sendo inspirada na Teoria Geral dos Sistemas. Estas abstrações podem incorporar informações de regulação inferidas a partir de análises de genes, expressão gênica e proteica, fluxo energético de metabólitos, sendo muitas vezes denominadas “análises multi-ômicas”. Um exemplo de aplicação da Biologia de Sistemas é na identificação de redes de regulação de genes e proteínas a partir de informações de múltiplas fontes (ex: genes vizinhos, co-expressão gênica), como a realizada pela ferramenta STRING.

Exemplo de análise de interação entre múltiplas proteínas realizada com a ferramenta STRING sendo visualizada no Cytoscape

Outras ciências “ômicas”

O sufixo “ômica” passou a ser adotado amplamente nos últimos anos sendo comum que surjam, por neologia, novos termos que o utilizem para refletir uma nova abordagem (ou novo foco de pesquisa) que vise a caracterização em larga escala de alguma categoria de biomolécula ou de processo biológico. Alguns destas casos são sub-área de uma ou mais ômicas já consolidadas, como é o caso da farmacogenômica (sub-área da genômica) e peptômica (sub-área da proteômica).

--

--