Skip to content

Article image
Microarranjos de DNA e Análise de Expressão Gênica

Os microarranjos de DNA permitem a medição simultânea dos níveis de expressão de milhares de genes, fornecendo uma visão genômica da atividade transcricional celular. Eles revolucionaram a genômica funcional ao permitir que pesquisadores comparem a expressão gênica entre diferentes condições, tecidos ou estados patológicos.

Princípios do Microarranjo

Um microarranjo de DNA consiste em milhares de pontos microscópicos, cada um contendo sondas de uma sequência específica de DNA, fixados a uma superfície sólida, como uma lâmina de vidro ou chip de silício. Cada sonda é projetada para hibridizar a uma sequência alvo específica de mRNA ou cDNA. A coleção completa de sondas representa o conjunto de genes que está sendo analisado.

O experimento básico envolve extrair RNA das amostras de interesse, convertê-lo em DNA complementar com transcriptase reversa, marcar o cDNA com corantes fluorescentes e hibridizar o cDNA marcado ao microarranjo. Após lavar o material não especificamente ligado, a intensidade de fluorescência em cada ponto é medida, indicando a quantidade de cada mRNA na amostra original.

Arranjos de Duas Cores

Em experimentos de microarranjo de duas cores, o RNA de duas condições é marcado com corantes fluorescentes diferentes, tipicamente Cy3 e Cy5. Os cDNAs marcados são misturados e hibridizados a um único arranjo. A razão da fluorescência Cy5 para Cy3 em cada ponto reflete o nível relativo de expressão de cada gene entre as duas condições. Os desenhos de duas cores controlam a variação ponto a ponto, mas introduzem viés de corante que requer experimentos de troca de corante.

Arranjos de Canal Único

Arranjos de canal único, como Affymetrix GeneChips, usam um único marcador fluorescente. Cada amostra é hibridizada a um arranjo separado. A expressão gênica é medida como intensidade absoluta, e as comparações são feitas entre arranjos após normalização. Arranjos de canal único têm maior rendimento para comparações múltiplas, mas requerem métodos robustos de normalização para reduzir a variação entre arranjos. Arranjos Affymetrix usam múltiplas sondas por gene com sondas de correspondência perfeita e de correspondência imperfeita para distinguir hibridização específica do fundo.

Normalização de Dados

Os dados de microarranjo requerem extenso pré-processamento. A correção de fundo remove o sinal de hibridização inespecífica. A normalização ajusta a variação técnica entre arranjos. A normalização quantílica torna a distribuição das intensidades das sondas idêntica entre os arranjos, assumindo que a maioria dos genes não é diferencialmente expressa. A média robusta de múltiplos arranjos combina correção de fundo, normalização e sumarização de múltiplas sondas por gene.

Análise de Expressão Diferencial

Após a normalização, testes estatísticos identificam genes com alterações significativas de expressão entre condições. O teste t moderado, implementado no pacote limma, toma emprestada informação entre genes para estabilizar as estimativas de variância. A correção para testes múltiplos usando o método de Benjamini-Hochberg controla a taxa de falsa descoberta. Os resultados são tipicamente relatados como dobras de alteração com valores-p ajustados. Genes com dobras de alteração acima de um limiar e valores-p ajustados abaixo de 0,05 são considerados diferencialmente expressos.

Agrupamento e Classificação

O agrupamento não supervisionado agrupa genes ou amostras com base na similaridade de expressão sem conhecimento prévio. O agrupamento hierárquico produz dendrogramas onde genes com perfis de expressão semelhantes são agrupados. O agrupamento por k-médias particiona genes em um número especificado de grupos. Essas abordagens podem revelar grupos de genes co-regulados e novos subtipos de amostras.

A classificação supervisionada usa rótulos de amostras conhecidos para construir preditores que podem classificar amostras desconhecidas. Máquinas de vetores de suporte, florestas aleatórias e classificadores de vizinhos mais próximos são aplicados. Assinaturas de expressão gênica podem classificar subtipos de câncer, predizer prognóstico e orientar a seleção de tratamento. A assinatura PAM50 classifica o câncer de mama em subtipos moleculares com diferentes prognósticos.

Aplicações

Os microarranjos foram aplicados a virtualmente todas as áreas da biologia. A pesquisa do câncer usa microarranjos para classificar tumores, identificar assinaturas prognósticas e descobrir alvos farmacológicos. Os ensaios MammaPrint e Oncotype DX de câncer de mama usam assinaturas de expressão gênica para predizer risco de recorrência. A biologia do desenvolvimento estuda programas transcricionais que orientam a diferenciação. A toxicologia usa microarranjos para perfil toxicogenômico. Microarranjos também detectam variações no número de cópias quando usados para hibridização genômica comparativa.

Limitações e Transição para RNA-Seq

Os microarranjos têm limitações, incluindo dependência de sequências de sonda pré-definidas, faixa dinâmica limitada e incapacidade de detectar transcritos novos ou variantes de splicing. O sequenciamento de RNA, uma aplicação chave do sequenciamento de próxima geração, substituiu amplamente os microarranjos para análise de expressão gênica. O RNA-seq fornece dados de contagem digital com maior sensibilidade e faixa dinâmica, detecta transcritos novos e isoformas e não requer sondas pré-definidas. No entanto, os microarranjos permanecem úteis para organismos bem caracterizados e aplicações clínicas onde plataformas padronizadas são vantajosas.