Visão Geral
A análise de expressão diferencial (DE) é o núcleo estatístico da transcriptômica, determinando quais genes mostram mudanças significativas na expressão entre condições experimentais. Seja comparando células tratadas versus não tratadas, tecido tumoral versus normal ou amostras de séries temporais, a análise DE transforma dados brutos de contagem em insight biológico. O desafio está em distinguir sinais biológicos genuínos de ruído técnico, levando em conta a carga de testes múltiplos inerente às medições genômicas. Métodos modernos de DE usam modelos estatísticos sofisticados que foram extensivamente avaliados em conjuntos de dados reais e simulados.
Métodos
A análise DE tipicamente começa com uma matriz de contagem de leituras por gene por amostra. Métodos de normalização (TMM, RLE ou normalização quantílica) ajustam para tamanho da biblioteca e vieses composicionais. Ferramentas populares incluem DESeq2, que modela contagens com uma distribuição binomial negativa e usa estimativa de contração para dispersão; edgeR, que usa métodos empíricos de Bayes; e limma-voom, que aplica modelagem linear a contagens transformadas logaritmicamente com pesos de precisão. Para organismos não modelo ou experimentos sem genoma de referência, ferramentas como Sailfish ou Kallisto realizam quantificação livre de alinhamento. Os resultados são resumidos como log2 da mudança (fold change) e valores de p ajustados (correção de Benjamini-Hochberg). A análise de componentes principais (PCA) e mapas de calor fornecem visões globais dos padrões de expressão.
Aplicações
A análise DE é central para praticamente todo estudo de transcriptômica. Ela identifica biomarcadores para diagnóstico e prognóstico de doenças, revela mecanismos de ação de medicamentos e caracteriza respostas celulares a estímulos ambientais. Em ambientes clínicos, a análise DE de biópsias de pacientes pode estratificar cânceres para terapia direcionada. O método está intimamente relacionado a experimentos de validação por RT-PCR, que confirmam genes candidatos, e baseia-se em técnicas de microarranjos de DNA e expressão gênica. Os resultados de DE também alimentam a análise de enriquecimento de conjuntos gênicos (GSEA) para identificar vias e categorias funcionais afetadas.