Présentation
L’analyse de l’expression différentielle (DE) est le noyau statistique de la transcriptomique, déterminant quels gènes présentent des changements d’expression significatifs entre des conditions expérimentales. Qu’il s’agisse de comparer des cellules traitées versus non traitées, des tissus tumoraux versus sains, ou des échantillons de séries temporelles, l’analyse DE transforme les données de comptage brutes en connaissances biologiques. Le défi consiste à distinguer les véritables signaux biologiques du bruit technique tout en tenant compte de la charge de tests multiples inhérente aux mesures pangénomiques. Les méthodes modernes de DE utilisent des modèles statistiques sophistiqués qui ont été largement évalués sur des ensembles de données réels et simulés.
Méthodes
L’analyse DE commence généralement par une matrice de comptage des lectures par gène et par échantillon. Les méthodes de normalisation (TMM, RLE ou normalisation quantile) ajustent la taille de la bibliothèque et les biais de composition. Les outils populaires incluent DESeq2, qui modélise les comptages avec une distribution binomiale négative et utilise l’estimation par retrait pour la dispersion ; edgeR, qui utilise des méthodes bayésiennes empiriques ; et limma-voom, qui applique une modélisation linéaire aux comptages transformés par logarithme avec des poids de précision. Pour les organismes non modèles ou les expériences sans génome de référence, des outils comme Sailfish ou Kallisto effectuent une quantification sans alignement. Les résultats sont résumés sous forme de changements d’expression (log2 fold change) et de p-valeurs ajustées (correction de Benjamini-Hochberg). L’analyse en composantes principales (ACP) et les cartes de chaleur fournissent des vues globales des profils d’expression.
Applications
L’analyse DE est centrale dans pratiquement toute étude transcriptomique. Elle identifie des biomarqueurs pour le diagnostic et le pronostic de maladies, révèle les mécanismes d’action des médicaments et caractérise les réponses cellulaires aux stimuli environnementaux. En clinique, l’analyse DE de biopsies de patients peut stratifier les cancers pour une thérapie ciblée. La méthode est étroitement liée aux expériences de validation par RT-PCR, qui confirment les gènes candidats, et s’appuie sur les techniques de puces à ADN et expression génique. Les résultats de DE alimentent également l’analyse d’enrichissement de ensembles de gènes (GSEA) pour identifier les voies et catégories fonctionnelles affectées.