Überblick
Die differentielle Expressionsanalyse (DE-Analyse) ist der statistische Kern der Transkriptomik. Sie bestimmt, welche Gene aussagekräftige Expressionsveränderungen zwischen experimentellen Bedingungen aufweisen. Ob beim Vergleich von behandelten versus unbehandelten Zellen, Tumor versus Normalgewebe oder Zeitverlaufsproben — die DE-Analyse wandelt rohe Zähldaten in biologische Erkenntnisse um. Die Herausforderung liegt darin, echte biologische Signale von technischem Rauschen zu unterscheiden und dabei die Belastung durch multiples Testen zu berücksichtigen, die genomweiten Messungen innewohnt. Moderne DE-Methoden verwenden ausgefeilte statistische Modelle, die umfassend an realen und simulierten Datensätzen evaluiert wurden.
Methoden
Die DE-Analyse beginnt typischerweise mit einer Zählmatrix der Reads pro Gen pro Probe. Normalisierungsmethoden (TMM, RLE oder Quantil-Normalisierung) passen Bibliotheksgröße und Zusammensetzungsverzerrungen an. Zu den beliebten Werkzeugen gehören DESeq2, das Zählungen mit einer negativen Binomialverteilung modelliert und Shrinkage-Schätzung für die Dispersion verwendet; edgeR, das empirische Bayes-Methoden einsetzt; und limma-voom, das lineare Modellierung auf log-transformierte Zählungen mit Präzisionsgewichten anwendet. Für Nicht-Modellorganismen oder Experimente ohne Referenzgenom führen Werkzeuge wie Sailfish oder Kallisto eine alignierungsfreie Quantifizierung durch. Ergebnisse werden als log2-Faltenänderungen und adjustierte p-Werte (Benjamini-Hochberg-Korrektur) zusammengefasst. Hauptkomponentenanalyse (PCA) und Heatmaps bieten globale Ansichten der Expressionsmuster.
Anwendungen
Die DE-Analyse ist zentral für praktisch jede Transkriptomik-Studie. Sie identifiziert Biomarker für Krankheitsdiagnose und -prognose, deckt Wirkmechanismen von Medikamenten auf und charakterisiert zelluläre Antworten auf Umweltreize. Im klinischen Bereich kann die DE-Analyse von Patientenbiopsien Krebserkrankungen für eine gezielte Therapie stratifizieren. Die Methode ist eng mit RT-PCR-Validierungsexperimenten verwandt, die Kandidatengene bestätigen, und baut auf DNA-Microarrays und Genexpression-Techniken auf. DE-Ergebnisse versorgen auch die Gen-Set-Anreicherungsanalyse (GSEA) zur Identifizierung betroffener Signalwege und funktioneller Kategorien.