Überblick
Die RNA-Sequenzierung (RNA-seq) hat sich als Standardmethode zur Messung der Genexpression etabliert und frühere hybridisierungsbasierte Ansätze abgelöst. Durch die Umwandlung von RNA-Molekülen in eine cDNA-Bibliothek und die Sequenzierung von Millionen von Fragmenten liefert RNA-seq sowohl die Identität als auch die Häufigkeit von Transkripten in einer biologischen Probe. Im Gegensatz zu Microarrays kann RNA-seq neue Transkripte, Spleißvarianten und nicht-kodierende RNAs ohne vorheriges Sonden-Design erkennen. Die Technik bietet einen Dynamikbereich über mehrere Größenordnungen und Einzelbasenauflösung. RNA-seq-Daten bilden die Grundlage der meisten modernen Transkriptomik-Studien, von Modellorganismen bis hin zu klinischen Proben.
Schlüsselkonzepte
Die RNA-seq-Analysepipeline beginnt mit rohen Sequenzierungsreads, die eine Qualitätskontrolle (FastQC), Adapter-Trimmung (Trimmomatic oder Cutadapt) und das Alignment auf ein Referenzgenom mithilfe Spleiß-bewusster Aligner wie STAR oder HISAT2 durchlaufen. Die Quantifizierung auf Gen- oder Transkriptebene erfolgt mit Werkzeugen wie featureCounts, RSEM oder Salmon. Expressionswerte werden als FPKM, RPKM oder TPM normalisiert, um Sequenzierungstiefe und Transkriptlänge zu berücksichtigen. Die Erkennung von alternativem Spleißen und neuen Transkripten erfordert spezialisierte Werkzeuge wie Cufflinks oder StringTie, die Transkripte aus alignierten Reads assemblieren. Zu den Qualitätsmetriken gehören Kartierungsraten, die Read-Verteilung über Genmerkmale und Sättigungsanalysen.
Anwendungen
RNA-seq wird in nahezu allen Bereichen der Biologie eingesetzt. Sie profiliert Genexpressionsveränderungen in krankem versus gesundem Gewebe, identifiziert Biomarker für Krebs-Subtypen und verfolgt entwicklungsbedingte Genexpressionsprogramme. In der Mikrobiologie deckt RNA-seq transkriptionelle Antworten auf Antibiotika und Umweltstress auf. Die Technik baut direkt auf RNA-Sequenzierung-Methoden auf und wird häufig in Next-Generation Sequencing-Workflows integriert. RNA-seq ermöglicht auch die Entdeckung neuer RNA-Strukturen und -Typen, darunter lange nicht-kodierende RNAs und zirkuläre RNAs, und erweitert so unser Verständnis der Komplexität des Transkriptoms.