Skip to content

Article image
Transkriptomassemblierung: Rekonstruktion von RNA-Sequenzen

Überblick

Die Transkriptomassemblierung ist die computergestützte Rekonstruktion exprimierter Transkriptsequenzen aus RNA-seq-Reads, die entweder mit oder ohne Referenzgenom durchgeführt wird. Für Organismen ohne sequenziertes Genom ist die De-novo-Transkriptomassemblierung die einzige Option und bietet den ersten Einblick in das kodierende Potenzial eines Organismus. Selbst wenn ein Referenzgenom verfügbar ist, kann die Transkriptomassemblierung neue Isoformen, Fusions Transkripte und Sequenzen aus schlecht assemblierten Genomregionen erfassen. Das assemblierte Transkriptom dient als Grundlage für nachgelagerte Analysen wie Expressionsquantifizierung, funktionelle Annotation und vergleichende Studien.

Methoden

Die De-novo-Transkriptomassemblierung verwendet Assemblierungsalgorithmen, die für ungleichmäßige Abdeckung und alternatives Spleißen ausgelegt sind. Zu den beliebten Werkzeugen gehören Trinity, das einen De-Bruijn-Graph-Ansatz mit mehreren k-mer-Größen verwendet; rnaSPAdes, das von der Genomassemblierung adaptiert wurde; und SOAPdenovo-Trans. Diese Werkzeuge assemblieren Reads zu Contigs, die Transkriptfragmente repräsentieren, gruppieren dann verwandte Contigs in Isoformgruppen und lösen vollständige Transkripte auf. Referenzgeführte Assembler (StringTie, Cufflinks) nutzen Spleiß-bewusste Alignments auf das Genom und assemblieren überlappende Reads zu Transkriptmodellen. Wichtige Qualitätsmetriken umfassen die Assemblierungsvollständigkeit (BUSCO-Werte gegen konservierte Orthologe), die N50-Länge und die Anzahl der wiederhergestellten Volllängen-Transkripte. Die Redundanzreduktion mit CD-HIT oder Corset gruppiert hochgradig ähnliche Transkripte.

Anwendungen

Die Transkriptomassemblierung ermöglicht die Genentdeckung in Nicht-Modellorganismen, von landwirtschaftlichen Nutzpflanzen bis hin zu wenig erforschten Meeresarten. Sie identifiziert differentiell exprimierte Gene, gewebespezifische Isoformen und Fusions Transkripte bei Krebs. Die Technik ist unerlässlich, wenn RNA-Sequenzierung-Daten von Organismen ohne Referenz stammen, und integriert sich tief in Next-Generation Sequencing-Workflows. Assemblierte Transkriptome tragen auch zu Evolutionsstudien bei, indem sie artübergreifende Vergleiche von RNA-Strukturen und -Typen ermöglichen. Da die Long-Read-Sequenzierung (Iso-Seq, Oxford Nanopore) besser wird, produzieren hybride Assemblierungsstrategien, die kurze und lange Reads kombinieren, vollständigere und genauere Transkriptome als je zuvor.