Skip to content

Article image
Genomannotation: Identifizierung funktioneller Elemente

Überblick

Die Genomannotation ist der Prozess der Zuordnung biologischer Bedeutung zur Rohsequenz eines assemblierten Genoms. Sie identifiziert die Positionen von Genen, deren Exon-Intron-Grenzen, regulatorische Sequenzen, repetitive Elemente und nicht-kodierende RNAs. Die Annotation überbrückt die Kluft zwischen einer statischen DNA-Sequenz und den dynamischen biologischen Funktionen, die sie kodiert. Sowohl computergestützte Vorhersagen als auch experimentelle Belege werden integriert, um eine umfassende Karte genomischer Merkmale zu erstellen. Da die Genomsequenzierung immer schneller und günstiger wird, ist der Annotations-Engpass — die Umwandlung von Sequenzdaten in biologische Erkenntnisse — zunehmend kritischer geworden.

Methoden

Annotationsstrategien lassen sich in drei Kategorien einteilen. Die Ab-initio-Vorhersage verwendet statistische Modelle der Genstruktur (wie Hidden-Markov-Modelle), um kodierende Regionen direkt aus der Sequenzzusammensetzung zu identifizieren. Die homologiebasierte Annotation aligniert Expressed Sequence Tags, Proteine oder RNA-seq-Reads derselben oder verwandter Arten, um Genstrukturen abzuleiten. Die vergleichende Annotation nutzt evolutionäre Konservierung über mehrere Arten hinweg, um funktionelle Elemente zu lokalisieren. Pipelines wie die NCBI Eukaryotic Genome Annotation Pipeline kombinieren alle drei Ansätze, gefolgt von manueller Kuratierung zur Klärung mehrdeutiger Fälle. Die Qualität wird anhand von Metriken wie der Annotation Edit Distance (AED) bewertet.

Anwendungen

Eine genaue Annotation ist für die Interpretation von Sequenzierungsprojekten unerlässlich. In der biomedizinischen Forschung ermöglicht sie die Entdeckung krankheitsverursachender Mutationen, indem sie aufzeigt, welche Genomregionen Proteine oder regulatorische Elemente kodieren. Die Agrargenomik nutzt Annotation, um Gene mit Merkmalen wie Ertrag und Stresstoleranz zu verknüpfen. Verfahren wie die Rekombinante DNA-Technologie sind für Klonierung und Expression auf verlässliche Genmodelle angewiesen. Die Annotation unterstützt auch die Bakteriengenetik durch die Identifizierung von Operons und Virulenzfaktoren, während Studien zur Genregulation und Epigenetik auf den präzisen Koordinaten von Promotoren, Enhancern und anderen regulatorischen Merkmalen beruhen.