Skip to content

Article image
Hidden-Markov-Modelle in der Sequenzanalyse

Überblick

Ein Hidden-Markov-Modell (HMM) ist ein statistisches Modell, das eine Sequenz beobachtbarer Ereignisse als von einer zugrundeliegenden Sequenz unbeobachteter (verborgener) Zustände erzeugt darstellt. In der Bioinformatik modellieren HMMs biologische Sequenzen, bei denen die verborgenen Zustände Exon/Intron-Grenzen, Elemente der Prote insekundärstruktur oder konservierte Spalten in einem multiplen Sequenzalignment darstellen können. Die Stärke des HMM-Rahmenwerks liegt in seiner Fähigkeit, positionsspezifische Konservierungsmuster, Insertionen und Deletionen durch eine einheitliche probabilistische Architektur zu erfassen, die anhand bekannter Beispiele trainiert wird.

Schlüsselkonzepte

Ein HMM wird durch drei Parametersätze definiert: Übergangswahrscheinlichkeiten zwischen verborgenen Zuständen, Emissionswahrscheinlichkeiten der Beobachtung eines Symbols aus jedem Zustand und Anfangszustandswahrscheinlichkeiten. Der Viterbi-Algorithmus findet die wahrscheinlichste Sequenz verborgener Zustände für eine gegebene Beobachtung — zum Beispiel die wahrscheinlichste Genstruktur für eine genomische DNA-Sequenz. Der Forward-Backward-Algorithmus berechnet die Posterior-Wahrscheinlichkeit jedes Zustands an jeder Position, die zur Bewertung der Vorhersagekonfidenz verwendet werden kann. Profil-HMMs, die aus multiplen Sequenzalignments erstellt werden, modellieren Proteindomänenfamilien. Das HMMER-Softwarepaket verwendet Profil-HMMs für die empfindliche Erkennung entfernter Homologe und übertrifft BLAST für divergierende Sequenzen.

Anwendungen

HMMs werden für die Genvorhersage in prokaryotischen und eukaryotischen Genomen verwendet und identifizieren Spleißstellen und kodierende Regionen. Profil-HMMs klassifizieren Proteine in Familien und Superfamilien und unterstützen die Proteinstruktur-Vorhersage und funktionelle Annotation. Sie modellieren die Substratspezifität in der Enzymklassifikation und -nomenklatur und erkennen regulatorische Elemente in der DNA-Struktur und -Topologie. In der Metagenomik weisen HMMs Fragmenten unbekannter Herkunft funktionelle Rollen zu.