Überblick
Die Motivfindung ist die computergestützte Identifizierung kurzer, wiederkehrender Sequenzmuster in DNA-, RNA- oder Proteinsequenzen, die funktionellen Elementen wie Transkriptionsfaktor-Bindungsstellen, Spleißstellen, Erkennungsstellen für RNA-bindende Proteine oder Proteininteraktionsdomänen entsprechen. Im Gegensatz zum globalen Alignment konzentriert sich die Motivfindung auf kleine Fenster — typischerweise 6–20 Nukleotide oder 3–15 Aminosäuren — in denen die positionsbezogene Konservierung hoch ist, selbst wenn die umgebende Sequenz divergiert. Diese Motive werden oft als Positionsgewichtsmatrizen (PWMs) dargestellt, die die Häufigkeit jedes Nukleotids oder jeder Aminosäure an jeder Position erfassen.
Methoden
Eine Reihe von Algorithmen befasst sich mit der Motivfindung. Konsensusbasierte Methoden zählen alle möglichen Wörter auf und melden diejenigen, die häufiger als zufällig erwartet vorkommen. Probabilistische Ansätze wie MEME verwenden Erwartungs-Maximierung, um ein Mischmodell anzupassen, das Motiv-enthaltende von Hintergrundsequenzen trennt. Gibbs-Sampling-Methoden, implementiert in Werkzeugen wie BioProspector, durchsuchen stochastisch den Sequenzraum, um überrepräsentierte Muster zu finden. Phylogenetisches Footprinting nutzt die Konservierung über verwandte Arten hinweg, um regulatorische Elemente unter reinigender Selektion zu identifizieren. Chromatin-Immunpräzipitation gefolgt von Sequenzierung (ChIP-seq) liefert experimentell abgeleitete Peakregionen, die die Motivfindung zu relevanten genomischen Loci führen.
Anwendungen
Die Motivfindung ist zentral für das Verständnis der Genregulation und Epigenetik. Sie identifiziert die Bindungsstellen für Transkriptionsfaktoren, die die Transkription und RNA-Prozessierung steuern. In der synthetischen Biologie werden entdeckte Motive verwendet, um synthetische Promotoren mit vorhersagbaren Expressionsstärken zu entwerfen. Die Analyse der DNA-Struktur und -Topologie zeigt, dass bestimmte Motive bevorzugt Sekundärstrukturen wie G-Quadruplexe bilden, die die Transkription und Replikation regulieren.