Überblick
Das Sequenzalignment ist die grundlegende Operation der Bioinformatik. Es ordnet zwei oder mehr biologische Sequenzen nebeneinander an, um Ähnlichkeitsregionen zu identifizieren, die funktionelle, strukturelle oder evolutionäre Beziehungen widerspiegeln können. Das paarweise Alignment vergleicht genau zwei Sequenzen und bildet die Grundlage für die Datenbanksuche, das Primer-Design und die phylogenetische Inferenz. Das Alignment-Problem wird durch dynamische Programmieralgorithmen gelöst — Needleman-Wunsch für globales Alignment und Smith-Waterman für lokales Alignment — die den optimalen Bewertungspfad durch eine Matrix von Match-, Mismatch- und Lückenstrafen finden.
Schlüsselkonzepte
Alignments werden als global oder lokal klassifiziert. Das globale Alignment erzwingt eine Ausrichtung über die gesamte Länge beider Sequenzen und ist am besten für eng verwandte Sequenzen ähnlicher Länge geeignet. Das lokale Alignment identifiziert kurze, konservierte Regionen und ist ideal für die Erkennung gemeinsamer Domänen zwischen divergierenden Sequenzen. Substitutionsmatrizen wie BLOSUM62 und PAM250 liefern Log-Odds-Scores für jeden möglichen Aminosäureaustausch, während DNA-Alignments typischerweise einfache Match/Mismatch-Scores verwenden. Lückenstrafen — oft eine Kombination aus Lückeneröffnungs- und Lückenverlängerungsstrafe — verhindern übermäßige Insertionen oder Deletionen. Heuristische Werkzeuge wie BLAST tauschen garantierte Optimalität gegen Geschwindigkeit ein, indem sie Alignments mit exakten Worttreffern initiieren.
Anwendungen
Das paarweise Alignment wird täglich in der Molekularbiologie verwendet. Es untermauert das Primer-Design der Polymerase-Kettenreaktion durch Überprüfung der Primer-Template-Komplementarität, validiert DNA-Sequenzierungs-Ergebnisse durch Alignment von Reads an Referenzgenomen und identifiziert konservierte Reste in der Proteinstruktur-Vorhersage. Die vergleichende Genomik stützt sich auf Alignment, um horizontalen Gentransfer in der Bakteriengenetik zu erkennen, und die Restriktionsstellenkartierung verwendet Alignment zur Vorhersage von Restriktionsenzymverdauungs-Mustern.