Überblick
Der Variantenaufruf ist der computergestützte Prozess der Identifizierung von Unterschieden zwischen dem Genom eines Individuums und einem Referenzgenom. Diese Unterschiede reichen von Einzelnukleotid-Polymorphismen (SNPs) und kleinen Insertionen oder Deletionen (Indels) bis hin zu großen strukturellen Varianten wie Kopienzahlveränderungen und chromosomalen Rearrangements. Die genaue Erkennung von Varianten ist der Eckpfeiler der Humangenetik, der Präzisionsmedizin und der Evolutionsbiologie. Der Prozess erfordert sorgfältige statistische Modellierung, um echte biologische Variation von Sequenzierungsfehlern und Alignment-Artefakten zu unterscheiden.
Schlüsselkonzepte
Die meisten Varianten-Caller folgen einem gemeinsamen Arbeitsablauf: Sequenzierungs-Reads werden zunächst mit Werkzeugen wie BWA oder Bowtie2 auf ein Referenzgenom aligniert, dann werden die alignierten Daten verarbeitet, um Positionen zu identifizieren, an denen die Sequenz des Individuums von der Referenz abweicht. Die Genome Analysis Toolkit (GATK)-Best-Practices-Pipeline wird weithin eingesetzt und verwendet einen Bayes’schen Ansatz zur Berechnung von Genotyp-Wahrscheinlichkeiten. Wichtige Überlegungen umfassen die Abdeckungstiefe (höhere Tiefe verbessert die Zuversicht), Basenqualitätswerte und Kartierungsqualität. Die Variantenfilterung mittels harter Schwellenwerte oder maschinellem Lernen (z. B. VQSR) entfernt falsch-positive Ergebnisse. Die Erkennung struktureller Varianten erfordert spezialisierte Werkzeuge wie DELLY oder Manta, die diskordante Read-Paare und Split-Reads analysieren.
Anwendungen
Der Variantenaufruf treibt sowohl die klinische als auch die Forschungsgenomik voran. Er identifiziert Mutationen, die seltenen genetischen Erkrankungen zugrunde liegen, und liefert Erkenntnisse für die Krebsgenomik durch die Aufdeckung somatischer Mutationen in Tumor-Normal-Vergleichen. Populationsbezogene Projekte wie das 1000-Genome-Projekt haben Millionen von Varianten zur Kartierung der menschlichen Vielfalt katalogisiert. In der Infektionskrankheitsforschung verfolgt der Variantenaufruf die Pathogenevolution und Arzneimittelresistenz. Die Genauigkeit des Variantenaufrufs hängt grundlegend von der Qualität der Next-Generation Sequencing-Daten und der verwendeten DNA-Sequenzierungs-Plattform ab.