Présentation
La détection de variants est le processus computationnel d’identification des différences entre le génome d’un individu et un génome de référence. Ces différences vont des polymorphismes nucléotidiques simples (SNPs) et des petites insertions ou délétions (indels) aux grands variants structuraux tels que les variations du nombre de copies et les réarrangements chromosomiques. La détection précise des variants est la pierre angulaire de la génétique humaine, de la médecine de précision et de la biologie évolutive. Le processus nécessite une modélisation statistique rigoureuse pour distinguer la variation biologique réelle des erreurs de séquençage et des artefacts d’alignement.
Concepts clés
La plupart des détecteurs de variants suivent un flux de travail commun : les lectures de séquençage sont d’abord alignées sur un génome de référence à l’aide d’outils tels que BWA ou Bowtie2, puis les données alignées sont traitées pour identifier les positions où la séquence de l’individu diffère de la référence. Le pipeline genome analysis toolkit (GATK) selon les bonnes pratiques est largement adopté, utilisant une approche bayésienne pour calculer les vraisemblances génotypiques. Les considérations clés incluent la profondeur de couverture (une profondeur plus élevée améliore la confiance), les scores de qualité de base et la qualité d’alignement. Le filtrage des variants par seuils stricts ou apprentissage automatique (par exemple, VQSR) élimine les faux positifs. La détection des variants structuraux nécessite des outils spécialisés comme DELLY ou Manta qui analysent les paires de lectures discordantes et les lectures divisées.
Applications
La détection de variants est au cœur de la génomique clinique et de recherche. Elle identifie les mutations à l’origine de troubles génétiques rares et éclaire la génomique du cancer en révélant les mutations somatiques dans les comparaisons tumeur-normal. Les projets à l’échelle de la population tels que le 1000 Genomes Project ont catalogué des millions de variants pour cartographier la diversité humaine. Dans les maladies infectieuses, la détection de variants suit l’évolution des pathogènes et la résistance aux médicaments. La précision de la détection des variants dépend fondamentalement de la qualité des données de séquençage de nouvelle génération et de la plateforme de séquençage de l’ADN utilisée.