Présentation
Le séquençage de l’ARN (RNA-seq) est devenu la méthode standard de mesure de l’expression génique, remplaçant les approches antérieures basées sur l’hybridation. En convertissant les molécules d’ARN en une bibliothèque d’ADNc et en séquençant des millions de fragments, le RNA-seq fournit à la fois l’identité et l’abondance des transcrits dans un échantillon biologique. Contrairement aux puces à ADN, le RNA-seq peut détecter de nouveaux transcrits, des variants d’épissage et des ARN non codants sans conception préalable de sondes. La technique offre une gamme dynamique s’étendant sur plusieurs ordres de grandeur et une résolution monocouche. Les données de RNA-seq sous-tendent la plupart des études transcriptomiques modernes, des organismes modèles aux échantillons cliniques.
Concepts clés
Le pipeline d’analyse RNA-seq commence par les lectures de séquençage brutes, qui subissent un contrôle qualité (FastQC), un rognage des adaptateurs (Trimmomatic ou Cutadapt) et un alignement sur un génome de référence à l’aide d’aligneurs tenant compte de l’épissage comme STAR ou HISAT2. La quantification au niveau du gène ou du transcrit est effectuée par des outils comme featureCounts, RSEM ou Salmon. Les valeurs d’expression sont normalisées en FPKM, RPKM ou TPM pour tenir compte de la profondeur de séquençage et de la longueur des transcrits. La détection de l’épissage alternatif et des nouveaux transcrits nécessite des outils spécialisés comme Cufflinks ou StringTie, qui assemblent les transcrits à partir des lectures alignées. Les métriques de qualité incluent les taux d’alignement, la distribution des lectures entre les éléments géniques et l’analyse de saturation.
Applications
Le RNA-seq est appliqué dans pratiquement tous les domaines de la biologie. Il profile les changements d’expression génique entre tissus sains et malades, identifie des biomarqueurs pour les sous-types de cancer et suit les programmes d’expression génique développementale. En microbiologie, le RNA-seq révèle les réponses transcriptionnelles aux antibiotiques et au stress environnemental. La technique s’appuie directement sur les méthodes de séquençage de l’ARN et est fréquemment intégrée aux workflows de séquençage de nouvelle génération. Le RNA-seq permet également la découverte de nouvelles structures et types d’ARN, y compris les longs ARN non codants et les ARN circulaires, élargissant notre compréhension de la complexité du transcriptome.