Skip to content

Article image
Analyse des données de puces à ADN

Présentation

L’analyse des données de puces à ADN transforme les intensités de fluorescence brutes issues de puces hybridées en mesures significatives d’expression génique. Bien que le RNA-seq ait largement supplanté les puces pour les études exploratoires, les puces à ADN restent largement utilisées en diagnostic clinique, en amélioration des plantes et dans les études de grandes populations en raison de leur faible coût, de leurs protocoles standardisés et de leurs pipelines d’analyse bien établis. Une seule puce à ADN peut mesurer l’expression de dizaines de milliers de transcrits simultanément en exploitant l’appariement complémentaire des bases entre l’ADNc de l’échantillon et les sondes immobilisées. Le flux de travail d’analyse aborde les caractéristiques techniques uniques des données de puces, notamment la correction du bruit de fond, la normalisation et la synthèse au niveau des sondes.

Méthodes

L’analyse des puces commence par le traitement d’image pour extraire les intensités au niveau des sondes. La correction du bruit de fond élimine le signal non spécifique à l’aide de méthodes telles que le robust multi-array average (RMA) ou l’ajustement du contenu GC. La normalisation rend les puces comparables : la normalisation quantile est l’approche la plus courante pour les puces monocolore, tandis que la normalisation loess est appliquée aux designs bicolores. La synthèse des sondes (pour les puces Affymetrix, avec RMA ou PLIER) combine plusieurs sondes par gène en une seule valeur d’expression. L’évaluation de la qualité utilise des pseudo-images, des graphiques NUSE et RLE pour identifier les puces problématiques. L’expression différentielle est testée avec limma, qui utilise une modération bayésienne empirique pour stabiliser les estimations de variance entre les gènes. Les effets de lot sont détectés par analyse en composantes principales et corrigés à l’aide de ComBat ou de removeBatchEffect de limma.

Applications

Malgré l’essor du séquençage, les puces à ADN continuent d’apporter de la valeur. Les tests MammaPrint et Oncotype DX approuvés par la FDA utilisent des puces pour le pronostic du cancer du sein. Les panels cliniques de puces à ADN et expression génique guident les décisions thérapeutiques en oncologie et le diagnostic des maladies rares. L’analyse des données de puces soutient également la validation des résultats de qPCR par des études de corrélation avec la qPCR et complète le séquençage de l’ADN en profilant l’expression à grande échelle. En génomique agricole, les puces permettent une cartographie de caractères et une sélection assistée par marqueurs rentables au sein de grandes populations de sélection.