概述
微阵列数据分析将杂交微阵列的原始荧光强度转化为有意义的基因表达测量值。虽然 RNA-seq 在很大程度上已取代微阵列用于发现性研究,但由于其成本低、标准化方案和完善的分析流程,微阵列在临床诊断、植物育种和大型群体研究中仍然广泛使用。单个微阵列可以通过样本 cDNA 与固定探针之间的互补碱基配对同时测量数万个转录本的表达。分析工作流程处理微阵列数据的独特技术特性,包括背景校正、标准化和探针水平汇总。
方法
微阵列分析从图像处理提取探针水平强度开始。背景校正使用稳健多阵列平均(RMA)或 GC 含量校正等方法去除非特异性信号。标准化使阵列之间具有可比性:分位数标准化是单色阵列最常用的方法,而 loess 标准化应用于双色设计。探针汇总(对于 Affymetrix 阵列,使用 RMA 或 PLIER)将每个基因的多个探针合并为单个表达值。质量评估使用伪图像、NUSE 图和 RLE 图来识别有问题的阵列。使用 limma 进行差异表达检验,该工具通过经验贝叶斯调整来稳定跨基因的方差估计。批次效应通过主成分分析检测,并使用 ComBat 或 limma 的 removeBatchEffect 进行校正。
应用
尽管测序技术兴起,微阵列仍在持续提供价值。FDA 批准的 MammaPrint 和 Oncotype DX 检测使用微阵列进行乳腺癌预后。临床 DNA 微阵列与基因表达面板指导肿瘤学治疗决策和罕见病诊断。微阵列数据分析还通过 qPCR 相关性研究支持 qPCR 结果的验证,并通过大规模表达分析补充 DNA 测序。在农业基因组学中,微阵列能够在大型育种群体中进行经济高效性状定位和标记辅助选择。