Skip to content

Article image
全基因组关联研究 (GWAS)

概述

全基因组关联研究(GWAS)是一种大规模分析,扫描数千个个体的基因组,以识别与特定性状或疾病相关的遗传变异。通过比较病例组和对照组之间的等位基因频率,GWAS 能够精确定位促成复杂表型(如身高、糖尿病或心血管疾病)的基因组位点。该方法是假设无关性的——它在没有预设涉及哪些基因的前提下检查数百万个 SNPs。自 2005 年首次里程碑式 GWAS 以来,该方法已发现了数万个与性状相关的位点。

方法

典型的 GWAS 经历几个阶段。首先,使用 SNP 芯片或 DNA 测序对研究参与者进行基因分型。经过质量控制(按检出率、哈迪-温伯格平衡和最小等位基因频率过滤 SNPs)后,数据通过参考面板进行插补以推断未分型的变异。关联检验使用逻辑回归或校正群体分层的线性混合模型进行。严格的全基因组显著性阈值(p < 5 × 10⁻⁸)考虑了对数百万个 SNPs 的多重检验校正。结果在曼哈顿图中可视化,显示染色体位置与显著性的关系,Q-Q 图评估系统性偏倚。

应用

GWAS 改变了我们对常见疾病遗传学的理解。它已识别出数百个与 2 型糖尿病、冠状动脉疾病和自身免疫性疾病相关的位点,其中许多指向意想不到的生物学通路。在癌症研究中,GWAS 位点揭示了新的易感基因和潜在的癌症生物化学靶点。然而,将 GWAS 信号转化为因果机制仍具有挑战性,因为大多数关联变异位于非编码区域。GWAS 后分析包括精细定位、功能注释和孟德尔随机化,以建立因果关系并探索临床生物化学相关性。