Skip to content

Article image
蛋白质组学中的质谱数据分析

概述

质谱数据分析是将质谱仪的原始谱文件转换为已识别和定量的肽段与蛋白质列表的计算流程。原始数据经过预处理步骤——噪声过滤、质心化、电荷状态分配和峰检测——然后进行肽段鉴定。最终蛋白质列表的质量和深度关键取决于采集方法和所采用的计算策略。现代蛋白质组学实验常规生成数百万张谱图,使得稳健的自动化分析流程对于从数据中提取生物学意义至关重要。

方法

数据库搜索将实验串联质谱与从蛋白质序列数据库计算机模拟生成的理论谱进行匹配。SEQUEST、Andromeda 和 Comet 等搜索引擎使用互相关或基于概率的打分来对肽段-谱图匹配进行排序。从头测序直接根据谱图重建肽段序列而无需数据库,这对于基因组未测序的生物体或识别新肽段很有价值。谱图库搜索等混合方法针对先前已识别和验证的谱图进行匹配,为已知肽段提供更高的灵敏度。所有方法都需要严格错误发现率估计,通常使用 target-decoy 策略。

应用

质谱数据分析是每个蛋白质组学实验的基础。它支持通过 SDS-PAGEHPLC 分离的蛋白质鉴定,是现代蛋白质组学与质谱分析工作流程的计算引擎。临床蛋白质组学依赖这些分析流程来发现生物标志物候选物,而质谱仪器的进步继续推动着更快、更准确数据解释的新算法开发。