Skip to content

Article image
蛋白质组学信息学:分析蛋白质数据

概述

蛋白质组学信息学是将原始质谱数据转化为关于蛋白质的生物学知识的计算学科。它应对蛋白质组的巨大复杂性——数千种蛋白质,每种都可能携带多种翻译后修饰、剪接变体和降解产物。该领域开发用于肽段鉴定、蛋白质推断、定量和统计验证的算法。通过将谱信号转化为已鉴定和定量的蛋白质,蛋白质组学信息学使研究人员能够提出关于细胞功能、疾病机制和药物反应的系统级问题。

关键概念

该领域的核心是数据库搜索范式,其中实验串联质谱与源自蛋白质序列数据库的理论谱进行比较。SEQUEST、Mascot 和 MS-GF+ 等算法使用考虑碎片离子系列和前体质量的打分函数分配肽段-谱图匹配(PSMs)。通过 target-decoy 搜索进行的错误发现率(FDR)估计控制鉴定结果的错误率。蛋白质推断使用简约原则和贝叶斯方法解决共享肽段的问题——即多个蛋白质共有的肽段。

应用

蛋白质组学信息学应用于生物标志物发现,其中挖掘健康和患病组织之间的差异蛋白质表达以寻找诊断候选物。它通过分析化合物处理后的蛋白质丰度变化来支持药物靶点识别。该领域还为翻译后修饰的表征提供动力,并与蛋白质组学与质谱分析工作流程集成。来自质谱实验的数据通过流程处理,这些流程还整合了蛋白质提取与纯化的结果,以确保样本质量反映在最终分析中。