Skip to content

Article image
可变剪接分析

概述

可变剪接是一种基本机制,单个基因通过该机制可以产生多种 mRNA 异构体,大大扩展了基因组的编码能力。近 95% 的人类多外显子基因经历可变剪接,产生具有不同甚至相反功能的独特蛋白质产物。外显子包含或排除的选择受到严格调控且具有组织特异性。可变剪接分析旨在跨条件、发育阶段或疾病状态识别和定量这些异构体水平的差异,揭示超出简单表达变化的另一层基因调控。

方法

从 RNA-seq 数据中检测可变剪接事件需要专门的计算方法。异构体定量工具(如 Salmon、Kallisto 或 RSEM)估计每个已知转录本异构体的丰度。基于事件的工具(rMATS、MAJIQ 或 SUPPA2)将剪接事件分类为:盒式外显子跳跃、互斥外显子、可变 5’ 或 3’ 剪接位点以及内含子保留。这些工具使用比对到剪接连接点与外显子的读段计数矩阵,并通过配对统计模型检验显著差异。从头剪接检测(通过 StringTie 或 Cufflinks)在无注释的情况下组装转录本以发现新的异构体。使用 sashimi 图(来自 MISO 或 IGV)可视化剪接差异有助于解释复杂模式。

应用

可变剪接失调是许多疾病的标志。在癌症中,剪接因子经常发生突变,产生驱动增殖和转移的肿瘤特异性异构体。脊髓性肌萎缩症和额颞叶痴呆等神经系统疾病直接由剪接缺陷引起。理解剪接模式有助于解释RNA 结构与类型,并建立在转录与 RNA 加工概念的基础之上。剪接分析还与基因调控与表观遗传学相交织,因为染色质状态影响共转录剪接位点选择,而剪接反馈可以调控转录延伸。