Skip to content

Article image
RNA-Seq 分析:定量基因表达

概述

RNA 测序(RNA-seq)已成为测量基因表达的标准方法,取代了早期基于杂交的方法。通过将 RNA 分子转化为 cDNA 文库并测序数百万个片段,RNA-seq 同时提供了生物样本中转录本的身份和丰度。与微阵列不同,RNA-seq 无需预先探针设计即可检测新的转录本、剪接变体和非编码 RNA。该技术提供跨越数个数量级的动态范围和单碱基分辨率。RNA-seq 数据支撑着从模式生物到临床标本的大多数现代转录组学研究。

关键概念

RNA-seq 分析流程从原始测序读段开始,这些读段经过质控(FastQC)、接头修剪(Trimmomatic 或 Cutadapt)以及使用 splice-aware 比对器(如 STAR 或 HISAT2)比对到参考基因组。基因或转录本水平的定量由 featureCounts、RSEM 或 Salmon 等工具执行。表达值标准化为 FPKM、RPKM 或 TPM,以考虑测序深度和转录本长度。可变剪接和新转录本的检测需要 Cufflinks 或 StringTie 等专门工具,它们从比对读段组装转录本。质量指标包括比对率、读段在基因特征上的分布以及饱和分析。

应用

RNA-seq 应用于几乎所有生物学领域。它分析疾病与健康组织之间的基因表达变化,识别癌症亚型的生物标志物,并追踪发育基因表达程序。在微生物学中,RNA-seq 揭示对抗生素和环境胁迫的转录反应。该技术直接建立在 RNA 测序方法之上,并经常与下一代测序工作流程集成。RNA-seq 还能够发现新型 RNA 结构与类型,包括长链非编码 RNA 和环状 RNA,扩展了我们对转录组复杂性的理解。