染色体是遗传信息的物理载体,由紧紧包裹在组蛋白周围的长 DNA 分子组成。 DNA 分层组织成染色体对于将基因组装入细胞核、调节基因表达以及确保细胞分裂过程中染色体的准确分离至关重要。
DNA 包装和核小体
染色质的基本单位是核小体,由大约 147 个碱基对的 DNA 组成,包裹着核心组蛋白的八聚体(H2A、H2B、H3 和 H4 各两个拷贝)。核小体通过 20 至 90 个碱基对的接头 DNA 片段连接,组蛋白 H1 结合在核小体的入口和出口点以稳定高阶折叠。这种串珠结构代表了 10 nm 纤维,这是 DNA 压缩的第一级,可将 DNA 的长度减少大约七倍。组蛋白富含碱性氨基酸(赖氨酸和精氨酸),可中和 DNA 主链的负电荷,其 N 末端尾部从核小体伸出,进行翻译后修饰,调节染色质结构。
高阶染色质结构
10 nm 纤维进一步卷绕成 30 nm 纤维,通过组蛋白 H1 分子和核心组蛋白尾部结构域之间的相互作用来稳定。该结构被组织成拓扑相关结构域 (TAD),即大约 100 kb 至 1 Mb 的基因组区域,其中 DNA 序列彼此之间的相互作用比结构域外的序列更频繁。 TAD 边界由 CTCF(CCCTC 结合因子)和粘连蛋白复合物建立,它们共同形成环结构,促进增强子-启动子相互作用,同时防止相邻结构域之间不适当的串扰。除了 TAD 之外,染色质还分为活性 A 区室(常染色质)和非活性 B 区室(异染色质),每个区室都具有不同的生化特性和核位置。
常染色质和异染色质
常染色质浓缩程度较低、基因丰富且具有转录活性,其特征是组蛋白修饰,例如启动子区域的 H3 赖氨酸 4 三甲基化 (H3K4me3) 和沿基因体的 H3 赖氨酸 36 三甲基化 (H3K36me3)。异染色质密集,转录沉默,可分为两种形式。组成型异染色质永久浓缩在着丝粒和端粒等区域,富含 H3 赖氨酸 9 三甲基化 (H3K9me3),并与异染色质蛋白 1 (HP1) 结合。兼性异染色质被条件性沉默,例如雌性哺乳动物中的失活 X 染色体,并以 Polycomb 抑制复合物 2 (PRC2) 沉积的 H3 赖氨酸 27 三甲基化 (H3K27me3) 为标志。
着丝粒和动粒
着丝粒是染色体的收缩区域,姐妹染色单体在这里聚集在一起,也是着丝粒聚集的地方。在大多数真核生物中,着丝粒是由组蛋白 H3 变体 CENP-A 的存在来定义的,它取代了着丝粒核小体中的常规 H3,并作为着丝粒身份的表观遗传标记。着丝粒是一种大型蛋白质复合物,在着丝粒上组装,并在有丝分裂和减数分裂期间介导与纺锤体微管的附着,产生染色体运动的力并激活纺锤体组装检查点。
端粒和复制衰老
端粒是线性染色体末端的重复 DNA 序列(脊椎动物中的 TTAGGG),可防止降解、融合和识别为 DNA 损伤。端粒长度由端粒酶维持,端粒酶是一种核糖核蛋白酶,可使用其内在 RNA 模板将端粒重复序列添加到染色体末端。端粒酶在生殖细胞、干细胞和大多数癌细胞中活跃,但在体细胞中受到抑制,导致每次细胞分裂时端粒逐渐缩短。当端粒变得非常短时,细胞就会进入复制衰老或发生细胞凋亡,将端粒生物学与衰老和癌症联系起来。
染色体显带和核型分析
染色体在中期最大程度浓缩时可见。吉姆萨显带(G 显带)等染色技术可产生特征性明暗条带,反映碱基组成和基因密度的区域差异:G 亮条带富含 GC 且基因丰富,而 G 暗条带则富含 AT 且基因贫乏。核型是完整染色体互补体的有序展示,按大小、着丝粒位置和带型排列,用于检测染色体异常,例如非整倍体(21 三体、X 单体)、易位(慢性粒细胞白血病中的费城染色体)和大缺失或重复。
染色体异常
数值异常包括多倍体(整套额外的染色体,通常对人类致命)和非整倍体(单个染色体的获得或丢失),其最常见于减数分裂期间的不分离,并且频率随着母亲年龄的增加而增加。结构异常包括缺失、重复、倒位和易位。 9 号和 22 号染色体之间的相互易位产生了费城染色体,该染色体融合了 BCR 和 ABL 基因并导致慢性粒细胞白血病。通过核型分析、荧光原位杂交 (FISH) 和染色体微阵列分析来检测染色体异常。