概述
密码子使用分析研究每个同义密码子——编码相同氨基酸的多个密码子——在基因组或转录组中出现的频率。遗传密码是简并的:61 个密码子指定 20 种氨基酸,大多数氨基酸由两到六个同义密码子编码。这些密码子并非平等使用;生物体对某一密码子子集表现出强烈的偏好。这种偏好反映了突变压力与翻译选择之间的平衡,其中最优密码子对应于最丰富的 tRNA 种类,从而实现更快更准确的翻译与蛋白质合成。
关键概念
**密码子适应指数(CAI)**衡量基因的密码子使用与高表达基因参考集的匹配程度,数值接近 1 表示强烈偏好最优密码子。有效密码子数(ENC)独立于基因长度量化整体密码子偏好,20 表示极端偏好(每个氨基酸一个密码子),61 表示无偏好。每个密码子的相对同义密码子使用(RSCU)值等于观察频率除以在均等使用下的期望频率。通过密码子使用数据库和 Kazusa 等数据库可获取数千种生物体的密码子使用表。第三密码子位置的 GC 含量(GC3)与全基因组核苷酸组成密切相关。
应用
密码子使用分析指导异源基因表达:来自一个物种的基因通常针对生产宿主(如大肠杆菌或酵母)进行密码子优化以提高产量。它揭示了高表达基因中的翻译选择,这些基因倾向于使用被丰�� tRNA 识别的最优密码子。氨基酸生物化学研究受益于理解密码子偏好如何影响蛋白质折叠动力学。基因调控与表观遗传学研究探索密码子使用、mRNA 稳定性和翻译效率之间的相关性,作为转录后控制的一个层面。