Skip to content

Article image
Analyse de l'usage des codons : décoder les préférences de traduction

Présentation

L’analyse de l’usage des codons étudie la fréquence à laquelle chaque codon synonyme — de multiples codons codant pour le même acide aminé — apparaît dans un génome ou un transcriptome. Le code génétique est dégénéré : 61 codons spécifient 20 acides aminés, et la plupart des acides aminés sont codés par deux à six codons synonymes. Ces codons ne sont pas utilisés de manière égale ; les organismes présentent de forts biais vers un sous-ensemble de codons. Le biais reflète un équilibre entre la pression mutationnelle et la sélection traductionnelle, où les codons optimaux correspondent aux espèces d’ARNt les plus abondantes, permettant une traduction et synthèse protéique plus rapide et plus précise.

Concepts clés

L’indice d’adaptation des codons (CAI) mesure à quel point l’usage des codons d’un gène correspond à celui d’un ensemble de référence de gènes hautement exprimés, les valeurs proches de 1 indiquant un fort biais vers les codons optimaux. Le nombre effectif de codons (ENC) quantifie le biais global des codons indépendamment de la longueur du gène, où 20 indique un biais extrême (un codon par acide aminé) et 61 indique l’absence de biais. La valeur d’usage relatif des codons synonymes (RSCU) pour chaque codon est égale à la fréquence observée divisée par la fréquence attendue sous une utilisation égale. Les tables d’usage des codons sont disponibles pour des milliers d’organismes via des bases de données comme la Codon Usage Database et Kazusa. La teneur en GC à la troisième position du codon (GC3) est fortement corrélée à la composition nucléotidique globale du génome.

Applications

L’analyse de l’usage des codons guide l’expression hétérologue de gènes : les gènes d’une espèce sont souvent optimisés en fonction des codons de l’hôte de production (par exemple, E. coli ou la levure) pour améliorer le rendement. Elle révèle la sélection traductionnelle dans les gènes hautement exprimés, qui tendent à utiliser des codons optimaux reconnus par les ARNt abondants. Les études en biochimie des acides aminés bénéficient de la compréhension de l’impact du biais des codons sur la cinétique de repliement des protéines. La recherche sur la régulation génique et l’épigénétique explore les corrélations entre l’usage des codons, la stabilité des ARNm et l’efficacité de la traduction en tant que couche de contrôle post-transcriptionnel.