Überblick
Die Codon Usage Analyse untersucht die Häufigkeit, mit der jedes synonyme Codon — mehrere Codons, die dieselbe Aminosäure kodieren — in einem Genom oder Transkriptom vorkommt. Der genetische Code ist degeneriert: 61 Codons spezifizieren 20 Aminosäuren, und die meisten Aminosäuren werden von zwei bis sechs synonymen Codons kodiert. Diese Codons werden nicht gleich häufig verwendet; Organismen zeigen starke Präferenzen für eine Teilmenge von Codons. Die Präferenz spiegelt ein Gleichgewicht zwischen mutationalem Druck und translationaler Selektion wider, wobei optimale Codons den häufigsten tRNA-Spezies entsprechen und so eine schnellere und genauere Translation und Proteinsynthese ermöglichen.
Schlüsselkonzepte
Der Codon Adaptation Index (CAI) misst, wie genau die Codon Usage eines Gens mit der eines Referenzsatzes hoch exprimierter Gene übereinstimmt, wobei Werte nahe 1 auf eine starke Präferenz für optimale Codons hinweisen. Die effektive Anzahl von Codons (ENC) quantifiziert die gesamte Codon-Präferenz unabhängig von der Genlänge, wobei 20 für extreme Präferenz (ein Codon pro Aminosäure) und 61 für keine Präferenz steht. Der relative synonymous codon usage (RSCU) -Wert für jedes Codon entspricht der beobachteten Häufigkeit geteilt durch die erwartete Häufigkeit bei gleichmäßiger Nutzung. Codon-Usage-Tabellen sind für Tausende von Organismen über Datenbanken wie die Codon Usage Database und Kazusa verfügbar. Der GC-Gehalt an der dritten Codonposition (GC3) korreliert stark mit der genomweiten Nukleotidzusammensetzung.
Anwendungen
Die Codon Usage Analyse leitet die heterologe Genexpression: Gene einer Art werden oft für den Produktionswirt (z. B. E. coli oder Hefe) codon-optimiert, um die Ausbeute zu verbessern. Sie zeigt die translationale Selektion in hoch exprimierten Genen, die dazu neigen, optimale Codons zu verwenden, die von häufigen tRNAs erkannt werden. Studien zur Biochemie der Aminosäuren profitieren vom Verständnis, wie die Codon-Präferenz die Proteinfaltungskinetik beeinflusst. Die Forschung zur Genregulation und Epigenetik untersucht Korrelationen zwischen Codon Usage, mRNA-Stabilität und Translationseffizienz als eine Ebene der posttranskriptionellen Kontrolle.