Visão Geral
A análise de uso de códons investiga a frequência com que cada códon sinônimo — múltiplos códons codificando o mesmo aminoácido — aparece em um genoma ou transcriptoma. O código genético é degenerado: 61 códons especificam 20 aminoácidos, e a maioria dos aminoácidos é codificada por dois a seis códons sinônimos. Estes códons não são usados igualmente; organismos exibem fortes vieses em direção a um subconjunto de códons. O viés reflete um equilíbrio entre pressão mutacional e seleção traducional, onde códons ótimos correspondem às espécies de tRNA mais abundantes, permitindo tradução e síntese proteica mais rápida e precisa.
Conceitos-Chave
O índice de adaptação de códons (CAI) mede o quanto o uso de códons de um gene corresponde ao de um conjunto de referência de genes altamente expressos, com valores próximos de 1 indicando forte viés em direção a códons ótimos. O número efetivo de códons (ENC) quantifica o viés geral de códons independentemente do comprimento do gene, onde 20 indica viés extremo (um códon por aminoácido) e 61 indica ausência de viés. O valor de uso relativo de códons sinônimos (RSCU) para cada códon é igual à frequência observada dividida pela frequência esperada sob uso igual. Tabelas de uso de códons estão disponíveis para milhares de organismos através de bancos de dados como o Codon Usage Database e Kazusa. O conteúdo GC na terceira posição do códon (GC3) correlaciona-se fortemente com a composição genômica de nucleotídeos.
Aplicações
A análise de uso de códons orienta a expressão heteróloga de genes: genes de uma espécie são frequentemente otimizados para códons do hospedeiro de produção (por exemplo, E. coli ou levedura) para melhorar o rendimento. Ela revela seleção traducional em genes altamente expressos, que tendem a usar códons ótimos reconhecidos por tRNAs abundantes. Estudos em bioquímica de aminoácidos beneficiam-se da compreensão de como o viés de códons afeta a cinética de enovelamento proteico. A pesquisa em regulação gênica e epigenética explora correlações entre uso de códons, estabilidade do mRNA e eficiência de tradução como uma camada de controle pós-transcricional.