Visión General
El análisis de uso de codones investiga la frecuencia con la que cada codón sinónimo — múltiples codones que codifican el mismo aminoácido — aparece en un genoma o transcriptoma. El código genético es degenerado: 61 codones especifican 20 aminoácidos, y la mayoría de los aminoácidos están codificados por dos a seis codones sinónimos. Estos codones no se utilizan por igual; los organismos exhiben sesgos fuertes hacia un subconjunto de codones. El sesgo refleja un equilibrio entre la presión mutacional y la selección traduccional, donde los codones óptimos corresponden a las especies de ARNt más abundantes, permitiendo una traducción y síntesis de proteínas más rápida y precisa.
Conceptos Clave
El índice de adaptación de codones (CAI) mide qué tan cerca se ajusta el uso de codones de un gen al de un conjunto de referencia de genes altamente expresados, con valores cercanos a 1 que indican un fuerte sesgo hacia codones óptimos. El número efectivo de codones (ENC) cuantifica el sesgo general de codones independientemente de la longitud del gen, donde 20 indica sesgo extremo (un codón por aminoácido) y 61 indica ausencia de sesgo. El valor de uso relativo de codones sinónimos (RSCU) para cada codón es igual a la frecuencia observada dividida por la frecuencia esperada bajo uso igual. Las tablas de uso de codones están disponibles para miles de organismos a través de bases de datos como la Codon Usage Database y Kazusa. El contenido GC en la tercera posición del codón (GC3) se correlaciona fuertemente con la composición de nucleótidos del genoma.
Aplicaciones
El análisis de uso de codones guía la expresión de genes heterólogos: los genes de una especie a menudo se optimizan por codones para el huésped de producción (por ejemplo, E. coli o levadura) para mejorar el rendimiento. Revela la selección traduccional en genes altamente expresados, que tienden a usar codones óptimos reconocidos por ARNt abundantes. Los estudios en aminoácidos se benefician de comprender cómo el sesgo de codones afecta la cinética de plegamiento de proteínas. La investigación en regulación génica y epigenética explora correlaciones entre el uso de codones, la estabilidad del ARNm y la eficiencia de traducción como una capa de control post-transcripcional.