Visión General
La secuenciación de ARN (RNA-seq) se ha convertido en el método estándar para medir la expresión génica, reemplazando enfoques anteriores basados en hibridación. Al convertir moléculas de ARN en una biblioteca de ADNc y secuenciar millones de fragmentos, el RNA-seq proporciona tanto la identidad como la abundancia de los transcriptos en una muestra biológica. A diferencia de los microarrays, el RNA-seq puede detectar transcriptos novedosos, variantes de empalme y ARN no codificantes sin necesidad de diseño previo de sondas. La técnica ofrece un rango dinámico que abarca varios órdenes de magnitud y resolución de una sola base. Los datos de RNA-seq sustentan la mayoría de los estudios transcriptómicos modernos, desde organismos modelo hasta muestras clínicas.
Conceptos Clave
El pipeline de análisis de RNA-seq comienza con lecturas de secuenciación crudas, que se someten a control de calidad (FastQC), recorte de adaptadores (Trimmomatic o Cutadapt) y alineamiento a un genoma de referencia utilizando alineadores sensibles a empalme como STAR o HISAT2. La cuantificación a nivel de gen o transcripto se realiza mediante herramientas como featureCounts, RSEM o Salmon. Los valores de expresión se normalizan como FPKM, RPKM o TPM para tener en cuenta la profundidad de secuenciación y la longitud del transcripto. La detección de empalme alternativo y transcriptos novedosos requiere herramientas especializadas como Cufflinks o StringTie, que ensamblan transcriptos a partir de lecturas alineadas. Las métricas de calidad incluyen tasas de mapeo, distribución de lecturas entre características génicas y análisis de saturación.
Aplicaciones
El RNA-seq se aplica en prácticamente todas las áreas de la biología. Perfila cambios en la expresión génica en tejidos enfermos versus sanos, identifica biomarcadores para subtipos de cáncer y rastrea programas de expresión génica durante el desarrollo. En microbiología, el RNA-seq revela respuestas transcripcionales a antibióticos y estrés ambiental. La técnica se basa directamente en métodos de secuenciación de ARN y se integra frecuentemente con flujos de trabajo de secuenciación de nueva generación. El RNA-seq también permite el descubrimiento de nuevas estructuras y tipos de ARN, incluyendo ARN largos no codificantes y ARN circulares, expandiendo nuestra comprensión de la complejidad del transcriptoma.