Los microarreglos de ADN permiten la medición simultánea de los niveles de expresión de miles de genes, proporcionando una visión genómica de la actividad transcripcional celular. Revolucionaron la genómica funcional al permitir a los investigadores comparar la expresión génica entre diferentes condiciones, tejidos o estados de enfermedad.
Principios de los Microarreglos
Un microarreglo de ADN consiste en miles de puntos microscópicos, cada uno conteniendo sondas de una secuencia específica de ADN, unidos a una superficie sólida como un portaobjetos de vidrio o un chip de silicio. Cada sonda está diseñada para hibridarse con un ARNm o ADNc diana específico. La colección completa de sondas representa el conjunto de genes que se están analizando.
El experimento básico implica extraer ARN de las muestras de interés, convertirlo en ADN complementario con transcriptasa inversa, marcar el ADNc con tintes fluorescentes e hibridar el ADNc marcado al microarreglo. Después de lavar el material unido de forma no específica, se mide la intensidad de fluorescencia en cada punto, indicando la cantidad de cada ARNm en la muestra original.
Arreglos de Dos Colores
En experimentos de microarreglos de dos colores, el ARN de dos condiciones se marca con diferentes tintes fluorescentes, típicamente Cy3 y Cy5. Los ADNc marcados se mezclan y se hibridan a un solo arreglo. La relación de fluorescencia Cy5 a Cy3 en cada punto refleja el nivel de expresión relativo de cada gen entre las dos condiciones. Los diseños de dos colores controlan la variación punto a punto pero introducen sesgo de tinte que requiere experimentos de intercambio de tinte.
Arreglos de Canal Único
Los arreglos de canal único como Affymetrix GeneChips usan un solo marcador fluorescente. Cada muestra se hibrida a un arreglo separado. La expresión génica se mide como intensidad absoluta, y las comparaciones se realizan entre arreglos después de la normalización. Los arreglos de canal único tienen mayor rendimiento para comparaciones múltiples pero requieren métodos de normalización robustos para reducir la variación entre arreglos. Los arreglos Affymetrix usan múltiples sondas por gen con sondas de coincidencia perfecta y desajuste para distinguir la hibridación específica del fondo.
Normalización de Datos
Los datos de microarreglos requieren un procesamiento previo extenso. La corrección de fondo elimina la señal de hibridación no específica. La normalización ajusta la variación técnica entre arreglos. La normalización de cuantiles hace que la distribución de intensidades de sonda sea idéntica entre arreglos, asumiendo que la mayoría de los genes no se expresan diferencialmente. El promedio robusto de múltiples arreglos combina la corrección de fondo, normalización y resumen de múltiples sondas por gen.
Análisis de Expresión Diferencial
Después de la normalización, las pruebas estadísticas identifican genes con cambios de expresión significativos entre condiciones. La prueba t moderada, implementada en el paquete limma, toma prestada información entre genes para estabilizar las estimaciones de varianza. La corrección de pruebas múltiples usando el método de Benjamini-Hochberg controla la tasa de falsos descubrimientos. Los resultados típicamente se informan como cambios de pliegue con valores p ajustados. Los genes con cambios de pliegue por encima de un umbral y valores p ajustados por debajo de 0.05 se consideran expresados diferencialmente.
Agrupamiento y Clasificación
El agrupamiento no supervisado agrupa genes o muestras basándose en la similitud de expresión sin conocimiento previo. El agrupamiento jerárquico produce dendrogramas donde los genes con perfiles de expresión similares se agrupan. El agrupamiento de K-medias particiona genes en un número especificado de grupos. Estos enfoques pueden revelar grupos de genes co-regulados y nuevos subtipos de muestras.
La clasificación supervisada usa etiquetas de muestra conocidas para construir predictores que pueden clasificar muestras desconocidas. Se aplican máquinas de vectores de soporte, bosques aleatorios y clasificadores de vecinos más cercanos. Las firmas de expresión génica pueden clasificar subtipos de cáncer, predecir el pronóstico y guiar la selección del tratamiento. La firma PAM50 clasifica el cáncer de mama en subtipos moleculares con diferentes pronósticos.
Aplicaciones
Los microarreglos se han aplicado a prácticamente todas las áreas de la biología. La investigación del cáncer usa microarreglos para clasificar tumores, identificar firmas pronósticas y descubrir dianas farmacológicas. Las pruebas MammaPrint y Oncotype DX para cáncer de mama usan firmas de expresión génica para predecir el riesgo de recurrencia. La biología del desarrollo estudia programas transcripcionales que impulsan la diferenciación. La toxicología usa microarreglos para el perfil toxicogenómico. Los microarreglos también detectan variaciones en el número de copias cuando se usan para hibridación genómica comparativa.
Limitaciones y Transición a RNA-Seq
Los microarreglos tienen limitaciones incluyendo la dependencia de secuencias de sonda predefinidas, rango dinámico limitado e incapacidad para detectar transcriptos nuevos o variantes de splicing. La secuenciación de ARN, una aplicación clave de la secuenciación de próxima generación, ha reemplazado en gran medida a los microarreglos para el análisis de expresión génica. RNA-seq proporciona datos de recuento digital con mayor sensibilidad y rango dinámico, detecta transcriptos e isoformas nuevos y no requiere sondas predefinidas. Sin embargo, los microarreglos siguen siendo útiles para organismos bien caracterizados y aplicaciones clínicas donde las plataformas estandarizadas son ventajosas.