Visión General
El análisis de datos de microarrays transforma las intensidades de fluorescencia crudas de microarrays hibridados en mediciones significativas de expresión génica. Aunque el RNA-seq ha reemplazado en gran medida a los microarrays para estudios de descubrimiento, los microarrays siguen siendo ampliamente utilizados en diagnóstico clínico, fitomejoramiento y estudios de poblaciones grandes debido a su bajo costo, protocolos estandarizados y pipelines de análisis bien establecidos. Un solo microarray puede medir la expresión de decenas de miles de transcriptos simultáneamente aprovechando el emparejamiento de bases complementarias entre el ADNc de la muestra y las sondas inmovilizadas. El flujo de trabajo de análisis aborda las características técnicas únicas de los datos de microarrays, incluyendo corrección de fondo, normalización y resumen a nivel de sonda.
Métodos
El análisis de microarrays comienza con el procesamiento de imágenes para extraer intensidades a nivel de sonda. La corrección de fondo elimina la señal inespecífica utilizando métodos como el promedio robusto de múltiples arrays (RMA) o el ajuste por contenido GC. La normalización hace que los arrays sean comparables: la normalización por cuantiles es el enfoque más común para arrays de un color, mientras que la normalización loess se aplica a diseños de dos colores. El resumen de sondas (para arrays Affymetrix, usando RMA o PLIER) combina múltiples sondas por gen en un solo valor de expresión. La evaluación de calidad utiliza pseudoimágenes, gráficos NUSE y gráficos RLE para identificar arrays problemáticos. La expresión diferencial se prueba con limma, que utiliza moderación bayesiana empírica para estabilizar las estimaciones de varianza entre genes. Los efectos de lote se detectan con análisis de componentes principales y se corrigen usando ComBat o removeBatchEffect de limma.
Aplicaciones
A pesar del auge de la secuenciación, los microarrays continúan generando valor. Las pruebas MammaPrint y Oncotype DX aprobadas por la FDA utilizan microarrays para el pronóstico del cáncer de mama. Los paneles clínicos de microarrays de ADN y expresión génica guían decisiones de tratamiento en oncología y diagnóstico de enfermedades raras. El análisis de datos de microarrays también respalda la validación de resultados de qPCR mediante estudios de correlación con qPCR y complementa la secuenciación de ADN mediante el perfilado de expresión a gran escala. En genómica agrícola, los microarrays permiten el mapeo de rasgos y la selección asistida por marcadores de manera rentable en grandes poblaciones de mejora.