Skip to content

Article image
Descubrimiento de Motivos: Búsqueda de Patrones Reguladores en Secuencias

Visión General

El descubrimiento de motivos es la identificación computacional de patrones de secuencia cortos y recurrentes en secuencias de ADN, ARN o proteínas que corresponden a elementos funcionales como sitios de unión de factores de transcripción, uniones de empalme, sitios de reconocimiento de proteínas de unión a ARN o dominios de interacción proteica. A diferencia del alineamiento global, el descubrimiento de motivos se centra en ventanas pequeñas — típicamente 6–20 nucleótidos o 3–15 aminoácidos — donde la conservación posicional es alta incluso cuando la secuencia circundante diverge. Estos motivos a menudo se representan como matrices de peso de posición (PWMs) que capturan la frecuencia de cada nucleótido o aminoácido en cada posición.

Métodos

Una variedad de algoritmos abordan el descubrimiento de motivos. Los métodos basados en consenso enumeran todas las palabras posibles e informan aquellas que ocurren más a menudo de lo esperado por azar. Los enfoques probabilísticos como MEME utilizan maximización de expectativas para ajustar un modelo de mezcla que separa las secuencias que contienen motivos de las secuencias de fondo. Los métodos de muestreo de Gibbs, implementados en herramientas como BioProspector, buscan estocásticamente en el espacio de secuencias para encontrar patrones sobrerrepresentados. La huella filogenética explota la conservación entre especies relacionadas para identificar elementos reguladores bajo selección purificadora. La inmunoprecipitación de cromatina seguida de secuenciación (ChIP-seq) proporciona regiones pico derivadas experimentalmente que guían el descubrimiento de motivos a loci genómicos relevantes.

Aplicaciones

El descubrimiento de motivos es central para comprender la regulación génica y epigenética. Identifica los sitios de unión para factores de transcripción que controlan la transcripción y procesamiento del ARN. En biología sintética, los motivos descubiertos se utilizan para diseñar promotores sintéticos con fuerzas de expresión predecibles. El análisis de la estructura y topología del ADN revela que ciertos motivos forman preferentemente estructuras secundarias como G-cuadruplex que regulan la transcripción y replicación.