Skip to content

Article image
Alineamiento de Secuencias: Comparación Pareada de Secuencias Biológicas

Visión General

El alineamiento de secuencias es la operación fundamental de la bioinformática, colocando dos o más secuencias biológicas una al lado de la otra para identificar regiones de similitud que pueden reflejar relaciones funcionales, estructurales o evolutivas. El alineamiento pareado compara exactamente dos secuencias y forma la base para la búsqueda en bases de datos, el diseño de cebadores y la inferencia filogenética. El problema del alineamiento se resuelve mediante algoritmos de programación dinámica — Needleman-Wunsch para alineamiento global y Smith-Waterman para alineamiento local — que encuentran la ruta de puntuación óptima a través de una matriz de penalizaciones por coincidencia, discrepancia y hueco.

Conceptos Clave

Los alineamientos se clasifican como globales o locales. El alineamiento global fuerza la alineación a lo largo de la longitud completa de ambas secuencias y es más apropiado para secuencias estrechamente relacionadas de longitud similar. El alineamiento local identifica regiones cortas conservadas y es ideal para detectar dominios compartidos entre secuencias divergentes. Las matrices de sustitución como BLOSUM62 y PAM250 proporcionan puntuaciones de log-odds para cada posible reemplazo de aminoácidos, mientras que los alineamientos de ADN típicamente usan puntuaciones simples de coincidencia/discrepancia. Las penalizaciones por hueco — a menudo una combinación de una penalización por apertura de hueco y una por extensión de hueco — desalientan inserciones o deleciones excesivas. Las herramientas heurísticas como BLAST sacrifican la optimalidad garantizada por velocidad mediante la siembra de alineamientos con coincidencias exactas de palabras.

Aplicaciones

El alineamiento pareado se utiliza a diario en biología molecular. Sustenta el diseño de cebadores para reacción en cadena de la polimerasa verificando la complementariedad cebador-molde, valida los resultados de secuenciación de ADN alineando lecturas con genomas de referencia e identifica residuos conservados en la predicción de estructura de proteínas. La genómica comparada se basa en el alineamiento para detectar transferencia horizontal de genes en genética bacteriana, y el mapeo de sitios de restricción utiliza el alineamiento para predecir patrones de digestión con enzimas de restricción.