Skip to content

Article image
Búsqueda en Bases de Datos de Secuencias con BLAST

Visión General

BLAST (Herramienta Básica de Búsqueda de Alineamiento Local) es el algoritmo más utilizado para comparar una secuencia de consulta contra una base de datos de secuencias conocidas. Identifica rápidamente alineamientos locales estadísticamente significativos, proporcionando anotación funcional para genes novedosos, detectando homología entre especies distantes y revelando relaciones evolutivas. BLAST sacrifica la optimalidad garantizada de la programación dinámica completa por una heurística que es lo suficientemente rápida para buscar bases de datos que contienen miles de millones de residuos. La significación estadística de cada coincidencia se reporta como un valor E — el número esperado de alineamientos aleatorios con una puntuación dada en una base de datos de ese tamaño.

Conceptos Clave

BLAST funciona primero dividiendo la consulta en palabras cortas (típicamente 3 para proteínas, 11 para nucleótidos), escaneando la base de datos en busca de coincidencias exactas con estas palabras y luego extendiendo las coincidencias prometedoras en ambas direcciones para construir alineamientos más largos. Las variantes abordan casos de uso específicos: BLASTP compara consultas de proteínas contra bases de datos de proteínas, BLASTN compara consultas de nucleótidos contra bases de datos de nucleótidos, BLASTX traduce una consulta de nucleótidos en los seis marcos de lectura para comparación a nivel de proteínas, y PSI-BLAST construye iterativamente una matriz de puntuación específica de posición para detectar homólogos distantes. MegabLAST está optimizado para secuencias altamente similares, mientras que MegabLAST discontinuo maneja comparaciones entre especies.

Aplicaciones

BLAST es el primer paso en la anotación de secuencias desconocidas de proyectos de secuenciación de ADN. Asigna función putativa a proteínas novedosas mediante la detección de homología con estructuras de proteínas caracterizadas. En genética bacteriana, BLAST identifica factores de virulencia y genes de resistencia a antibióticos. La tecnología de ADN recombinante utiliza BLAST para verificar la integridad de construcciones alineando lecturas de secuenciación contra secuencias de vectores esperadas.