Skip to content

Article image
Montagem de Genomas: Métodos e Aplicações

Visão Geral

A montagem de genomas é o processo computacional de reconstruir sequências genômicas completas a partir dos fragmentos curtos de DNA produzidos por plataformas de sequenciamento de alto rendimento. Como os sequenciadores leem apenas centenas de pares de base por vez, os bioinformáticos precisam juntar milhões ou bilhões dessas leituras — algo como resolver um enorme quebra-cabeça. A precisão de um genoma montado afeta diretamente todas as análises subsequentes, desde a predição de genes até a genômica comparativa. Montadores modernos lidam com as complexidades de regiões repetitivas, erros de sequenciamento e profundidades de cobertura variáveis usando algoritmos sofisticados baseados em grafos.

Conceitos-Chave

Duas estratégias principais existem para montagem de genomas. A montagem de novo constrói um genoma sem qualquer referência prévia, baseando-se em abordagens de overlap-layout-consensus (OLC) ou grafos de Bruijn para mesclar leituras em sequências contíguas chamadas contigs. A montagem guiada por referência mapeia leituras para um genoma de referência conhecido e então monta as porções não mapeadas, o que é particularmente útil para projetos de resequenciamento. As métricas de qualidade incluem N50 (o comprimento do contig no qual 50% da montagem está contida) e o tamanho total da montagem. A validação da montagem geralmente envolve a verificação contra sequências conhecidas ou o uso de tecnologias de leitura longa para fechamento de lacunas.

Aplicações

A montagem de genomas é fundamental para quase todas as aplicações genômicas. Ela permite a descoberta de novos genes, a identificação de variantes estruturais e a caracterização de elementos reguladores não codificantes. Na medicina, genomas montados de patógenos permitem o rastreamento rápido de surtos e o perfil de resistência a antibióticos. A genômica agrícola depende de montagens de alta qualidade para mapear características de importância econômica. Projetos modernos frequentemente combinam dados de sequenciamento de próxima geração com leituras longas e mapeamento óptico para produzir montagens em nível cromossômico, baseando-se em métodos clássicos de sequenciamento de DNA. A montagem também sustenta estudos funcionais como o design de alvos para CRISPR-Cas9, onde as previsões de efeitos fora do alvo dependem de uma referência precisa.