Skip to content

Article image
Modelos Ocultos de Markov na Análise de Sequências

Visão Geral

Um modelo oculto de Markov (HMM) é um modelo estatístico que representa uma sequência de eventos observáveis como sendo gerada por uma sequência subjacente de estados não observados (ocultos). Em bioinformática, HMMs modelam sequências biológicas onde os estados ocultos podem representar limites éxon/íntron, elementos de estrutura secundária de proteínas ou colunas conservadas em um alinhamento múltiplo de sequências. O poder da estrutura HMM reside em sua capacidade de capturar padrões de conservação específicos de posição, inserções e deleções através de uma arquitetura probabilística unificada treinada a partir de exemplos conhecidos.

Conceitos-Chave

Um HMM é definido por três conjuntos de parâmetros: probabilidades de transição entre estados ocultos, probabilidades de emissão de observar um símbolo a partir de cada estado e probabilidades de estado inicial. O algoritmo de Viterbi encontra a sequência mais provável de estados ocultos para uma dada observação — por exemplo, a estrutura gênica mais provável para uma sequência de DNA genômico. O algoritmo forward-backward calcula a probabilidade posterior de cada estado em cada posição, que pode ser usada para avaliar a confiança da predição. HMMs de perfil, construídos a partir de alinhamentos múltiplos de sequências, modelam famílias de domínios proteicos. O pacote de software HMMER usa HMMs de perfil para detecção sensível de homologia remota, superando BLAST para sequências divergentes.

Aplicações

HMMs são usados para predição de genes em genomas procarióticos e eucarióticos, identificando sítios de splicing e regiões codificantes. HMMs de perfil classificam proteínas em famílias e superfamílias, auxiliando a predição de estrutura de proteínas e anotação funcional. Eles modelam especificidade de substrato em classificação e nomenclatura de enzimas e detectam elementos reguladores em estrutura e topologia do DNA. Em metagenômica, HMMs atribuem papéis funcionais a fragmentos de origem desconhecida.