Divida uma sequência em todas as substrings possíveis de comprimento k e conte suas frequências para revelar a assinatura composicional da sequência. Use esta ferramenta para avaliar a qualidade do sequenciamento, detectar contaminação ou comparar conjuntos de genomas — os perfis k-mer diferem marcadamente entre espécies e podem revelar misturas de amostras ou viés de GC. Uma distribuição suave de frequência próxima de Poisson indica cobertura uniforme, enquanto picos inesperados sugerem repetições, contaminação ou artefatos de sequenciamento que devem ser investigados antes de análises adicionais.
Sobre a análise K-mer
K-mers são substrings de comprimento k dentro de uma sequência biológica. A contagem de K-mer é fundamental para muitas aplicações de bioinformática, incluindo montagem de genoma, comparação de sequências e metagenômica.