Divida una secuencia en todas las subcadenas posibles de longitud k y cuente sus frecuencias para revelar la firma compositiva de la secuencia. Utilice esta herramienta para evaluar la calidad de la secuenciación, detectar contaminación o comparar conjuntos de genomas: los perfiles de k-mer difieren notablemente entre especies y pueden revelar mezclas de muestras o sesgos de GC. Una distribución de frecuencia suave cercana a Poisson indica una cobertura uniforme, mientras que los picos inesperados sugieren repeticiones, contaminación o artefactos de secuenciación que deben investigarse antes de realizar más análisis.
Acerca del análisis K-mer
Los K-meros son subcadenas de longitud k dentro de una secuencia biológica. El recuento de K-mer es fundamental para muchas aplicaciones bioinformáticas, incluido el ensamblaje del genoma, la comparación de secuencias y la metagenómica.