Gambaran Umum
Perakitan genom adalah proses komputasional untuk merekonstruksi sekuens genom lengkap dari fragmen DNA pendek yang dihasilkan oleh platform sekuensing throughput tinggi. Karena mesin sekuensing hanya membaca ratusan pasangan basa setiap kali, para bioinformatikawan harus menyusun jutaan hingga miliaran bacaan ini — seperti memecahkan teka-teki gambar raksasa. Akurasi genom yang dirakit langsung memengaruhi setiap analisis hilir, dari prediksi gen hingga genomika komparatif. Perakit modern menangani kompleksitas daerah berulang, kesalahan sekuensing, dan kedalaman liputan yang bervariasi menggunakan algoritma berbasis graf yang canggih.
Konsep Kunci
Ada dua strategi utama untuk perakitan genom. Perakitan de novo membangun genom tanpa referensi sebelumnya, mengandalkan pendekatan overlap-layout-consensus (OLC) atau graf de Bruijn untuk menggabungkan bacaan menjadi sekuens kontinu yang disebut kontig. Perakitan berbasis referensi memetakan bacaan ke genom referensi yang diketahui dan kemudian merakit bagian yang tidak terpetakan, yang sangat berguna untuk proyek sekuensing ulang. Metrik kualitas utama meliputi N50 (panjang kontig di mana 50% perakitan terkandung) dan ukuran total perakitan. Validasi perakitan sering melibatkan pemeriksaan terhadap sekuens yang diketahui atau menggunakan teknologi baca panjang untuk penutupan celah.
Aplikasi
Perakitan genom mendasar bagi hampir setiap aplikasi genomika. Ini memungkinkan penemuan gen baru, identifikasi varian struktural, dan karakterisasi elemen regulatorik non-koding. Dalam bidang kedokteran, genom yang dirakit dari patogen memungkinkan pelacakan wabah dengan cepat dan profiling resistensi antibiotik. Genomika pertanian bergantung pada perakitan berkualitas tinggi untuk memetakan sifat-sifat bernilai ekonomi. Proyek modern sering menggabungkan data next-generation sequencing dengan bacaan panjang dan pemetaan optik untuk menghasilkan perakitan tingkat kromosom, dengan membangun metode DNA sequencing klasik. Perakitan juga mendukung studi fungsional seperti desain target CRISPR-Cas9, di mana prediksi di luar target bergantung pada referensi yang akurat.