Shotgun metagenomic sequencing merupakan metode analisis metagenom berbasis
short reads yang memiliki keunggulan pada coverage dan depth sampel yang baik
namun fragmen nukleotida yang terlalu terfraksinasi pada metode ini menyebabkan
limitasi pada identifikasi sekuens kompleks yang repetitif. Hal ini semakin menjadi
tantangan pada sampel dari bakteri laut dalam yang memiliki keunikan karakteristik
fisikokimia dan peran spesifik dalam daur biogeokimia yang berpengaruh terhadap
kompleksitas keragaman taksonomi dan filogenetik. Oleh sebab itu dibutuhkan
strategi khusus dalam analisis sampel metagenomik bakteri laut dalam berupa
komparasi de novo assembler terbaik yang pada penelitian ini dibandingkan antara
MEGAHIT dan MetaSPAdes serta pendekatan bin recovery berupa bin refinement
dan bin reassembly untuk mendapatkan draf MAGs berkualitas tinggi yang dapat
dijadikan input dalam penelitian genome mining (deteksi BGCs). Pada penelitian
ini, sekuens paired end reads dari tiga lokasi sampling yang telah dilakukan quality
control dengan modul READ_QC sebelumnya dan dilakukan assembly dengan
MEGAHIT dan MetaSPAdes dievaluasi kualitas dengan parameter-parameter
seperti sequencing depth, N50, L50, largest contig, dan contig continuity (total
length/number of contigs). Hasil yang didapatkan menunjukkan MetaSPAdes
unggul pada keseluruhan parameter dengan rincian L50 yang lebih rendah serta
sequencing depth, N50, largest contig, dan contig continuity yang lebih tinggi
meskipun secara terpisah total length dan number of contigs pada MEGAHIT lebih
tinggi dibanding MetaSPAdes. Kedua hasil assembly masing-masing sampel
selanjutnya dilakukan binning dengan binner metaBAT2, MaxBin2, dan
CONCOCT. Bin files yang dihasilkan setiap binner selanjutnya dikonsolidasi untuk
masing-masing sampel dengan modul bin_refinement. MAGs hasil konsolidasi
yang didapatkan selanjutnya di-assembly ulang dengan modul bin_reassembly
menggunakan assembler SPAdes. Pada kedua modul tersebut diatur ambang batas
cut-off kualitas MAGs yang dihasilkan adalah minimum completeness 89% dan
maximum contamination 6%. Berdasarkan pengecekan kualitas draf MAGs yang
dihasilkan menggunakan CHECKM terintegrasi DFAST dengan kriteria MIMAG,
diketahui bahwa MetaSPades menghasilkan lebih banyak high quality MAGs yaitu
sebanyak 16 MAGs pada hasil bin refinement dan 15 MAGs pada hasil bin
reassembly sementara MEGAHIT hanya mampu menghasilkan 9 MAGs pada hasil
bin refinement dan 10 MAGs pada hasil bin reassembly. Reduksi satu high quality
MAGs pada hasil bin reassembly MetaSPAdes dapat disebabkan oleh algoritma
modul itu sendiri yang membuang contig berukuran besar hasil assembly
MetaSPAdes terdeteksi memiliki mismatch untuk mereduksi kemungkinan false
positive. Hal tersebut selaras juga dengan hasil parameter statistik pendukung
lainnya yaitu rerata N50 seluruh MAGs dan jumlah contig/bin yang menurun pada
hasil bin reassembly MetaSPAdes relatif terhadap hasil bin refinement yang
keseluruhan parameter termasuk standar deviasi GC content (%) diketahui
mengungguli MEGAHIT. Berdasarkan hasil tersebut maka dapat disimpulkan
MetaSPAdes merupakan de novo assembler paling optimal ditinjau dari parameter
evaluasi hasil assembly dan performanya dalam tahap bin recovery.