digilib@itb.ac.id +62 812 2508 8800

Shotgun metagenomic sequencing merupakan metode analisis metagenom berbasis short reads yang memiliki keunggulan pada coverage dan depth sampel yang baik namun fragmen nukleotida yang terlalu terfraksinasi pada metode ini menyebabkan limitasi pada identifikasi sekuens kompleks yang repetitif. Hal ini semakin menjadi tantangan pada sampel dari bakteri laut dalam yang memiliki keunikan karakteristik fisikokimia dan peran spesifik dalam daur biogeokimia yang berpengaruh terhadap kompleksitas keragaman taksonomi dan filogenetik. Oleh sebab itu dibutuhkan strategi khusus dalam analisis sampel metagenomik bakteri laut dalam berupa komparasi de novo assembler terbaik yang pada penelitian ini dibandingkan antara MEGAHIT dan MetaSPAdes serta pendekatan bin recovery berupa bin refinement dan bin reassembly untuk mendapatkan draf MAGs berkualitas tinggi yang dapat dijadikan input dalam penelitian genome mining (deteksi BGCs). Pada penelitian ini, sekuens paired end reads dari tiga lokasi sampling yang telah dilakukan quality control dengan modul READ_QC sebelumnya dan dilakukan assembly dengan MEGAHIT dan MetaSPAdes dievaluasi kualitas dengan parameter-parameter seperti sequencing depth, N50, L50, largest contig, dan contig continuity (total length/number of contigs). Hasil yang didapatkan menunjukkan MetaSPAdes unggul pada keseluruhan parameter dengan rincian L50 yang lebih rendah serta sequencing depth, N50, largest contig, dan contig continuity yang lebih tinggi meskipun secara terpisah total length dan number of contigs pada MEGAHIT lebih tinggi dibanding MetaSPAdes. Kedua hasil assembly masing-masing sampel selanjutnya dilakukan binning dengan binner metaBAT2, MaxBin2, dan CONCOCT. Bin files yang dihasilkan setiap binner selanjutnya dikonsolidasi untuk masing-masing sampel dengan modul bin_refinement. MAGs hasil konsolidasi yang didapatkan selanjutnya di-assembly ulang dengan modul bin_reassembly menggunakan assembler SPAdes. Pada kedua modul tersebut diatur ambang batas cut-off kualitas MAGs yang dihasilkan adalah minimum completeness 89% dan maximum contamination 6%. Berdasarkan pengecekan kualitas draf MAGs yang dihasilkan menggunakan CHECKM terintegrasi DFAST dengan kriteria MIMAG, diketahui bahwa MetaSPades menghasilkan lebih banyak high quality MAGs yaitu sebanyak 16 MAGs pada hasil bin refinement dan 15 MAGs pada hasil bin reassembly sementara MEGAHIT hanya mampu menghasilkan 9 MAGs pada hasil bin refinement dan 10 MAGs pada hasil bin reassembly. Reduksi satu high quality MAGs pada hasil bin reassembly MetaSPAdes dapat disebabkan oleh algoritma modul itu sendiri yang membuang contig berukuran besar hasil assembly MetaSPAdes terdeteksi memiliki mismatch untuk mereduksi kemungkinan false positive. Hal tersebut selaras juga dengan hasil parameter statistik pendukung lainnya yaitu rerata N50 seluruh MAGs dan jumlah contig/bin yang menurun pada hasil bin reassembly MetaSPAdes relatif terhadap hasil bin refinement yang keseluruhan parameter termasuk standar deviasi GC content (%) diketahui mengungguli MEGAHIT. Berdasarkan hasil tersebut maka dapat disimpulkan MetaSPAdes merupakan de novo assembler paling optimal ditinjau dari parameter evaluasi hasil assembly dan performanya dalam tahap bin recovery.