Article Details

REDUKSI DIMENSI DATA UNTUK KLASTERISASI DAN IDENTIFIKASI: STUDI KASUS PADA DATA METABOLIT CENGKEH INDONESIA

Oleh   Rustam [30116017]
Kontributor / Dosen Pembimbing : Dr. Agus Yodi Gunawan, S.Si., M.Si.;Dr. Made Tri Ari Penia Kresnowati, S.T., M.Sc.;
Jenis Koleksi : S3-Disertasi
Penerbit : Matematika
Fakultas : Fakultas Matematika dan Ilmu Pengetahuan Alam
Subjek :
Kata Kunci : artificial neural networks, fuzzy clustering, identifikasi, kemometrik, metabolomik, reduksi dimensi data
Sumber :
Staf Input/Edit : Dwi Ary Fuziastuti  
File : 1 file
Tanggal Input : 02 Sep 2022

Dalam studi metabolomik, analisis independen atau replikasi eksperimen pengukuran konsentrasi metabolit selalu dilakukan untuk mengantisipasi galat pengukuran. Di sisi lain, ukuran dataset akan semakin meningkat dengan adanya analisis independen tersebut. Untuk tujuan klastersasi, mendapatkan informasi kimiawi yang representatif dari beberapa analisis independen diperlukan. Oleh karena itu, metode reduksi dimensi analisis independen yang tepat diperlukan sehingga data yang merepresentasikan informasi kimiawi dari beberapa analisis independen dapat diperoleh. Untuk tujuan reduksi dimensi analisis independen, algoritma Weiszfeld termodifikasi (AWT) dan classical multidimensional scaling (CMDS) dengan jarak Euclid dan Mahalanobis diusulkan. Dataset metabolit sebelum dan setelah reduksi dimensi analisis independen kemudian diklasterisasi menggunakan pendekatan fuzzy clustering dengan indeks Tang Sun Sun (TSS) sebagai indeks validitas klaster. Hasil klasterisasi sebelum dan setelah reduksi dimensi dilakukan memberikan jumlah klaster optimal yang sama yaitu empat klaster. Hasil ini berdasarkan nilai indek TSS terkecil yang diperoleh sebelum dan setelah reduksi dimensi analisis indepeden yaitu empat klaster. Untuk reduksi dimensi menggunakan AWT dan CMDS jarak Euclid, masing-masing klaster beranggotakan region-region cengkeh dari orgin yang sama. Hasil ini menyajikan informasi bahwa tiap origin cengkeh mempunyai karakteristik atau informasi kimiawi yang berbeda satu sama lain. Sehingga dapat disimpulkan bahwa tiap origin cengkeh mempunyai cita rasa dan aroma yang unik. Sedangkan reduksi dimensi menggunakan CMDS jarak Mahalanobis memberikan informasi bahwa terdapat region cengkeh dari origin yang berbeda namun berada dalam klaster yang sama. Hasil ini menyajikan informasi bahwa terdapat perbedaan cita rasa antar origin cengkeh. Dari hasil-hasil ini dapat disimpulkan bahwa reduksi dimensi menggunakan AWT dan CMDS jarak Euclid bersesuaian sebelum reduksi dimensi dilakukan karena memiliki sebaran orgin dalam klaster yang hampir sama. Lebih lanjut, setelah dataset metabolit cengkeh diklasterisasi, tahapan selanjutnya adalah proses identifikasi jika terdapat dataset metabolit yang belum teridentifikasi klasternya. Selanjutnya, Artificial neural network (ANN) dan k nearest neighbor (KNN) diusulkan untuk tujuan identifikasi klaster. Dalam penelitian ini, data metabolit yang belum teridentifikasi klasternya direpresentasikan oleh data uji. Hasil yang diperoleh menunjukkan bahwa setelah reduksi dimensi menggunakan AWT dan CMDS jarak Euclid, ANN dan KNN mempunyai performa terbaik yang sama dalam hal akurasi, sensitivity, dan specificity, namun KNN lebih efisien dari segi waktu komputasi. Sedangkan setelah reduksi dimensi menggunakan CMDS jarak Mahalanobis, ANN mengungguli KNN dari segi akurasi, sensitivity, dan specificity, meskipun KNN unggul dalam hal waktu komputasi.