Dalam studi metabolomik, analisis independen atau replikasi eksperimen
pengukuran konsentrasi metabolit selalu dilakukan untuk mengantisipasi galat
pengukuran. Di sisi lain, ukuran dataset akan semakin meningkat dengan adanya
analisis independen tersebut. Untuk tujuan klastersasi, mendapatkan informasi
kimiawi yang representatif dari beberapa analisis independen diperlukan. Oleh
karena itu, metode reduksi dimensi analisis independen yang tepat diperlukan
sehingga data yang merepresentasikan informasi kimiawi dari beberapa analisis
independen dapat diperoleh. Untuk tujuan reduksi dimensi analisis independen,
algoritma Weiszfeld termodifikasi (AWT) dan classical multidimensional scaling
(CMDS) dengan jarak Euclid dan Mahalanobis diusulkan. Dataset metabolit
sebelum dan setelah reduksi dimensi analisis independen kemudian diklasterisasi
menggunakan pendekatan fuzzy clustering dengan indeks Tang Sun Sun (TSS)
sebagai indeks validitas klaster. Hasil klasterisasi sebelum dan setelah reduksi
dimensi dilakukan memberikan jumlah klaster optimal yang sama yaitu empat
klaster. Hasil ini berdasarkan nilai indek TSS terkecil yang diperoleh sebelum
dan setelah reduksi dimensi analisis indepeden yaitu empat klaster. Untuk reduksi
dimensi menggunakan AWT dan CMDS jarak Euclid, masing-masing klaster
beranggotakan region-region cengkeh dari orgin yang sama. Hasil ini menyajikan
informasi bahwa tiap origin cengkeh mempunyai karakteristik atau informasi
kimiawi yang berbeda satu sama lain. Sehingga dapat disimpulkan bahwa tiap
origin cengkeh mempunyai cita rasa dan aroma yang unik. Sedangkan reduksi
dimensi menggunakan CMDS jarak Mahalanobis memberikan informasi bahwa
terdapat region cengkeh dari origin yang berbeda namun berada dalam klaster
yang sama. Hasil ini menyajikan informasi bahwa terdapat perbedaan cita rasa
antar origin cengkeh. Dari hasil-hasil ini dapat disimpulkan bahwa reduksi
dimensi menggunakan AWT dan CMDS jarak Euclid bersesuaian sebelum reduksi
dimensi dilakukan karena memiliki sebaran orgin dalam klaster yang hampir sama.
Lebih lanjut, setelah dataset metabolit cengkeh diklasterisasi, tahapan selanjutnya
adalah proses identifikasi jika terdapat dataset metabolit yang belum teridentifikasi
klasternya. Selanjutnya, Artificial neural network (ANN) dan k nearest neighbor
(KNN) diusulkan untuk tujuan identifikasi klaster. Dalam penelitian ini, data
metabolit yang belum teridentifikasi klasternya direpresentasikan oleh data uji. Hasil yang diperoleh menunjukkan bahwa setelah reduksi dimensi menggunakan
AWT dan CMDS jarak Euclid, ANN dan KNN mempunyai performa terbaik yang
sama dalam hal akurasi, sensitivity, dan specificity, namun KNN lebih efisien dari
segi waktu komputasi. Sedangkan setelah reduksi dimensi menggunakan CMDS
jarak Mahalanobis, ANN mengungguli KNN dari segi akurasi, sensitivity, dan
specificity, meskipun KNN unggul dalam hal waktu komputasi.