digilib@itb.ac.id +62 812 2508 8800

Minyak kelapa sawit merupakan komoditas strategis utama di Indonesia dengan volume produksi dan ekspor yang menempati posisi teratas di dunia. Untuk menjaga daya saing di pasar global, kualitas minyak sawit terutama minyak sawit mentah (CPO) perlu dikendalikan secara akurat melalui parameter seperti asam lemak bebas (FFA) dan kadar air. Metode spektroskopi Raman yang dikombinasikan dengan machine learning menawarkan analisis yang cepat dan non-destruktif untuk penentuan kualitas CPO. Namun dalam pengujian kualitas dapat menggunakan instrumen spektroskopi Raman dengan jenis yang berbeda atau variasi batch produksi CPO menyebabkan adanya variabilitas data spektrum Raman. Sehingga diperlukan pengembangan model prediksi kualitas CPO yang mampu menangani variabilitas data multi-instrumen dan multi-batch. Data spektrum Raman diperoleh menggunakan dua jenis instrumen, yaitu HORIBA MacroRAM™ dan YIXIST Portable Raman Spectrometer. Sampel CPO dikelompokkan ke dalam tiga batch utama yang merepresentasikan variasi sumber produksi serta perbedaan konfigurasi pengukuran instrumen. Tahapan penelitian terdiri dari preparasi, preprocessing¸ pembagian data sesuai variabilitas data multiinstrumen dan multi-batch, uji korelasi untuk spektrum Raman multi-instrumen, pengembangan model prediksi dengan menggunakan berbagai macam algoritma machine learning, serta evaluasi model menggunakan MAE untuk regresi dan skor F1 untuk klasifikasi. Hasil uji korelasi spektrum Raman multi-instrumen di rentang 0,72 – 0,77 menunjukkan adanya tingkat kemiripan pola spektral yang cukup kuat, meskipun belum mencerminkan kesesuaian yang sangat tinggi antara spektrum yang dihasilkan oleh kedua instrumen. Analisis model regresi menunjukkan bahwa algoritma decision tree merupakan algoritma terbaik sebagai dalam memprediksi FFA dan kadar air baik pada skenario multi-instrumen (rentang kesalahan rata-rata prediksi sebesar 0% sampai 22,2% untuk FFA dan 0% sampai 1,3% untuk kadar air) dan multi-batch (rentang kesalahan rata-rata prediksi sebesar 1,05% hingga 2,72 untuk FFA dan 1,01% hingga 1,1%untuk kadar air). Analisis model klasifikasi menunjukkan bahwa algoritma random forest merupakan algoritma terbaik sebagai dalam memprediksi FFA dan kadar air baik pada skenario multi-instrumen maupun multi-batch dengan skor F1 sama dengan 1 dan akurasi mencapai 100%. Selain itu, hasil penggunaan dataset gabungan baik sebagai data latih maupun data prediksi pada variabilitas multi-instrumen atau multi-batch terbukti mampu meningkatkan kestabilan dan kemampuan generalisasi model.