Minyak kelapa sawit merupakan komoditas strategis utama di Indonesia dengan
volume produksi dan ekspor yang menempati posisi teratas di dunia. Untuk
menjaga daya saing di pasar global, kualitas minyak sawit terutama minyak sawit
mentah (CPO) perlu dikendalikan secara akurat melalui parameter seperti asam
lemak bebas (FFA) dan kadar air. Metode spektroskopi Raman yang
dikombinasikan dengan machine learning menawarkan analisis yang cepat dan
non-destruktif untuk penentuan kualitas CPO. Namun dalam pengujian kualitas
dapat menggunakan instrumen spektroskopi Raman dengan jenis yang berbeda atau
variasi batch produksi CPO menyebabkan adanya variabilitas data spektrum
Raman. Sehingga diperlukan pengembangan model prediksi kualitas CPO yang
mampu menangani variabilitas data multi-instrumen dan multi-batch.
Data spektrum Raman diperoleh menggunakan dua jenis instrumen, yaitu HORIBA
MacroRAM™ dan YIXIST Portable Raman Spectrometer. Sampel CPO
dikelompokkan ke dalam tiga batch utama yang merepresentasikan variasi sumber
produksi serta perbedaan konfigurasi pengukuran instrumen. Tahapan penelitian
terdiri dari preparasi, preprocessing¸ pembagian data sesuai variabilitas data multiinstrumen dan multi-batch, uji korelasi untuk spektrum Raman multi-instrumen,
pengembangan model prediksi dengan menggunakan berbagai macam algoritma
machine learning, serta evaluasi model menggunakan MAE untuk regresi dan skor
F1 untuk klasifikasi.
Hasil uji korelasi spektrum Raman multi-instrumen di rentang 0,72 – 0,77
menunjukkan adanya tingkat kemiripan pola spektral yang cukup kuat, meskipun
belum mencerminkan kesesuaian yang sangat tinggi antara spektrum yang
dihasilkan oleh kedua instrumen. Analisis model regresi menunjukkan bahwa
algoritma decision tree merupakan algoritma terbaik sebagai dalam memprediksi
FFA dan kadar air baik pada skenario multi-instrumen (rentang kesalahan rata-rata
prediksi sebesar 0% sampai 22,2% untuk FFA dan 0% sampai 1,3% untuk kadar
air) dan multi-batch (rentang kesalahan rata-rata prediksi sebesar 1,05% hingga
2,72 untuk FFA dan 1,01% hingga 1,1%untuk kadar air). Analisis model klasifikasi
menunjukkan bahwa algoritma random forest merupakan algoritma terbaik sebagai dalam memprediksi FFA dan kadar air baik pada skenario multi-instrumen maupun
multi-batch dengan skor F1 sama dengan 1 dan akurasi mencapai 100%. Selain itu,
hasil penggunaan dataset gabungan baik sebagai data latih maupun data prediksi
pada variabilitas multi-instrumen atau multi-batch terbukti mampu meningkatkan
kestabilan dan kemampuan generalisasi model.
Perpustakaan Digital ITB