digilib@itb.ac.id +62 812 2508 8800

Salah satu permasalahan utama dalam industri asuransi adalah kecurangan dalam pengajuan klaim yang menimbulkan kerugian finansial yang besar bagi perusahaan asuransi. Tindakan kecurangan tersebut dapat berupa manipulasi data, pengajuan klaim fiktif, maupun penggelembungan nilai klaim yang valid. Seiring meningkatnya kompleksitas dan volume data, diperlukan sistem pendukung keputusan yang mampu mendeteksi fraud secara efisien. Salah satu pendekatan yang dapat digunakan untuk mengatasi permasalahan ini adalah penerapan metode machine learning. Dengan memanfaatkan machine learning, sistem dapat belajar dari data historis untuk mengenali pola-pola kecurangan secara otomatis tanpa perlu aturan eksplisit dan mampu melakukan klasifikasi data dengan lebih adaptif. Pada penelitian ini, beberapa metode machine learning digunakan untuk membangun model prediksi fraud klaim asuransi, yaitu Random Forest, XGBoost, CatBoost dan Multi-Layer Perceptron (MLP) sebagai algoritma supervised learning, serta Isolation Forest sebagai pendekatan unsupervised learning untuk deteksi anomali. Model dibangun berdasarkan data yang mencerminkan karakteristik polis dan insiden klaim. Sebelum pelatihan model, dilakukan proses eksplorasi data, standarisasi, penyeimbangan data menggunakan SMOTE untuk mengatasi data tidak seimbang, serta pemilihan fitur untuk mengurangi noise dan meningkatkan performa model. Selain itu, dilakukan pula proyeksi data menggunakan PCA guna membantu visualisasi dan validasi hasil model. Evaluasi dilakukan menggunakan metrik confusion matrix, AUC-ROC, dan recall terhadap klaim fraud. Hasil pengujian menunjukkan bahwa model CatBoost memberikan performa terbaik dengan nilai AUC sebesar 0,84 dan recall sebesar 0,84. Model XGBoost dan Random Forest menunjukkan performa yang serupa dengan AUC masing-masing sebesar 0,81 dan 0,82. Model MLP yang semula menunjukkan performa rendah meningkat signifikan setelah dilakukan standarisasi data, dengan AUC sebesar 0,84 dan recall sebesar 0,73. Selain itu, Isolation Forest berhasil mendeteksi sekitar 5% data sebagai anomali yang sebagian besar sesuai dengan label fraud aktual. Analisis fitur menunjukkan bahwa fitur seperti tingkat keparahan insiden, hobi tertanggung, serta rasio antara jumlah klaim dan premi memiliki peran penting dalam mengklasifikasikan klaim sebagai fraud atau non-fraud. Dengan pendekatan model prediksi ini, sistem dapat mengidentifikasi klaim mencurigakan secara lebih efektif dan memberikan kontribusi pada pengembangan sistem pendukung keputusan yang adaptif dan berbasis data.