digilib@itb.ac.id +62 812 2508 8800

2024 JEREMY ABSTRAK
PUBLIC Dwi Ary Fuziastuti

Salah satu masalah terpenting di industri asuransi adalah kecurangan yang menyebabkan kerugian besar. Kecurangan yang disengaja dengan cara menyembunyikan atau menghilangkan fakta saat mengajukan klaim termasuk sebagai kegiatan penipuan di bidang asuransi kesehatan yang menyebabkan kerugian besar bagi perusahaan asuransi. Tindakan kecurangan semakin beragam dan jumlah data juga berkembang sehingga cukup sulit untuk mengenali tindak kecurangan dari sekumpulan data yang besar. Salah satu cara untuk mengatasi tindak kecurangan ini adalah melakukan deteksi menggunakan machine learning. Pada penelitian ini, metode machine learning yang digunakan adalah support vector machine linear dan support vector machine nonlinear dengan kernel radial basis function dan sigmoid yang performanya akan dibandingkan. Dalam membangun model support vector machine, terdapat beberapa parameter yang perlu didefinisikan. Untuk mendapatkan parameter yang optimal, diperlukan metode optimasi hyperparameter. Dalam hal ini, metode optimasi hyperparameter yang digunakan adalah metode grid search, random search, dan optimasi Bayesian. Selain itu, dalam mempersiapkan data diperlukan juga beberapa metode yaitu normalisasi data, oversampling dan pemilihan fitur agar model yang dihasilkan lebih optimal. Metode normalisasi data yang digunakan adalah robust scaler sedangkan metode oversampling yang digunakan adalah SMOTE. Pemilihan fitur merupakan salah satu hal penting dalam machine learning dan sering digunakan untuk melakukan reduksi dimensi dengan menghilangkan informasi yang tidak relevan dan berlebihan dari kumpulan data untuk mendapatkan subset fitur yang optimal. Metode yang digunakan untuk memilih fitur adalah recursive feature elimination (RFE). Model terbaik yang diperoleh adalah model SVM Linear dengan 20 fitur yang dipilih melalui metode RFE dan metode optimasi hyperparameter yang digunakan adalah metode Random Search. Model ini menghasilkan nilai AUC pada data uji sebesar 0, 93732 yang menunjukkan bahwa model dapat melakukan klasifikasi dengan sangat baik.