Salah satu masalah terpenting di industri asuransi adalah kecurangan yang menyebabkan
kerugian besar. Kecurangan yang disengaja dengan cara menyembunyikan
atau menghilangkan fakta saat mengajukan klaim termasuk sebagai kegiatan
penipuan di bidang asuransi kesehatan yang menyebabkan kerugian besar bagi
perusahaan asuransi. Tindakan kecurangan semakin beragam dan jumlah data
juga berkembang sehingga cukup sulit untuk mengenali tindak kecurangan dari
sekumpulan data yang besar. Salah satu cara untuk mengatasi tindak kecurangan
ini adalah melakukan deteksi menggunakan machine learning. Pada penelitian ini,
metode machine learning yang digunakan adalah support vector machine linear dan
support vector machine nonlinear dengan kernel radial basis function dan sigmoid
yang performanya akan dibandingkan. Dalam membangun model support vector
machine, terdapat beberapa parameter yang perlu didefinisikan. Untuk mendapatkan
parameter yang optimal, diperlukan metode optimasi hyperparameter.
Dalam hal ini, metode optimasi hyperparameter yang digunakan adalah metode
grid search, random search, dan optimasi Bayesian. Selain itu, dalam mempersiapkan
data diperlukan juga beberapa metode yaitu normalisasi data, oversampling
dan pemilihan fitur agar model yang dihasilkan lebih optimal. Metode normalisasi
data yang digunakan adalah robust scaler sedangkan metode oversampling
yang digunakan adalah SMOTE. Pemilihan fitur merupakan salah satu hal penting
dalam machine learning dan sering digunakan untuk melakukan reduksi dimensi
dengan menghilangkan informasi yang tidak relevan dan berlebihan dari kumpulan
data untuk mendapatkan subset fitur yang optimal. Metode yang digunakan untuk
memilih fitur adalah recursive feature elimination (RFE). Model terbaik yang
diperoleh adalah model SVM Linear dengan 20 fitur yang dipilih melalui metode
RFE dan metode optimasi hyperparameter yang digunakan adalah metode Random
Search. Model ini menghasilkan nilai AUC pada data uji sebesar 0, 93732 yang
menunjukkan bahwa model dapat melakukan klasifikasi dengan sangat baik.