Perpustakaan Digital - Digilib ITB

IDENTIFIKASI KECURANGAN PENYEDIA LAYANAN KESEHATAN MENGGUNAKAN SUPPORT VECTOR MACHINE

90 views

Penulis	:	Jeremy [10820034]
Kontributor / Dosen Pembimbing	:	Dila Puspita, S.Si., M.Si., Ph.D.
Jenis Koleksi	:	Tugas Akhir
Penerbit	:	Aktuaria
Fakultas	:	Fakultas Matematika dan Ilmu Pengetahuan Alam
Subjek	:
Kata Kunci	:	Identifikasi Kecurangan, Support Vector Machine, Optimasi Hyperparameter, Kernel
Sumber	:
Staf Input/Edit	:	Dwi Ary Fuziastuti
File	:	1 file
Tanggal Input	:	12 Jun 2024

2024 JEREMY ABSTRAK

PUBLIC Dwi Ary Fuziastuti

Salah satu masalah terpenting di industri asuransi adalah kecurangan yang menyebabkan kerugian besar. Kecurangan yang disengaja dengan cara menyembunyikan atau menghilangkan fakta saat mengajukan klaim termasuk sebagai kegiatan penipuan di bidang asuransi kesehatan yang menyebabkan kerugian besar bagi perusahaan asuransi. Tindakan kecurangan semakin beragam dan jumlah data juga berkembang sehingga cukup sulit untuk mengenali tindak kecurangan dari sekumpulan data yang besar. Salah satu cara untuk mengatasi tindak kecurangan ini adalah melakukan deteksi menggunakan machine learning. Pada penelitian ini, metode machine learning yang digunakan adalah support vector machine linear dan support vector machine nonlinear dengan kernel radial basis function dan sigmoid yang performanya akan dibandingkan. Dalam membangun model support vector machine, terdapat beberapa parameter yang perlu didefinisikan. Untuk mendapatkan parameter yang optimal, diperlukan metode optimasi hyperparameter. Dalam hal ini, metode optimasi hyperparameter yang digunakan adalah metode grid search, random search, dan optimasi Bayesian. Selain itu, dalam mempersiapkan data diperlukan juga beberapa metode yaitu normalisasi data, oversampling dan pemilihan fitur agar model yang dihasilkan lebih optimal. Metode normalisasi data yang digunakan adalah robust scaler sedangkan metode oversampling yang digunakan adalah SMOTE. Pemilihan fitur merupakan salah satu hal penting dalam machine learning dan sering digunakan untuk melakukan reduksi dimensi dengan menghilangkan informasi yang tidak relevan dan berlebihan dari kumpulan data untuk mendapatkan subset fitur yang optimal. Metode yang digunakan untuk memilih fitur adalah recursive feature elimination (RFE). Model terbaik yang diperoleh adalah model SVM Linear dengan 20 fitur yang dipilih melalui metode RFE dan metode optimasi hyperparameter yang digunakan adalah metode Random Search. Model ini menghasilkan nilai AUC pada data uji sebesar 0, 93732 yang menunjukkan bahwa model dapat melakukan klasifikasi dengan sangat baik.

Perpustakaan Digital ITB

IDENTIFIKASI KECURANGAN PENYEDIA LAYANAN KESEHATAN MENGGUNAKAN SUPPORT VECTOR MACHINE

Artikel Terkait