digilib@itb.ac.id +62 812 2508 8800

Ihsan Fauzi [23521024].pdf
PUBLIC Dessy Rondang Monaomi

Ketidakseimbangan data atau imbalanced data merupakan suatu kondisi dimana terdapat perbadingan yang sangat jauh antara jumlah data pada satu kelas dengan jumlah data pada kelas lain. Pada beberapa kasus imbalanced data, algoritma klasifikasi tidak mampu melakukan prediksi yang tepat terhadap kelas minoritas meskipun akurasi yang dihasilkan tinggi. Padahal, ketepatan perdiksi terhadap kelas minoritas jauh lebih penting misalnya pada kasus diagnosis medis penyakit langka dimana penyakit tersebut sangat perlu untuk dideteksi. Dalam mengatasi permasalahan imbalanced data tersebut, penelitian ini mengusulkan metode resampling bauran yang menggabungkan metode undersampling yang diusulkan oleh Mirzaei dkk. dan metode oversampling yang diusulkan oleh Xiaolong dkk. dimana kedua metode tersebut dilakukan berdasarkan densitas menggunakan algoritma DBSCAN untuk melakukan resampling. Namun, algoritma DBSCAN sangat sensitif terhadap nilai parameter minPts dan Eps sehingga penelitian lain menggunakan Particle Swarm Optimization (PSO) dalam menentukan kedua parameter tersebut. Untuk itu, metode resampling bauran yang diusulkan penelitian ini menggunakan Particle Swarm Optimization (PSO) dalam menentukan nilai minPts dan Eps pada algoritma DBSCAN yang digunakan dalam melakukan undersampling dan oversampling.