Ketidakseimbangan data atau imbalanced data merupakan suatu kondisi dimana
terdapat perbadingan yang sangat jauh antara jumlah data pada satu kelas dengan
jumlah data pada kelas lain. Pada beberapa kasus imbalanced data, algoritma
klasifikasi tidak mampu melakukan prediksi yang tepat terhadap kelas minoritas
meskipun akurasi yang dihasilkan tinggi. Padahal, ketepatan perdiksi terhadap kelas
minoritas jauh lebih penting misalnya pada kasus diagnosis medis penyakit langka
dimana penyakit tersebut sangat perlu untuk dideteksi. Dalam mengatasi
permasalahan imbalanced data tersebut, penelitian ini mengusulkan metode
resampling bauran yang menggabungkan metode undersampling yang diusulkan
oleh Mirzaei dkk. dan metode oversampling yang diusulkan oleh Xiaolong dkk.
dimana kedua metode tersebut dilakukan berdasarkan densitas menggunakan
algoritma DBSCAN untuk melakukan resampling. Namun, algoritma DBSCAN
sangat sensitif terhadap nilai parameter minPts dan Eps sehingga penelitian lain
menggunakan Particle Swarm Optimization (PSO) dalam menentukan kedua
parameter tersebut. Untuk itu, metode resampling bauran yang diusulkan penelitian
ini menggunakan Particle Swarm Optimization (PSO) dalam menentukan nilai
minPts dan Eps pada algoritma DBSCAN yang digunakan dalam melakukan
undersampling dan oversampling.