Survei Sosial Ekonomi digunakan oleh pemerintah, stakeholders dan penetlit untuk
melakukan banyak perhitungan seperti indeks harga konsumen, dan pengukuran
kemiskinan. Kualitas data survei ini sangat penting sehingga tindakan pemalsuan
kecil-kecilan yang dilakukan oleh enumerator dalam proses pengumpulan data
dapat berdampak serius. Tindakan memalsukan data dapat berupa enumerator
memalsukan sebagian atau seluruh isi wawancara, sengaja salah memberikan kode
pertanyaan untuk menghindari pertanyaan lanjutan, dan enumerator tidak
mendalami pertanyaan sehingga responden tidak memberikan jawaban yang
relevan. Deteksi outlier digunakan oleh banyak penelitian untuk mendeteksi
tindakan pemalsuan ini. Pendekatan outlier yang dilakukan penelitian ini bukan
sebagai noise yang harus dihilangkan melainkan sebagai observasi yang sedikit
berbeda dari perilaku normal data yang dihasilkan dari pemalsuan data. Local
Outlier Factor dalam penelitian ini digunakan untuk melakukan pelabelan data
antara outlier dan inlier, digunakan parameter LOF yaitu MinPTS (LB)=10 dan
ambang batas data outlier lebih besar dari 2. Setelah data diberi label, digunakan 3
algoritma yang diawasi. untuk melakukan penggunaan outlier prediktif seperti
Naïve Bayes, Random Forest, dan SVM. Hasil penelitian menunjukkan bahwa
algoritma SVM memberikan nilai yang lebih baik dalam hal akurasi (98.67 ) dan
presisi (99,49).