digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Dessy Rondang Monaomi

Survei Sosial Ekonomi digunakan oleh pemerintah, stakeholders dan penetlit untuk melakukan banyak perhitungan seperti indeks harga konsumen, dan pengukuran kemiskinan. Kualitas data survei ini sangat penting sehingga tindakan pemalsuan kecil-kecilan yang dilakukan oleh enumerator dalam proses pengumpulan data dapat berdampak serius. Tindakan memalsukan data dapat berupa enumerator memalsukan sebagian atau seluruh isi wawancara, sengaja salah memberikan kode pertanyaan untuk menghindari pertanyaan lanjutan, dan enumerator tidak mendalami pertanyaan sehingga responden tidak memberikan jawaban yang relevan. Deteksi outlier digunakan oleh banyak penelitian untuk mendeteksi tindakan pemalsuan ini. Pendekatan outlier yang dilakukan penelitian ini bukan sebagai noise yang harus dihilangkan melainkan sebagai observasi yang sedikit berbeda dari perilaku normal data yang dihasilkan dari pemalsuan data. Local Outlier Factor dalam penelitian ini digunakan untuk melakukan pelabelan data antara outlier dan inlier, digunakan parameter LOF yaitu MinPTS (LB)=10 dan ambang batas data outlier lebih besar dari 2. Setelah data diberi label, digunakan 3 algoritma yang diawasi. untuk melakukan penggunaan outlier prediktif seperti Naïve Bayes, Random Forest, dan SVM. Hasil penelitian menunjukkan bahwa algoritma SVM memberikan nilai yang lebih baik dalam hal akurasi (98.67 ) dan presisi (99,49).