Hasil Ringkasan
MODEL DETEKSI OUTLIER PADA DATA SOSIAL EKONOMI, STUDI KASUS: SURVEI SOSIAL EKONOMI NASIONAL TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh MUNIAGA, IVANDER NIM: 23220010 (Program Studi Magister Teknik Elektro) INSTITUT TEKNOLOGI BANDUNG AGUSTUS 2024 i ABSTRAK MODEL DETEKSI OUTLIER PADA DATA SOSIAL EKONOMI, STUDI KASUS: SURVEI SOSIAL EKONOMI NASIONAL Oleh Muniaga, Ivander NIM: 23220010 (Program Studi Magister Teknik Elektro) Survei Sosial Ekonomi digunakan oleh pemerintah, stakeholders dan penetlit untuk melakukan banyak perhitungan seperti indeks harga konsumen, dan pengukuran kemiskinan. Kualitas data survei ini sangat penting sehingga tindakan pemalsuan kecil-kecilan yang dilakukan oleh enumerator dalam proses pengumpulan data dapat berdampak serius. Tindakan memalsukan data dapat berupa enumerator memalsukan sebagian atau seluruh isi wawancara, sengaja salah memberikan kode pertanyaan untuk menghindari pertanyaan lanjutan, dan enumerator tidak mendalami pertanyaan sehingga responden tidak memberikan jawaban yang relevan. Deteksi outlier digunakan oleh banyak penelitian untuk mendeteksi tindakan pemalsuan ini. Pendekatan outlier yang dilakukan penelitian ini bukan sebagai noise yang harus dihilangkan melainkan sebagai observasi yang sedikit berbeda dari perilaku normal data yang dihasilkan dari pemalsuan data. Local Outlier Factor dalam penelitian ini digunakan untuk melakukan pelabelan data antara outlier dan inlier, digunakan parameter LOF yaitu MinPTS (LB)=10 dan ambang batas data outlier lebih besar dari 2. Setelah data diberi label, digunakan 3 algoritma yang diawasi. untuk melakukan penggunaan outlier prediktif seperti Naïve Bayes, Random Forest, dan SVM. Hasil penelitian menunjukkan bahwa algoritma SVM memberikan nilai yang lebih baik dalam hal akurasi (98.67 ) dan presisi (99,49). Kata kunci: Social Ekonomi, Outlers Deteksi, Local Outlier Factor, Supervise Algoritma ii ABSTRACT OUTLIER DETECTION MODEL IN SOCIAL ECONOMIC DATA, CASE STUDY: NATIONAL SOCIAL ECONOMIC SURVEY By Muniaga, Ivander NIM: 23220010 (Master’s Program in Electrical Engineering) Social Economic Survey used by government and researches to perform many calculations such as consumer price index, and poverty measurement. The quality of this survey data is so important that small amount of falsifying act conduct by enumerator in the process of gathering the data can have serious impact. The act of falsifying the data can be such as enumerator falsify part or all of the interview content, deliberately miscoding a question to avoid follow-up questions and enumerators did not go in depth with the questions so that respondents did not provide relevant answer. Outlier detection used by many researches to detect this falsifying act. Outlier approach by this study not as noise that should be removed rather but as observation that slightly different from normal behavior of data that result from falsifying the data. Local Outlier Factor use in this study to perform labelling the data between outlier and inlier, we use parameter of LOF such as MinPTS (LB)=10 and threshold of outlier data greater than 2. After the data has been labelled, 3 supervised algorithm use to perform predictive outlier use such as Naïve Bayes, Random Forest and SVM. The results shows that SVM algorithm give better value in accuracy(98.67 ) and precision (99,49). Keywords— Social economic, outliers detection, Local Outlier Factor, Supervise Algorithm iv PEDOMAN PENGGUNAAN TESIS Tesis Magister yang tidak dipublikasikan terdaftar dan tersedia di Perpustakaan Institut Teknologi Bandung, dan terbuka untuk umum dengan ketentuan bahwa hak cipta ada pada penulis dengan mengikuti aturan HaKI yang berlaku di Institut Teknologi Bandung. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau peringkasan hanya dapat dilakukan seizin penulis dan harus disertai dengan kaidah ilmiah untuk menyebutkan sumbernya. Sitasi hasil penelitian Tesis ini dapat di tulis dalam bahasa Indonesia sebagai berikut: Muniaga, Ivander.