ANALISIS KLASIFIKASI DAN TEMPORAL-SPASIAL PADA DATASET TIDAK SEIMBANG MENGGUNAKAN PEMBELAJARAN MESIN (STUDI KASUS: DATA KEJAHA TAN DI KOTA BANDUNG) TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh Irfan Irfani NIM: 20122009 (Program Studi Magister Matematika) INSTITUT TEKNOLOGI BANDUNG JULI 2024 i ABSTRAK ANALISIS KLASIFIKASI DAN TEMPORAL-SPASIAL PADA DATASET TIDAK SEIMBANG MENGGUNAKAN PEMBELAJARAN MESIN (STUDI KASUS: DATA KEJAHA TAN DI KOTA BANDUNG) Oleh Irfan Irfani NIM: 20122009 (Program Studi Magister Matematika) Kejahatan merupakan masalah serius yang memengaruhi keamanan dan kesejahteraan masyarakat. Dengan perkembangan teknologi informasi, analisis data kriminal menggunakan metode klasifikasi dan temporal-spasial yang telah menjadi fokus utama dalam upaya pencegahan dan penanganan kejahatan, khususnya di kota besar seperti Bandung. Penelitian ini mengeksplorasi berbagai metode klasifikasi data, termasuk Decision Tree, Random Forest, dan Analisis Diskriminan (Linier dan Kuadratik), untuk mengidentifikasi faktor-faktor yang memengaruhi kejadian kejahatan. Teknik Synthetic Minority Oversampling Technique (SMOTE) dan Tomek Link digunakan untuk mengatasi ketidakseimbangan kelas dalam dataset kejahatan. Hasil penelitian menunjukkan bahwa model Random Forest dengan teknik sampling data dan hyperparameter tuning menggunakan Grid Search Optimization memberikan prediksi yang lebih baik dibandingkan dengan model Decision Tree dan Analisis Diskriminan (Linier dan Kuadratik). Selain itu, penelitian ini juga menerapkan metode Ordinary Kriging (OK) untuk analisis temporal-spasial kejahatan, yang melibatkan tiga tahap utama: mengklasifikasikan jarak Ž ��, memilih semivariogram yang cocok, dan melakukan Ordinary Kriging (OK). Pendekatan ini membantu dalam pola dan tren pemetaan lokasi kejahatan dan deteksi konsentrasi spasial kejahatan. Kata kunci: Kejahatan, Decision Tree, Random Forest, Analisis Diskriminan, SMOTE, Tomek Link, Grid Search Optimization, Ordinary Kriging (OK) ii ABSTRACT CLASSIFICATION AND SPATIO-TEMPORAL ANALYSIS ON IMBALANCED DATASET USING MACHINE LEARNING (CASE STUDY: CRIME DATA IN BANDUNG CITY) By Irfan Irfani NIM: 20122009 (Master Program in Mathematics) Crime is a serious issue affecting the safety and well-being of society. With the advancement of information technology, the analysis of criminal data using classification and spatial-temporal methods has become a primary focus in crime prevention and management efforts, particularly in major cities like Bandung. This study explores various data classification methods, including Decision Tree, Random Forest, and Discriminant Analysis (Linear and Quadratic), to identify factors influencing crime occurrences. Synthetic Minority Oversampling Technique (SMOTE) and Tomek Link techniques are used to address class imbalance in the crime dataset. The results indicate that the Random Forest model with data sampling techniques and hyperparameter tuning using Grid Search Optimization provides better predictions compared to the Decision Tree and Discriminant Analysis (Linear and Quadratic) models. Additionally, this study applies the Ordinary Kriging (OK) method for spatial-temporal crime analysis, involving three main stages: classifying the distance Ž ��, selecting an appropriate semivariogram, and performing Ordinary Kriging (OK). This approach aids in mapping crime location patterns and trends and detecting the spatial concentration of crimes. Keywords: Crime, Decision Tree, Random Forest, Discriminant Analysis, SMOTE, Tomek Link, Grid Search Optimization, Ordinary Kriging (OK) iii ANALISIS KLASIFIKASI DAN TEMPORAL-SPASIAL PADA DATASET TIDAK SEIMBANG MENGGUNAKAN PEMBELAJARAN MESIN (STUDI KASUS: DATA KEJAHA TAN DI KOTA BANDUNG) Oleh Irfan Irfani NIM: 20122009 (Program Studi Magister Matematika) Institut Teknologi Bandung Menyetujui Pembimbing Tanggal 1 Juli 2024 _____________________________ Dr. Utriweni Mukhaiyar, S.Si., M.Si.