Hasil Ringkasan
OPTIMASI DETEKSI ANOMALI PADA DATA AUTOMATIC METER READING DENGAN PENDEKATAN ONE -CLASS CLASSIFICATION TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ARDIK CRISDIANTO NIM: 23522312 (Program Studi Magister Informatika) INSTITUT TEKNOLOGI BANDUNG Februari 2025 i ABSTRAK OPTIMASI DETEKSI ANOMALI PADA DATA AUTOMATIC METER READING DENGAN PENDEKATAN ONE -CLASS CLASSIFICATION Oleh Ardik Crisdianto NIM: 23522312 (Program Studi Magister Informatika) Deteksi anomali pada data pembacaan meter listrik berbasis Automatic Meter Reading (AMR) menjadi penting untuk mendeteksi penyimpangan seperti pencurian listrik atau kesalahan teknis pada peralatan. Penelitian ini berfokus pada penerapan dan analisis tiga pendekatan utama, yaitu One-Class SVM (OCSVM), Deep Support Vector Data Description (DeepSVDD), dan Autoencoder dalam mendeteksi anomali pada dataset listrik dengan skenario standalone maupun hybrid. Dataset yang digunakan berisi data time-series yang mencakup fitur tegangan, arus, sudut arus, serta informasi tambahan seperti tarif pelanggan. Tujuan penelitian adalah mengevaluasi efektivitas masing-masing model standalone dalam mendeteksi anomali dan mengusulkan metode perbaikan melalui kombinasi dengan model Random Forest serta penambahan fitur berupa skor anomali dan fitur temporal. Pada skenario pertama OCSVM diterapkan sebagai model standalone. Model ini menunjukkan performa yang moderat dalam deteksi anomali. Pendekatan kedua menggunakan DeepSVDD, model berbasis neural network yang mempelajari representasi laten dari data normal dan meminimalkan jarak ke centroid dalam ruang fitur laten. Model ini memberikan fleksibilitas lebih besar dalam menangkap pola kompleks dibandingkan OCSVM. Pendekatan ketiga menggunakan Autoencoder, yang melibatkan rekonstruksi data input dan menghitung error rekonstruksi sebagai skor anomali. Autoencoder memberikan kemampuan yang baik dalam menangkap pola hubungan antar fitur. Sebagai langkah perbaikan, masing-masing pendekatan standalone diintegrasikan dengan model Random Forest. Pada pendekatan ini, skor anomali yang dihasilkan oleh model standalone ditambahkan sebagai fitur baru pada data validasi dan tes, kemudian digunakan untuk melatih Random Forest sebagai model klasifikasi akhir. Random Forest dipilih karena kemampuannya menangani data dengan distribusi tidak seimbang serta memberikan probabilitas klasifikasi yang dapat dievaluasi menggunakan metrik seperti AUC-ROC. Hasil eksperimen menunjukkan bahwa kombinasi model standalone dengan Random Forest memberikan peningkatan yang signifikan dalam performa, terutama dalam metrik seperti precision, recall, dan F1-score serta perbaikan kinerja pada False Positive dan False Negative. Model ii DeepSVDD dengan Random Forest secara umum menunjukkan hasil terbaik menggunakan data tes dengan Accuracy 0.9805, Precision 0.9805, Recal 0.9804 dan F1-Score 0.9805 dengan AUC 0.9946, menunjukkan bahwa DeepSVDD lebih stabil dalam menghadapi data baru dan lebih baik dalam menangkap representasi anomali. Kata kunci: deteksi anomali, one-class classification, AMR. iii ABSTRACT OPTIMIZATION OF ANOMALY DETECTION IN AUTOMATIC METER READING DATA USING ONE-CLASS CLASSIFICATION APPROACH By Ardik Crisdianto NIM: 23522312 (Master’s Program in Informatics) Anomaly detection in electricity meter reading data based on Automatic Meter Reading (AMR) is crucial for identifying irregularities such as electricity theft or technical errors in equipment. This study focuses on the implementation and analysis of three primary approaches: One-Class SVM (OCSVM), Deep Support Vector Data Description (DeepSVDD), and Autoencoder in detecting anomalies in electricity datasets, both in standalone and hybrid scenarios. The dataset used consists of time-series data, including voltage, current, current angle, and additional information such as customer tariff. The objective of this study is to evaluate the effectiveness of each standalone model in anomaly detection and to propose improvements through the combination of these models with Random Forest, as well as the addition of anomaly scores and temporal features.