Pencurian listrik merupakan tantangan besar yang dihadapi PT PLN (Persero),
terutama dalam pengelolaan 27 juta pelanggan pascabayar yang sebagian besar
masih menggunakan meter tradisional. Identifikasi dan penanganan pencurian
listrik semakin kompleks, memerlukan pendekatan yang lebih efisien. Tidak seperti
meter pintar, meter tradisional tidak memiliki kemampuan komunikasi, sehingga
deteksi pencurian listrik masih bergantung pada proses manual. Penelitian ini
mengembangkan model deteksi pencurian listrik berbasis machine learning untuk
mengoptimalkan proses penetapan Target Operasi (TO), yakni daftar pelanggan
yang menjadi target verifikasi lapangan. Dengan menganalisis penggunaan listrik
bulanan, khususnya pada segmen rumah tangga dengan daya 450 VA penerima
subsidi pemerintah, model ini dirancang untuk mengoptimalkan pembentukan TO
yang masih dilakukan secara manual, dengan tujuan mengurangi pengamatan
subjektif sekaligus membantu subsidi dialokasikan tepat sasaran. Data konsumsi
listrik bulanan pelanggan pascabayar PLN digunakan sebagai pendekatan baru
dalam deteksi pencurian listrik, berbeda dengan penelitian lain yang umumnya
menggunakan data terbuka dan meter pintar. Berbagai model klasifikasi diuji,
termasuk Decision Tree, Random Forest, K-Nearest Neighbors, Logistic
Regression, dan Naive Bayes, dengan Random Forest menunjukkan kinerja terbaik
dalam berbagai simulasi pengujian. Penelitian ini juga memperkenalkan metode
evaluasi bertahap yang meningkatkan akurasi dengan penyaringan berlapis, di
mana hasil deteksi dari model pencurian tiga kali disaring kembali pada model
pencurian dua dan satu kali, menghasilkan TO yang lebih akurat. Kombinasi
algoritma Random Forest dan K-Nearest Neighbors menghasilkan kinerja terbaik
dengan akurasi 0,89, presisi 0,83, recall 0,98, F1-Score 0,90, dan AUC 0,89.
Temuan ini menawarkan manfaat praktis bagi PLN melalui proses penetapan TO
yang lebih objektif dan terstandarisasi, mengurangi kesalahan manusia, serta
meningkatkan efisiensi operasional.