Riset kecerdasan buatan dalam pengolahan citra telah berkembang pesat akhir-
akhir ini. Pengolahan citra dapat dimanfaatkan dalam sistem kamera pengawas.
Sistem kamera pengawas bergantung pada manusia untuk menerjemahkan gambar
yang tertangkap pada rekaman video. Bagaimanapun, pengamatan secara manual
oleh manusia rentan terhadap distraksi dan kelelahan. Maka dari itu, penelitian ini
merancang tiga modul dengan tujuan dan fungsi yang berbeda dan diintegrasikan
menjadi satu sistem untuk membantu peran manusia dalam melakukan
pengawasan. Tiga modul tersebut terdiri dari deteksi objek, pengenalan wajah, dan
deteksi perilaku anomali untuk diintegrasi dengan state machine. Penelitian ini
menggunakan metoda Histogram Oriented Gradient-Support Vector Machine
(HOG-SVM) untuk deteksi objek, pemanfaatan deep learning Convolutional
Neural Network (CNN) berdasarkan adaptasi metoda transfer learning yang
dikombinasikan dengan arsitektur Visual Geometry Group-16 (VGG16) untuk
pengenalan wajah, serta spatiotemporal autoecnoder berdasarkan dimensi ruang
dan waktu yang didasari nilai loss dan threshold untuk mengidentifikasi perilaku
anomali. Metrik standar seperti akurasi, presisi, recall, dan f1-score digunakan
untuk menguji ketiga model dari modul tersebut. Ketiga modul diintegrasikan
dengan state machine dalam perpindahan antar modulnya. Sistem secara
keseluruhan dapat mengenali dan membedakan keadaan normal dan abnormal yang
terjadi. Akurasi keseluruhan sistem mencapai 84%, nilai presisi 84,615%, nilai
recall 94,286%, dan skor f1 89,189%.