Smart Surveillance System atau disebut juga Smart CCTV (Close Circuit
Television) pada penelitian ini merupakan pengembangan dari konsep Smart CCTV
konvensional dengan menerapkan teknologi deep learning yang merupakan subbidang machine learning dalam mengolah data hasil ekstraksi dari Computer Vision
untuk mendeteksi dan melacak objek kendaraan secara real-time. Sistem ini
berfungsi sebagai perangkat Stand Alone tanpa memerlukan proses terpusat atau
aplikasi pendukung untuk pengolahan citra video. Data yang dihasilkan melalui
proses klasifikasi kendaraan diolah secara langsung dan menghasilkan output
dalam bentuk data teks, sehingga transmisi data menjadi lebih ringan dibandingkan
dengan Smart CCTV konvensional yang mengirimkan data berupa citra bergerak
atau video untuk diproses di perangkat pusat atau aplikasi pendukungnya. Peneliti
menggunakan tiga varian model YOLOv7, yaitu YOLOv7, YOLOv7-Tiny, dan
YOLOv7-E6, serta mengimplementasikan DeepSORT sebagai pelacak objek. Hasil
penelitian menunjukkan bahwa Model YOLOv7-Tiny menonjol dengan
peningkatan kinerja hingga 96.23% dibandingkan dengan YOLOv7 dan 97.22%
dibandingkan dengan YOLOv7-E6. Selain itu, model YOLOv7-Tiny mampu
mencapai waktu inferensi per frame sebesar 0.0235 detik, lebih cepat dari YOLOv7
(0.6226 detik per frame) dan YOLOv7-E6 (0.8449 detik per frame). Proses
optimasi perangkat dengan mengubah desktop environment dari GNOME menjadi
LXDE berhasil mengurangi penggunaan memori hingga 52.94%. Penelitian ini
juga mencakup pengujian Object Tracking dan Counter System dengan variasi
parameter Max Age, dimana tingkat akurasi tertinggi dicapai pada nilai Max Age
40, yaitu 100% untuk objek masuk dan 98.03% untuk objek keluar.
Dengan implementasi Smart Surveillance System dengan menerapkan model
YOLOv7 dan DeepSORT terbukti efektif dalam mendeteksi dan melacak objek
kendaraan secara real-time. Hasil penelitian ini menunjukkan potensi aplikasi
teknologi machine learning dan deep learning dalam pengembangan sistem
pengawasan cerdas untuk pengawasan lalu lintas dan keamanan dengan tingkat
responsifitas dan efisiensi yang tinggi, serta menghasilkan output dalam bentuk
data teks yang memfasilitasi transmisi data secara ringan dan efisien.