Estimasi kecepatan kendaraan berbasis video dapat digunakan untuk memperketat aturan berkendara maupun menjadi data tambahan dalam analisis lalu lintas tanpa harus mengubah bentuk fisik jalan raya. Metode yang digunakan dapat berupa substraksi latar belakang maupun berbasis convolutional neural network (CNN) yang masing-masing memiliki kelemahan berupa tidak dapat membedakan kelas benda bergerak dan memiliki waktu inferensi yang lambat. Pada tugas akhir ini, diusulkan sebuah pipeline arsitektur berbasis YOLO yang dioptimasi menggunakan TensorRT, pelacakan berbasis filter Kalman, dan optimasi berupa pensampelan bingkai. YOLO digunakan karena memiliki tradeoff akurasi dan kinerja yang baik. Lapisan non-YOLO direpresentasikan pada standar ONNX dan dioptimasi dengan framework TensorRT. Filter Kalman, walaupun sederhana, diuntungkan oleh model pergerakan kendaraan yang cenderung konstan, sehingga berkinerja lebih cepat daripada pelacakan berbasis CNN. Pensampelan bingkai digunakan lebih lanjut untuk mengembalikan laju bingkai video yang lebih rendah tanpa harus mengurangi informasi yang menghilangkan kapasitas deteksi dan pelacakan. Titik referensi objek pada bounding box dilakukan dengan menarik garis dari titik hilang ke titik pusat bounding box sampai menyentuh sisi bounding box.
Dari hasil pengujian, ditemukan bahwa TensorRT meningkatkan FPS sebesar 3.7x dengan pengorbanan mAP hanya 0.02. Aristektur YOLO TRT- Kalman dengan konfigurasi terbaik memiliki MAE (0.96 km/jam) dan interval error diterima (93.81%) yang lebih baik secara waktu-nyata (118 FPS) dibandingkan dengan arsitektur MaskRCNN-DeepSORT dengan MAE 1.12 km/jam dan interval error diterima 90.21% pada 3 FPS. Selain itu, pensampelan bingkai dapat digunakan sebagai tradeoff, meningkatkan 50% FPS (177 FPS) dengan pengorbanan hanya sebesar 0.11 km/jam MAE (menjadi 1.07 km/jam) untuk pensampelan 1/5. Ditemukan juga bahwa meningkatkan network size tidak menjamin peningkatan akurasi (MAE dari 0.96 menjadi 1.21 km/jam), serta pemilihan titik referensi yang diusulkan dibuktikan menurunkan akurasi.