Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Dengan perkembangan dan pengimplementasian teknologi video streaming yang
pesat, dibutuhkan atas peningkatan akurasi dan performa dari video analytics,
namun ketersediaan sumber daya komputasi dan jaringan seperti bandwidth yang
terbatas menjadi kendala utamanya. Hal ini disebabkan karena ketersediaan sumber
daya untuk video analytics didistribusikan secara statis dan video analytics kurang
adaptif terhadap sumber daya komputasi dan jaringan yang dibutuhkan oleh video
stream yang terus mengalami perubahan konten. Oleh karena itu, dibutuhkan suatu
sistem yang dapat meningkatkan akurasi inferensi dari video analytics secara
adaptif.
Sebagai alternatif solusi terhadap masalah tersebut, dirancang dan dikembangkan
sebuah sistem terintegrasi yang meningkatkan akurasi inferensi melalui alokasi
sumber daya bandwidth dan optimasi konfigurasi paratemeter kompresi video.
Topik yang dibawa pada Buku Tugas Akhir ini oleh penulis adalah pada subsistem
yang melakukan optimasi konfigurasi parameter dengan menggunakan DNN driven
streaming, atau DDS. Subsistem DDS dikembangkan oleh Du et al. yang
menggunakan sistem feedback oleh DNN untuk melakukan pengaturan parameter
pengkodean dan kompresi video untuk mencapai akurasi inferensi yang tinggi
secara efisien. Pada sisi konfigurasi parameter kompresi video, subsistem DDS
yang dirancang oleh Du et al. menggunakan konfigurasi yang masih default,
sehingga memiliki ruang untuk perkembangan dan penelitian. Persyaratan desain
dari subsistem DDS terdiri tiga, yaitu latensi E2E yang tidak melebih 1 detik,
peningkatan akurasi inferensi hasil optimasi konfigurasi parameter video, dan
penggunaan Linux sebagai OS yang bersifat open source.
Subsistem DDS menerima masukan video lalu melakukan pengkodean dan
kompresi yang pertama untuk menghasilkan video stream berkualitas rendah. Video
stream tersebut kemudian dikirim ke server untuk dievaluasi oleh model deteksi
objek, yaitu Faster RCNN. Hasil dari evaluasi tersebut kemudian digunakan sebagai
feedback yang mengandung informasi atas semua region setiap frame dari video
yang relevan terhadap akurasi inferensi, sehingga region tersebut diutamakan untuk
ditingkatkan kualitasnya. Dengan menggunakan feedback hasil evaluasi Faster
RCNN pada server, subsistem DDS akan melakukan pengkodean dan kompresi
ii
ulang untuk menghasilkan video stream berkualitas tinggi, sehingga dapat
mencapai akurasi inferensi yang lebih tinggi. Subsistem DDS dikembangkan pada
OS Linux, sesuai dengan persyaratan desain atas OS open source, yang
menjalankan sejumlah program Python dan menggunakan FFMPEG untuk
kompresi video. Subsistem DDS dijalankan pada mode emulasi untuk memperoleh
hasil ground truth, lalu dilanjutkan dalam mode implementasai dimana hasilnya
dibandingkan dengan ground truth untuk memperoleh nilai akurasi inferensi
subsistem.
Pada pengujian subsistem DDS, pertama diuji untuk mengamati pengaruh hasil
optimasi konfigurasi terhadap tanpa optimasi (default), lalu diuji parameter entropy
coding, motion estimation, direct prediction, ukuran macroblock, latensi E2E, dan
perbandingan performa antara standar kompresi video H.264 dan H.265. Pengujian
dilakukan dengan menggunakan sejumlah dataset video yang dikategorikan
berdasarkan kecepatan pergerakan objek, sehingga dibagi menjadi high motion dan
low motion. Pada kedua standar kompresi video, diperoleh peningkatan akurasi
inferensei terhadap parameter default sebesar 12.14% untuk H.264 dan 11.65%
untuk H.265, sehingga memenuhi persyaratan desain atas peningkatan akurasi hasil
optimasi konfigurasi parameter. Latensi E2E pada standar H.264 lebih kecil
daripada H.265, namun melebihi 1 detik, sehingga belum berhasil memenuhi
persyaratan desain terkait latensi E2E subsistem. Pengimplementasian dan
penelitian desain masih memiliki ruang untuk perkembangan dan perbaikan untuk
penelitian lebih lanjut di masa depan.