Perpustakaan Digital - Digilib ITB

Advanced Search

PENINGKATAN AKURASI VIDEO ANALYTICS MELALUI OPTIMASI PARAMETER KOMPRESI VIDEO SECARA OTOMATIS DENGAN DEEP NEURAL NETWORK DRIVEN STREAMING

7 views

Penulis	:	Farhan Krishna [18119026]
Kontributor / Dosen Pembimbing	:	Prof. Ir. Hendrawan, M.Sc., Ph.D.
Jenis Koleksi	:	Tugas Akhir
Tahun Terbit	:
Penerbit	:	Teknik Telekomunikasi
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	video analytics, kompresi video, DNN driven streaming, feedback
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi
File	:	1 file
Tanggal Input	:	08 Jul 2024

Dokumen Asli
Terbatas Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Dengan perkembangan dan pengimplementasian teknologi video streaming yang pesat, dibutuhkan atas peningkatan akurasi dan performa dari video analytics, namun ketersediaan sumber daya komputasi dan jaringan seperti bandwidth yang terbatas menjadi kendala utamanya. Hal ini disebabkan karena ketersediaan sumber daya untuk video analytics didistribusikan secara statis dan video analytics kurang adaptif terhadap sumber daya komputasi dan jaringan yang dibutuhkan oleh video stream yang terus mengalami perubahan konten. Oleh karena itu, dibutuhkan suatu sistem yang dapat meningkatkan akurasi inferensi dari video analytics secara adaptif. Sebagai alternatif solusi terhadap masalah tersebut, dirancang dan dikembangkan sebuah sistem terintegrasi yang meningkatkan akurasi inferensi melalui alokasi sumber daya bandwidth dan optimasi konfigurasi paratemeter kompresi video. Topik yang dibawa pada Buku Tugas Akhir ini oleh penulis adalah pada subsistem yang melakukan optimasi konfigurasi parameter dengan menggunakan DNN driven streaming, atau DDS. Subsistem DDS dikembangkan oleh Du et al. yang menggunakan sistem feedback oleh DNN untuk melakukan pengaturan parameter pengkodean dan kompresi video untuk mencapai akurasi inferensi yang tinggi secara efisien. Pada sisi konfigurasi parameter kompresi video, subsistem DDS yang dirancang oleh Du et al. menggunakan konfigurasi yang masih default, sehingga memiliki ruang untuk perkembangan dan penelitian. Persyaratan desain dari subsistem DDS terdiri tiga, yaitu latensi E2E yang tidak melebih 1 detik, peningkatan akurasi inferensi hasil optimasi konfigurasi parameter video, dan penggunaan Linux sebagai OS yang bersifat open source. Subsistem DDS menerima masukan video lalu melakukan pengkodean dan kompresi yang pertama untuk menghasilkan video stream berkualitas rendah. Video stream tersebut kemudian dikirim ke server untuk dievaluasi oleh model deteksi objek, yaitu Faster RCNN. Hasil dari evaluasi tersebut kemudian digunakan sebagai feedback yang mengandung informasi atas semua region setiap frame dari video yang relevan terhadap akurasi inferensi, sehingga region tersebut diutamakan untuk ditingkatkan kualitasnya. Dengan menggunakan feedback hasil evaluasi Faster RCNN pada server, subsistem DDS akan melakukan pengkodean dan kompresi ii ulang untuk menghasilkan video stream berkualitas tinggi, sehingga dapat mencapai akurasi inferensi yang lebih tinggi. Subsistem DDS dikembangkan pada OS Linux, sesuai dengan persyaratan desain atas OS open source, yang menjalankan sejumlah program Python dan menggunakan FFMPEG untuk kompresi video. Subsistem DDS dijalankan pada mode emulasi untuk memperoleh hasil ground truth, lalu dilanjutkan dalam mode implementasai dimana hasilnya dibandingkan dengan ground truth untuk memperoleh nilai akurasi inferensi subsistem. Pada pengujian subsistem DDS, pertama diuji untuk mengamati pengaruh hasil optimasi konfigurasi terhadap tanpa optimasi (default), lalu diuji parameter entropy coding, motion estimation, direct prediction, ukuran macroblock, latensi E2E, dan perbandingan performa antara standar kompresi video H.264 dan H.265. Pengujian dilakukan dengan menggunakan sejumlah dataset video yang dikategorikan berdasarkan kecepatan pergerakan objek, sehingga dibagi menjadi high motion dan low motion. Pada kedua standar kompresi video, diperoleh peningkatan akurasi inferensei terhadap parameter default sebesar 12.14% untuk H.264 dan 11.65% untuk H.265, sehingga memenuhi persyaratan desain atas peningkatan akurasi hasil optimasi konfigurasi parameter. Latensi E2E pada standar H.264 lebih kecil daripada H.265, namun melebihi 1 detik, sehingga belum berhasil memenuhi persyaratan desain terkait latensi E2E subsistem. Pengimplementasian dan penelitian desain masih memiliki ruang untuk perkembangan dan perbaikan untuk penelitian lebih lanjut di masa depan.

Perpustakaan Digital ITB

Advanced Search

PENINGKATAN AKURASI VIDEO ANALYTICS MELALUI OPTIMASI PARAMETER KOMPRESI VIDEO SECARA OTOMATIS DENGAN DEEP NEURAL NETWORK DRIVEN STREAMING

Artikel Terkait