digilib@itb.ac.id +62 812 2508 8800

Peningkatan terapan teknologi informasi pada pemahaman scene saat ini bertujuan untuk memperluas terapan analisis data visual pada sistem-sistem otomatis seperti robotik, sistem keamanan, kendaraan cerdas, kesehatan dan lain-lain. Memahami suatu scene merupakan integrasi informasi di berbagai tingkatan yang merupakan suatu proses yang dilakukan mesin untuk mengurai elemen-elemen scene, klasifikasi dan estimasi geometri. Saat ini perkembangan basis data untuk pemahaman scene selain berisi sekumpulan data citra skala besar juga dilengkapi informasi struktur hierarki dan informasi tentang atribut masing-masing kategori scene pada dunia nyata. Basis data ini dapat menyelesaikan permasalahan keterbatasan data bagi para peneliti sebagai data latih sekaligus sebagai data uji pada pembelajaran mesin untuk memperluas terapan teknologi informasi berbasis pemahaman scene. Perluasan analisis visual pada teknologi informasi diharapkan mesin dapat melakukan interpretasi berdasarkan sensor visual secara alami (persepsi mesin) layaknya manusia. Interpretasi visual pada pemahaman scene yang mendasar bagi mesin adalah kemampuan mesin secara visual mengenali tempat di mana suatu entitas dapat beraktivitas dan bernavigasi, memetakan relasi antar objek dan perpindahan objek pada bidang spasial pada waktu nyata. Terapan aplikasi-aplikasi cerdas ini memerlukan sebuah sebuah model data yang dapat mewakili basis pengetahuan yang dapat diakses pada waktu nyata oleh mesin saat proses temu kembali informasi. Dalam disertasi ini permasalahan pemahaman scene yang dibahas adalah: Dataset pemahaman scene jika digunakan pada waktu nyata oleh mesin dapat menurun kinerjanya saat memproses queri traversal dengan cepat serta agak buruk saat penalaran untuk mendapatkan makna semantik. Penalaran kategori scene secara semantik melalui pengolahan data visual dapat menyebabkan adanya perbedaan jenjang waktu proses dan kejadian jika queri traversal menurun, sedangkan penerapan pemahaman scene pada dunia nyata memiliki ritme perubahan yang tinggi serta beban komputasi pengolahan data visual yang besar. Untuk mengatasi masalah tersebut di atas, pada disertasi ini dilakukan penelitian dengan tiga tahapan. Tahapan pertama untuk menyelesaikan permasalahan penggunaan dataset pada waktu nyata pada aplikasi nyata diselesaikan dengan merepresentasikan dataset pemahaman scene dengan model graf properti menjadi basis pengetahuan bagi mesin dengan diusulkan algoritma Scene Understanding Knowledge Base Generator. Tahapan kedua menyelesaikan akurasi kategorisasi scene diusulkan algoritma inferensi kategorisasi berbasis penalaran graf dengan pendekatan probabilistik, dan tahap ketiga memperluas penggunaan graf observasi pada proses observasi yang dilakukan oleh mesin untuk pemetaan dan penjejakan objek pada bidang spasial dengan mengembangkan algoritma pemetaan spasial (Spatial Graph Mapping) dan algoritma Spatial-Temporal Graph Tracker untuk penjejakan objek. Usulan-usulan di tahapan penelitian pada disertasi ini agar dapat digunakan pada sistem nyata secara bersamaan, maka penelitian ini membangun model Labelled Property Graphs (LPG) sebagai model Graf Spasial-Temporal untuk merepresentasikan pengetahuan dan inferensi mesin serta perluasan pada pemahaman scene. Basis data pemahaman scene yang digunakan adalah dataset SUN dan pengukuran kinerja mesin pada algoritma yang dikembangkan menggunakan pengukuran kinerja dengan Confusion matrix.