digilib@itb.ac.id +62 812 2508 8800

Low vision merupakan keadaan dimana fungsi penglihatan seseorang menurun secara permanen, hal tersebut membuat penyandangnya kesulitan menjalani kegiatan sehari-hari. Salah satu permasalahan yang dirasakan oleh penyandang low vision adalah kesulitan dalam mencari barang. Aplikasi mobile dengan fitur objek deteksi dibangun untuk membantu para penyandang menyelesaikan masalah tersebut. Untuk menghasilkan model objek deteksi yang sesuai dengan kebutuhan, digunakan dua tipe framework yaitu Faster R-CNN dan SSDLite untuk dilakukan pembelajaran ulang (re-training) dengan teknik transfer learning. Transfer learning merupakan penggunaan kembali model yang telah dilatih (pretrained model) sebelumnya pada masalah baru. Dikarenakan aplikasi dibangun untuk membantu penyandang low vision untuk mendeteksi objek sehari-hari, maka dilakukan pemilihan untuk dataset training. Dataset yang digunakan adalah MS COCO dan setelah dilakukan pemilihan kelas yang sesuai, digunakan 38 dari 80 kelas yang tersedia untuk proses training. Proses training model menggunakan 3 optimizer yang berbeda (SGD, Adam, dan AdamW) untuk setiap framework dan akan dipilih satu konfigurasi terbaik untuk diimplementasikan pada aplikasi. Hasil model transfer learning kemudian dinilai menggunakan metrik mAP (Mean Average Precission). Berdasarkan analisis hasil inferensi pada server pelatihan, diantara 6 konfigurasi model dan optimizer didapatkan 2 konfigurasi dengan nilai mAP tertinggi yaitu model Faster R-CNN dengan optimizer SGD dengan nilai 61.3% dan model SSDLite dengan optimizer AdamW dengan nilai 37.3%. Waktu inferensi keduanya masing-masing adalah 0.75 dan 0.095 detik. Proses inferensi kemudian dilakukan kembali pada server aplikasi untuk memastikan waktu inferensi model masih dapat ditolerir pada spesifikasi server yang berbeda, menghasilkan kedua model masih memiliki waktu inferensi yang dapat ditolerir yaitu dibawah 5 detik. Oleh karena itu dipilih konfigurasi model Faster R-CNN dengan optimizer SGD yang memiliki nilai mAP tertinggi 61.3% dan waktu inferensi 3.6 detik sebagai model deteksi objek yang digunakan pada mode online.