digilib@itb.ac.id +62 812 2508 8800

Low vision merupakan gangguan kehilangan penglihatan sebagian. Low vision berbeda dari kebutaan, dimana kebutaan merupakan gangguan kehilangan penglihatan secara total. Penyandang low vision seringkali memiliki pandangan yang buram sehingga melakukan kegiatan sehari-hari terasa lebih sulit. Berdasarkan permasalahan tersebut, salah satu aplikasi terkini dari deep learning yang dapat memudahkan penyandang low vision adalah deteksi objek. Sayangnya, beberapa aplikasi dari objek deteksi yang kini sudah dipublikasikan belum ada yang memiliki kemampuan untuk melakukan deteksi secara real time dan tidak mendukung Bahasa Indonesia. Hal ini sangat disayangkan karena model hanya dapat digunakan oleh sebagian kelompok pengguna yang memahami Bahasa Inggris. Maka, penelitian Tugas Akhir ini melingkupi pembangunan model deteksi objek menggunakan transfer learning menggunakan Mask R-CNN dan YOLOv5. Kedua model ini akan diimplementasikan pada aplikasi mobile. Pada penelitian ini, dilakukan beberapa eksperimen implementasi model menggunakan aspek optimizer yang berbeda, yakni SGD, Adam, dan AdamW. Selanjutnya, dilakukan perbandingan terhadap kedua model deteksi objek dengan ketiga optimizer pada lingkungan server. Berdasarkan hasil analisis perbandingan, akan terpilih dua model dengan optimizer terbaik berdasarkan nilai mAP yang terbesar dan waktu infrensi yang tercepat. Model yang memiliki mAP terbesar adalah YOLOv5s – SGD dengan nilai mAP sebesar 0.39401 dan model yang memiliki waktu inferensi tercepat adalah YOLOv5s – AdamW dengan 8.73 ms. Setelah itu, dilanjutkan proses perbandingan kedua model tersebut pada lingkungan mobile. Model YOLOv5s – SGD memiliki waktu inferensi sebesar 930 ms, sedangkan YOLOv5s – AdamW memiliki waktu inferensi sebesar 3037 ms. Oleh karena itu, model YOLOv5s – SGD terpilih sebagai model terbaik dan diimplementasikan pada aplikasi mobile.