Low vision merupakan gangguan kehilangan penglihatan sebagian. Low
vision berbeda dari kebutaan, dimana kebutaan merupakan gangguan kehilangan
penglihatan secara total. Penyandang low vision seringkali memiliki pandangan
yang buram sehingga melakukan kegiatan sehari-hari terasa lebih sulit.
Berdasarkan permasalahan tersebut, salah satu aplikasi terkini dari deep learning
yang dapat memudahkan penyandang low vision adalah deteksi objek. Sayangnya,
beberapa aplikasi dari objek deteksi yang kini sudah dipublikasikan belum ada yang
memiliki kemampuan untuk melakukan deteksi secara real time dan tidak
mendukung Bahasa Indonesia. Hal ini sangat disayangkan karena model hanya
dapat digunakan oleh sebagian kelompok pengguna yang memahami Bahasa
Inggris.
Maka, penelitian Tugas Akhir ini melingkupi pembangunan model deteksi
objek menggunakan transfer learning menggunakan Mask R-CNN dan YOLOv5.
Kedua model ini akan diimplementasikan pada aplikasi mobile. Pada penelitian ini,
dilakukan beberapa eksperimen implementasi model menggunakan aspek optimizer
yang berbeda, yakni SGD, Adam, dan AdamW. Selanjutnya, dilakukan
perbandingan terhadap kedua model deteksi objek dengan ketiga optimizer pada
lingkungan server. Berdasarkan hasil analisis perbandingan, akan terpilih dua
model dengan optimizer terbaik berdasarkan nilai mAP yang terbesar dan waktu
infrensi yang tercepat. Model yang memiliki mAP terbesar adalah YOLOv5s –
SGD dengan nilai mAP sebesar 0.39401 dan model yang memiliki waktu inferensi
tercepat adalah YOLOv5s – AdamW dengan 8.73 ms. Setelah itu, dilanjutkan
proses perbandingan kedua model tersebut pada lingkungan mobile. Model
YOLOv5s – SGD memiliki waktu inferensi sebesar 930 ms, sedangkan YOLOv5s
– AdamW memiliki waktu inferensi sebesar 3037 ms. Oleh karena itu, model
YOLOv5s – SGD terpilih sebagai model terbaik dan diimplementasikan pada
aplikasi mobile.