11 Bab II Tinjauan Pustaka Dalam beberapa tahun terakhir berkembang pesat teknologi kecerdasan buatan, metode yang didasarkan pada pembelajaran yang mendalam atau deep learning telah menjadi metode utama untuk deteksi objek. Saat ini ada dua metode yang digunakan untuk memecahkan masalah deteksi sebuah target atau pengenalan objek melalui pembelajaran mendalam, yaitu : • Metode deteksi dua langkah o Model deteksi dua langkah pertama-tama menghasilkan proposal wilayah dan kemudian menyempurnakan proposal ini untuk memprediksi kotak pembatas objek dan probabilitas kelas. Pendekatan ini dirancang untuk akurasi yang lebih tinggi o AlexNet, VGG, ResNet, Fast-RCNN dan Faster-RCNN termasuk dalam kategori metode deteksi dua tahap, dengan metode ini dihasilkan akurasi deteksi obyek yang baik akan tetapi kecepatan deteksi nya tidak dapat diharapkan untuk digunakan pada aplikasi realtime . • Metode deteksi satu langkah o Model deteksi satu langkah memprediksi kotak pembatas objek dan probabilitas kelas langsung dari gambar masukan dalam sekali jalan. Pendekatan ini dirancang untuk kecepatan dan efisiensi. o Untuk pengenalan obyek secara realtime seperti yang biasa digunakan secara realtime pada kendaraan tanpa awak dikembangkan metoda- metoda yang memperbaiki kelemahan-kelemahan dari algoritme yang ada, untuk itu maka dikembangkan metoda deteksi dengan satu tahap untuk menghasilkan pendeteksian obyek dengan akurasi yang baik serta kecepatan yang memadai. YOLO (You Only Look Once) dan SSD (Single Shot MultiBox Detector) masuk dalam kategori deteksi satu langkah Pada pengenalan obyek dilaut sudah dilakukan berbagai penelitian dengan berbagai pengembangan algoritma, penelitian yang paling menonjol pada area ini adalah 12 proses pengenalan objek yang banyak dilakukan untuk dapat digunakan pada kendaraan nir-awak permukaan untuk dapat segera mengenali objek permukaan yang ada didepannya agar dapat bernavigasi dengan cepat untuk menghindari tabrakan dengan objek tersebut. Objek permukaan dapat dideteksi dengan berbagai pendekatan pemrosesan citra, misalnya menghilangkan latar belakang (Socek dkk., 2005), ekstraksi latar depan (Guo dkk., 2011), rekonstruksi 3-D (Wang dkk.,2013), segmentasi semantik (Kristan dkk., 2016), (Bovcon dkk., 2017) dan (Bovcon dkk., 2018). Pengenalan objek permukaan laut menggunakan deteksi satu langkah dengan YOLO juga banyak dikembangkan (Shoeller dkk, 2019), (Huang dkk, 2020), (Liu dkk., 2021), (Li dkk., 2021) dan Han dkk., 2021). Dari berbagai metoda pendekatan yang ada, pada lingkungan maritim pengenalan objek permukaan yang paling sering digunakan dan memberikan hasil yang baik adalah proses segmentasi semantik dan pemahaman pada situasi lingkungan. Metode ini banyak digunakan pada kendaraan nir-awak permukaan laut untuk navigasi untuk mencegah wahana ini menabrak objek yang ada di depan nya. Deteksi objek berdasarkan segmentasi semantik telah menjadi pendekatan yang mapan pada kendaraan tanpa awak di darat (Dazlee dkk., 2022), (Gengeç dkk., 2019), (Peng dkk., 2021) dan (Peng dkk., 2022). Namun, segmentasi semantik berbasis pembelajaran mendalam yang dikembangkan terutama di daratan tidak memadai untuk diimplementasikan di wilayah laut. Permukaan air di wilayah laut memiliki penampakan yang sangat bervariasi dan sangat dipengaruhi oleh kondisi cuaca. Deteksi objek hambatan permukaan berdasarkan segmentasi semantik berbasis pembelajaran mendalam untuk kendaraan permukaan air tanpa awak biasanya dirancang untuk mendeteksi objek hambatan permukaan air dalam berbagai bentuk dan ukuran, meskipun objek tersebut tidak tercakup selama pelatihan. 13 Pengenalan obyek di lingkungan maritim juga berkembang dengan melakukan segmentasi semantik citra (Chen dkk., 2021) mengembangkan Water Obstacle Detection Network Based on Image Segmentation atau WODIS, yaitu dengan melakukan perubahan modul enkode dan dekode pada jaringan U-Net sehingga memiliki 2 sub-jaringan yang bertujuan pada sisi enkode untuk mengekstraksi fitur yang dalam dari input citra yang akan dikenali, sementara pada sisi dekode adalah untuk menggabungkan fitur tingkat atas dari input citra (spesifikasi umum dari obyek seperti posisi dan bentuk obyek) dan fitur tingkat rendah dari obyek (spesifikasi lokal dari obyek seperti tepi, sudut dan tektur) untuk menghasilkan topeng segmentasi objek. (Bovcon dkk., 2020) juga mengembangkan modul jaringan pengenalan obyek pada lingkungan maritim untuk digunakan pada kapal tanpa awak, selain itu juga (Bovcon dkk., 2020) membuat dataset yang lengkap untuk domain laut yang dapat digunakan untuk melatih modul jaringan yang dikembangkan nya, kumpulan data latih dikembangkannya dikenal sebagai Maritime Semantic Segmentation Training Dataset MaSTr1325 yang berisi 1325 citra dengan berbagai kondisi laut yang berbeda yang direkam dalam jangka waktu 2 tahun dengan menggunakan kapal nir- awak. Metode lain yang memperbaiki model jaringan WaSR adalah model jaringan yang dikembangkan (Zust dkk., 2022), dengan mengaplikasikan sistem pembelajaran scaffolding (SLR), yang memanfaatkan anotasi yang lemah yang terdiri dari kotak pembatas air, langit , dan objek rintangan untuk melatih deteksi rintangan berbasis segmentasi jaringan, dan dengan demikian mengurangi upaya pelabelan Ground - Truth yang diperlukan sebanyak dua puluh kali lipat. SLR melatih sebuah model awal dari anotasi yang lemah, lalu berganti-ganti antara memperkirakan ulang label segmentasi semu dan meningkatkan parameter jaringan. Akan tetapi metode diatas masih memiliki kelemahan terutama untuk mendeteksi objek yang kecil dan mendeteksi objek palsu yaitu bayangan dari objek itu sendiri pada kondisi laut yang tenang. Maka selanjutnya metode WaSR ini diperbaiki oleh 14 (Zust dkk., 2022) menjadi model jaringan baru yang disebut WaSR-T yang memanfaatkan konteks temporal untuk meningkatkan deteksi hambatan dengan segmentasi pada area perairan dengan tampilan objek ambigu. Serta menambah dataset MaSTr1325 dengan 153 citra pelatihan baru dengan kondisi laut yang lebih menantang yang berisi pencerminan objek dan laut yang berkilau – kumpulan data baru disebut MaSTr1478. Dari semua penelitian yang sudah dikembangkan ada hal yang penting yang dapat dimanfaatkan untuk pengembangan komputer visi cerdas untuk mendeteksi kehadiran kapal yang mendekati TEWS yaitu akurasi hasil deteksi, proses komputasi serta ketersediaan kumpulan data citra domain laut yang dapat dimanfaatkan pada penelitian ini. Adapun ringkasan mengenai penelitian-penelitian tersebut yang digunakan sebagai referensi untuk mengembangkan sistem komputer visi cerdas dalam penelitian ini dimuat pada Tabel II.1. Tabel II. 1 Daftar ringkasan tinjauan pustaka terkait topik penelitian sebagai referensi utama No Penulis, Tahun Judul Kontribusi 1 Bovcon dkk., 2019 The mastr1325 dataset for training deep usv obstacle detection models Mengenalkan kumpulan data MaSTr1325 merupakan kontribusi besar pada bidang robotika maritim dan navigasi otonom. Dengan menyediakan kumpulan data beranotasi berkualitas tinggi yang dirancang khusus untuk deteksi objek permukaan di lingkungan maritim, penelitian ini mendukung pengembangan model pembelajaran mendalam yang canggih. Model-model ini penting untuk meningkatkan keselamatan dan keandalan USV, sehingga memungkinkan mereka untuk bernavigasi pada lingkungan maritim yang kompleks secara mandiri. 15 2 Bovcon dkk., 2020 A water-obstacle separation and refinement network for unmanned surface vehicles Memperkenalkan WaSR, sebuah arsitektur jaringan saraf konvolusi baru yang mengatasi tantangan unik yang terkait dengan pembeda antara air dan objek hambatan pada kondisi maritim. Dirancang sebagai kerangka pembelajaran end-to-end, artinya WaSR secara langsung memproses citra masukan untuk menghasilkan segmentasi keluaran tanpa memerlukan ekstraksi fitur manual atau langkah prapemrosesan. Hal ini meningkatkan efisiensi dan akurasi model. penggabungan modul penyempurnaan yang meningkatkan hasil segmentasi awal. Modul ini berfokus pada menyempurnakan batasan dan meningkatkan akurasi deteksi hambatan, sehingga mengurangi positif palsu dan negatif palsu. 3 Chen dkk., 2021 WODIS: Water Obstacle Detection Network based on Image Segmentation for Autonomous Surface Vehicles in Maritime Environments Melakukan perubahan modul enkode dan dekode pada jaringan U-Net sehingga memiliki 2 subjaringan yang bertujuan pada sisi enkode untuk mengekstraksi fitur yang dalam dari input citra yang akan dikenali, sementara pada sisi dekode adalah untuk menggabungkan fitur tingkat atas dari input citra (spesifikasi umum dari obyek seperti posisi dan bentuk obyek) dan fitur tingkat rendah dari obyek (spesifikasi lokal dari obyek seperti tepi, sudut dan tektur) untuk menghasilkan topeng segmentasi objek. 4 Zust dkk., 2022 Temporal Context for Robust Maritime Obstacle Detection Memperkenalkan pendekatan baru yang memanfaatkan konteks temporal untuk meningkatkan deteksi objek permukaan di lingkungan maritim. Dengan 16 mempertimbangkan informasi dari beberapa bingkai citra yang berurutan, metode yang diusulkan dapat membedakan dengan lebih baik antara objek permukaan sebenarnya dan artefak visual sementara (seperti pantulan, gelombang, dan perubahan pencahayaan) yang umum terjadi di lingkungan maritim. Memperluas kumpulan data asli MaSTr1325 dengan tambahan 153 citra dan gunakan nama kode MaSTr1478 untuk kumpulan data baru ini. Tambahan citra diperoleh dari video online dan rekaman yang dibuat sendiri untuk mewakili skenario sulit pada metode bingkai tunggal, di mana informasi temporal sangat penting untuk prediksi yang akurat, pada kondisi seperti bayangan objek pada permukaan air , pantulan dan kilauan matahari. 5 Tersek dkk., 2023 eWaSR An Embedded- Compute-Ready Maritime Obstacle Detection Network Arsitektur jaringan saraf konvolusi yang dirancang untuk mendeteksi objek permukaan secara efisien di lingkungan maritim, dioptimalkan untuk diterapkan pada platform komputasi tertanam yang biasa digunakan pada kendaraan permukaan nir-awak Selain melakukan penelusuran penelitian terdahulu juga dilakukan perbandingan perangkat atau hardaware yang nantinya akan digunakan atau akan menjalankan komputer visi cerdas ini. Dari berbagai referensi yang tersedia kami berhasil melakukan inventarisasi berbagai kandidat hardware yang tersedia.