Pesawat tanpa awak (UAV) semakin banyak digunakan dalam berbagai bidang, seperti pengamatan udara, penanganan bencana, pemetaan, dan pertanian. Salah satu aspek penting dalam operasional UAV adalah kemampuan untuk mendarat secara akurat di posisi yang diinginkan. Namun, akurasi pendaratan berbasis GPS memiliki keterbatasan, sehingga metode alternatif seperti visi komputer mulai dikembangkan. Pendaratan berbasis visi komputer membutuhkan penanda fiducial, seperti penanda ArUco, sebagai referensi. Tantangan yang muncul meliputi keterbatasan resolusi kamera dan efek motion blur akibat gerakan UAV. Pada ketinggian tertentu, penanda fiducial tampak semakin kecil dan buram, sementara motion blur menurunkan ketajaman citra.
Super resolusi single-frame berbasis deep learning menjadi solusi untuk meningkatkan resolusi citra sekaligus merekonstruksi citra penanda ArUco yang terpengaruh motion blur. Teknik super-resolusi berbasis interpolasi memiliki keterbatasan dalam menangani motion blur, sedangkan Enhanced Super-Resolution Generative Adversarial Network (ESRGAN) menawarkan kemampuan rekonstruksi yang lebih unggul. ESRGAN dilatih menggunakan dataset yang terdiri dari citra beresolusi tinggi (HR) dan citra beresolusi rendah (LR) dari penanda ArUco. Citra LR dikompresi hingga seperempat ukuran HR, dari 448x448 piksel menjadi 112x112 piksel, dan diberi efek motion blur. Setelah diproses oleh ESRGAN, citra LR menghasilkan keluaran dengan resolusi setara citra HR, yaitu 448x448 piksel. Untuk meningkatkan nilai Structure Similarity Index Method (SSIM), ESRGAN mengintegrasikan Loss Function Structure Similarity Index (LSSIM) ke dalam total loss pada generator.
Hasil rekonstruksi dan peningkatan resolusi citra dianalisis menggunakan SSIM, Feature Similarity Index Method (FSIM), dan energi spektrum frekuensi citra. Penelitian ini menggunakan 50 citra penanda ArUco beresolusi 112x112 piksel yang diberi efek motion blur secara acak. ESRGAN menghasilkan rata-rata kemiripan sebesar 84,14% pada SSIM, 82,80% pada FSIM, dan total energi spektrum sebesar 99,90% dibandingkan dengan citra asli. Sebagai perbandingan, metode interpolasi bicubic menghasilkan kemiripan 70,46% pada SSIM, 63,20% pada FSIM, dan total energi spektrum sebesar 92,73%. Kombinasi interpolasi bicubic dengan filter Wiener menghasilkan kemiripan sebesar 69,58% pada SSIM, 62,49% pada FSIM, dan total energi spektrum sebesar 92,53%.
Hasil analisis menunjukkan bahwa ESRGAN memiliki kemampuan yang lebih baik dalam merekonstruksi dan meningkatkan citra penanda ArUco yang terpengaruh motion blur. Kualitas citra hasil ESRGAN terlihat dari visualisasi spektrum yang mendekati citra asli, sedangkan metode interpolasi bicubic, baik dengan atau tanpa filter Wiener, menghasilkan spektrum yang lebih gelap di bagian tepi. Total energi spektrum yang hampir identik dengan citra asli hanya ditemukan pada citra hasil ESRGAN. Selain itu, ESRGAN juga menunjukkan nilai SSIM dan FSIM yang lebih tinggi dibandingkan metode lain. Hal ini membuktikan bahwa ESRGAN merupakan metode yang lebih andal untuk meningkatkan kualitas citra UAV, terutama pada quadrotor, yang mengalami gangguan akibat motion blur.
Kata kunci: Super Resolusi, Deep Learning, Rekonstruksi. ESRGAN
?