digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

COVER Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

BAB 1 Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

BAB 2 Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

BAB 3 Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

BAB 4 Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

BAB 5 Axel Dawne
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

2023 TA TF AXEL DAWNE 13319076 LAMPIRAN.pdf
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan

Penelitian ini mengusulkan sebuah pendekatan baru untuk meningkatkan robustness dari algoritma perencana jalur berbasiskan received signal strength (RSS) dengan mendefinisikan beberapa variabel sebagai state dari Q-learning. Secara umum, terdapat dua pendekatan untuk mendefinisikan state Q-learning pada permasalahan lokalisasi target berbasis RSS, yang mana keduanya hanya menggunakan satu variabel sebagai state Q-learning. Salah satu pendekatan tersebut berpotensi sulit untuk mencapai konvergensi. Sementara pendekatan yang lain berdasarkan asumsi yang tidak realistis dan bertentangan dengan karakteristik propagasi gelombang radio-frequency (RF). Dalam penelitian ini, akan dibuktikan bahwa jika asumsi tersebut tidak terpenuhi, kinerja metode yang diusulkan oleh penelitian lain tidak akan mampu konvergen. Selain itu, pada penelitian ini diusulkan pendekatan baru dengan menggunakan dua variabel sebagai state Q-learning. Pendekatan tersebut terbukti mampu mengungguli pendekatan yang hanya menggunakan satu variabel sebagai state Q-learning dalam hal kecepatan untuk mencapai konvergensi dan robustness. Selain itu, penelitian ini juga mengusulkan penggunaan distribusi Boltzmann untuk menggantikan ????????????????????????????? yang biasa digunakan sebagai metode eksplorasi pada penelitian lokalisasi target berbasiskan RSS. Hal ini bertujuan untuk mempercepat proses pembelajaran algoritma sehingga algoritma tidak memerlukan banyak episode pelatihan untuk dapat mencapai konvergensi. Hasil simulasi menunjukkan bahwa pengggunaan distribusi Boltzmann dapat mengurangi jumlah steps yang dibutuhkan oleh agent untuk mencapai target hingga 70% pada sepuluh episode pelatihan pertama. Terakhir, penelitian ini mencoba menyelesaikan permasalahan lokalisasi target berbasiskan RSS menggunakan pendekatan cooperative multi-agent. Pada pendekatan yang dilakukan, diusulkan metode penggabungan Q-table yang dimiliki oleh setiap agent dengan tetap memprioritaskan Q-value milik agent tersebut. Hasil simulasi menunjukkan bahwa penggunaan algoritma ini dapat mengurangi jumlah steps hingga 18% dibandingkan dengan independent learners pada sepuluh episode pertama pelatihan. Kata kunci: RSS, Q-learning, distribusi Boltzmann, independent learners, cooperative multi-agent