Machine-learning (ML) adalah sebuah metode analisis data yang mengotomatiskan
pembangunan model analitis. Terdapat beberapa metode ML yang umum untuk
digunakan. Reinforcement Learning (RL) merupakan salah satu tipe ML yang
umum digunakan dan yang menemukan action yang menghasilkan reward terbesar
melalui trial and error.
Keperluan komputasi untuk RL yang berat membutuhkan suatu perangkat
komputasi yang kuat terutama jika terdapat masalah dengan batasan waktu yang
ketat dan/atau dengan proses data yang besar terutama pada permasalah pencarian
jalur terpendek. Optimasi pada hardware dapat mengurangi konsumsi daya yang
besar. Optimasi ini membutuhkan berbagai penelitian dan perancangan yang
banyak sehingga menemukan perangkat keras komputasi yang paling efisien. Di
antara metode yang digunakan adalah dengan mengimplementasikan hardware
accelerator menggunakan Field Programmable Gate Array (FPGA). Hasil
implementasi dari perangkat tersebut perlu diuji pada aplikasi tertentu untuk
mengukur performa dari perangkat. Salah satu aplikasi yang baik untuk
mengimplementasikan RL adalah dalam bidang sistem navigasi cerdas.
Pada buku ini, penulis akan menjelaskan tentang perancangan yang dilakukan
untuk subsistem dari suatu maket pengujian jalur terpendek dengan algoritma Q-
Learning dengan menggunakan perangkat keras. Subsistem yang dimaksud adalah
robot dan pergerakannya pada maket pengujian dengan hasil robot dapat bergerak
dalam 1.265 detik untuk berpindah state, 0.771 detik untuk merubah orientasi, dan
0.721 detik untuk membaca RFID.