Tesis karya Fadli Maulana Munthaha dari ITB pada September 2025 membahas strategi pengendalian gerak forklift otonom (FO) di lingkungan pergudangan modern, yang bertujuan untuk meningkatkan efisiensi dan mengurangi risiko kecelakaan kerja. Penelitian ini mengusulkan Q-learning Dynamic Window Approach (QDWA) sebagai solusi adaptif terhadap kondisi gudang yang kompleks, mengintegrasikan Q-learning untuk penyesuaian bobot DWA berdasarkan orientasi target, kecepatan forklift, dan kepadatan hambatan. Metode penelitian mencakup pemodelan kinematika forklift, perancangan Q-table, dan pelatihan menggunakan strategi greedy. Hasil simulasi menunjukkan QDWA mampu menyelesaikan skenario khas pergudangan dengan tingkat keberhasilan lebih tinggi dibandingkan DWA konvensional, serta menghasilkan perintah gerak yang lebih halus dan akurat. Kontribusi utama penelitian ini adalah penerapan reinforcement learning untuk tuning bobot DWA secara online, memperkaya literatur adaptive path planning dan membuktikan bahwa Q-learning dapat mengatasi keterbatasan DWA konvensional.