digilib@itb.ac.id +62 812 2508 8800

Gabriel Jonathan [23520034].pdf
PUBLIC Dessy Rondang Monaomi

Kurangnya adaptabilitas adalah salah satu tantangan yang cukup signifikan dalam agen permainan video strategi berbasis giliran. Hal tersebut disebabkan oleh penggunaan pendekatan berbasis heuristik dalam pengambilan keputusan mereka. Dalam penelitian ini, sebuah agen yang dilatih dengan Reinforcement Learning digunakan sebagai pengganti heuristik dalam upaya untuk mengatasi keterbatasan ini. Agen tersebut dilatih menggunakan algoritma Proximal Policy Optimization yang diimplementasikan melalui Unity ML-Agents Toolkit untuk memainkan sebuah permainan video testbed dengan mekanika permainan yang mirip dengan permainan video strategi berbasis giliran komersial. Kinerja agen tersebut dibandingkan dengan dua pendekatan sistematis, Monte Carlo Tree Search dan Online Evolutionary Planning, dua pendekatan yang telah terbukti sebagai pengganti pendekatan heuristik dalam penelitian sebelumnya. Hasil eksperimen menunjukkan agen Reinforcement Learning menghadapi tantangan terkait adaptabilitas di mana agen tersebut tidak dapat melakukan generalisasi terhadap perilaku lawan yang menyimpang jauh dari training data. Namun demikian, kinerja dari agen Reinforcement Learning kompetitif melawan agen berbasis Monte Carlo Tree Search dan Online Evolutionary Planning dengan tingkat kemenangan rata-rata sebesar 53.7%, menunjukkan bahwa Reinforcement Learning dapat menjadi pendekatan yang menjanjikan dengan perbaikan dan optimasi lebih lanjut dalam penelitian-penelitian selanjutnya.