digilib@itb.ac.id +62 812 2508 8800

ANANG NUGRAHA JIUN
PUBLIC Dwi Ary Fuziastuti

Beberapa tahun terakhir kecerdasan buatan telah berkembang dengan sangat cepat. Diantaranya, pembelajaran penguatan adalah salah satu metode populer untuk mengembangkan kecerdasan buatan. Melalui metode pembelajaran penguatan, sebuah agen akan belajar dengan berinteraksi dengan lingkungannya dan menerima sebuah imbalan dari interaksi tersebut. Metode ini dapat digunakan untuk berbagai macam masalah seperti mengajarkan robot untuk berjalan hingga membuat kecerdasan buatan yang dapat bermain catur pada tingkat kemampuan yang tinggi. Penelitian ini dilakukan untuk melihat apakah salah satu algoritma pembelajaran penguatan yang populer, Pembelajaran Q Mendalam, dapat digunakan untuk melatih sebuah kecerdasan buata yang dapat memainkan permainan papan tradisional dari Jepang bernama Gomoku. Gomoku merupakan permainan yang dimainkan seperti Tic-tac-toe menggunakan papan berukuran 15x15. Ditemukan bahwa Pembelajaran Q Mendalam dapat menghasilkan kecerdasan buatan yang memiliki strategi dasar untuk Gomoku dalam lama pelatihan yang relatif sedikit.