Beberapa tahun terakhir kecerdasan buatan telah berkembang dengan sangat cepat.
Diantaranya, pembelajaran penguatan adalah salah satu metode populer untuk
mengembangkan kecerdasan buatan. Melalui metode pembelajaran penguatan,
sebuah agen akan belajar dengan berinteraksi dengan lingkungannya dan menerima
sebuah imbalan dari interaksi tersebut. Metode ini dapat digunakan untuk
berbagai macam masalah seperti mengajarkan robot untuk berjalan hingga membuat
kecerdasan buatan yang dapat bermain catur pada tingkat kemampuan yang tinggi.
Penelitian ini dilakukan untuk melihat apakah salah satu algoritma pembelajaran
penguatan yang populer, Pembelajaran Q Mendalam, dapat digunakan untuk
melatih sebuah kecerdasan buata yang dapat memainkan permainan papan
tradisional dari Jepang bernama Gomoku. Gomoku merupakan permainan yang
dimainkan seperti Tic-tac-toe menggunakan papan berukuran 15x15. Ditemukan
bahwa Pembelajaran Q Mendalam dapat menghasilkan kecerdasan buatan yang
memiliki strategi dasar untuk Gomoku dalam lama pelatihan yang relatif sedikit.