digilib@itb.ac.id +62 812 2508 8800

ABSTRAK[1].doc
PUBLIC Alice Diniarti

Poker adalah salah satu permainan kartu yang telah menjadi populer terutama pada media internet. Pada bidang AI, poker juga telah menjadi pembahasan populer karena masalah utamanya yaitu ukuran permainan yang sangat besar sehingga belum sepenuhnya dapat diselesaikan. Counterfactual Regret Minimization (CFR) telah menjadi algoritma yang paling banyak digunakan dalam pembangunan AI pada permainan poker. CFR digunakan untuk menghasilkan strategi optimal yang mendekati equilibrium. Strategi optimal merupakan strategi yang bersifat generic/umum yang dapat digunakan untuk berbagai lawan. Namun strategi optimal saja tidak cukup karena strategi optimal tidak dapat mengeksploitasi kesalahan lawan untuk memaksimalkan keuntungannya. Opponent modelling digunakan untuk memodelkan lawan dan mencari strategi terbaik (best response) terhadap model lawan yang dihasilkan. Strategi best response akan memaksimalkan keuntungannya terhadap lawan yang tidak optimal. Terdapat beberapa metode opponent modelling yang telah dibuat sebelumnya. Pada tugas akhir ini akan diajukan metode opponent modelling yang merupakan hasil penyederhanaan dari metode yang sudah ada sebelumnya, Deviation-Based Best Response (DBBR). Berdasarkan hasil pengujian, algoritma yang diajukan yang mempunyai kompleksitas lebih sederhana (O(N) dibandingkan O(NM)) dari DBBR masih belum mampu mempunyai kinerja sebaik DBBR pada 6 dari 9 pengujian. Namun pada pengujian lainnya (dengan lawan always raise), algoritma yang diajukan mampu mempunyai kinerja yang sedikit lebih baik dibandingkan DBBR (dengan rata-rata kemenangan 1,578 dibandingkan dengan 1,391). Meskipun begitu, algoritma ini masih dapat menjadi alternatif karena kompleksitas algoritmanya yang lebih kecil.