Sistem dialog merupakan sebuah program yang dapat melakukan komunikasi dengan
menggunakan bahasa alami (Jurafsky dan Martin, 2009). Media komunikasi yang
digunakan oleh sistem pada tugas akhir ini adalah teks bahasa alami dan bukan
ucapan. Berdasarkan tujuan dibentuknya sistem dialog, terdapat dua jenis sistem
dialog, yaitu berorientasi tugas dan berorientasi bukan tugas (open-domain). Metode
yang digunakan dalam mengembangkan sistem dialog pun sudah berkembang. Pada
umumnya terdapat dua metode untuk mengembangkan sistem dialog, yaitu sistem
dialog modular dan sistem dialog end-to-end.
Salah satu penelitian yang mengembangkan sistem dialog berorientasi tugas
dengan metode end-to-end adalah Knowledge Embedded Dialogue (KE-Dialogue)
(Madotto, Cahyawijaya, dkk., 2020). Pada penelitian tersebut, hasil yang didapat
cukup memuaskan dengan membentuk data latih dari proses delexicalization dan
relexicalization. Model yang digunakan pada penelitian tersebut adalah GPT-2.
Pada tugas akhir ini, dilakukan penelitian penggunaan model lain dalam
mengembangkan sistem dialog end to end. Model pertama yang digunakan adalah
sequence-to-sequence dengan kakas OpenNMT. Model kedua adalah penggunaan
model pretrain BART. Model ketiga adalah penggunaan model pretrain T5. Untuk
mencari model dengan performansi terkait, dilakukan eksperimen dengan beberapa
konfigurasi hyperparameter untuk setiap model tersebut.
Dari eksperimen dengan lebih dari 40.000 data latih dan 562 data uji, model yang
dikembangkan dari pretrain BART menghasilkan performansi terbaik. Dengan
konfigurasi parameter learning rate 1e-5 dan batch size 16, model BART mendapat
hasil lebih baik 1% dibandingkan baseline, baik dari nilai BLEU maupun F1.
Model lain yang juga mendapatkan hasil yang cukup baik adalah model T5 dengan
parameter learning rate 1e-4 dan batch size 16. Sebaliknya, model sequence-tosequence dengan OpenNMT mendapatkan hasil yang lebih buruk dari baseline.