digilib@itb.ac.id +62 812 2508 8800

Pembangkitan teks dari graf Abstract Meaning Representation (AMR) adalah proses menghasilkan suatu keluaran teks dengan menggunakan masukan graf AMR. Dalam peringkasan teks Bahasa Indonesia berbasis AMR, pembangkitan teks umumnya menggunakan Simple NLG yang memiliki kelemahan teks yang dibangkitkan hanya berupa kumpulan kata yang tidak memiliki tata bahasa. Maka dari itu, pada tugas akhir ini dikembangkan model pembangkitan teks Bahasa Indonesia dari graf AMR berbasiskan model bahasa pralatih. Pada tugas akhir ini, pembangunan model pembangkitan teks Bahasa Indonesia dari graf AMR dilakukan dengan metode fine-tuning model bahasa pralatih serta dilakukan observasi pengaruh penambahan supervised task adaptation dan treelevel embedding terhadap kinerja model pembangkitan teks tersebut. Model bahasa pralatih yang diuji adalah IndoT5-base, mT5-base, dan IndoBART. Berdasarkan hasil pengujian, kombinasi metode terbaik adalah fine-tuning model IndoT5 dengan input representasi linier PENMAN dengan tambahan supervised task adaptation. Skor BLEU yang dihasilkan dari metode tersebut pada data uji kalimat sederhana adalah 0,5048 dan 0,3180 pada data uji kalimat berita. Sebagai studi kasus, model pembangkitan teks dari graf AMR yang dihasilkan tersebut digunakan untuk menghasilkan ringkasan abstraktif teks Bahasa Indonesia dari input graf ringkasan yang dihasilkan dari sistem peringkasan berbasis AMR (Akhyar, 2021). Hasil pengujian dari sistem tersebut pada data uji XLSumIndonesia memberikan nilai ROUGE-1 0,2123 dan ROUGE-2 0,0496. Sistem tersebut dapat menghasilkan ringkasan abstraktif dengan skor ROUGE-1 yang lebih tinggi daripada sistem peringkasan berbasis AMR yang dihasilkan Akhyar (2021) namun memiliki skor ROUGE-2 yang lebih rendah.