digilib@itb.ac.id +62 812 2508 8800

ABSTRAK - Bariza Haqi
PUBLIC Alice Diniarti

Semantic role labeling merupakan salah satu pendekatan dalam analisis semantik yang memahami hubungan semantik dalam kalimat, seperti siapa yang melakukan apa terhadap siapa, dimana, kapan, dst. Model semantic role labeling (SRL) dalam Bahasa Indonesia yang tersedia saat ini masih memiliki kesulitan untuk mendapatkan hasil yang baik karena kurangnya korpus anotasi yang dibutuhkan saat pelatihan, dibandingkan dengan model SRL Bahasa Inggris. Oleh karena itu, pada Tugas Akhir ini dikembangkan model SRL dengan menerapkan cross-lingual transfer. Metode cross-lingual transfer dapat diterapkan untuk mengatasi kinerja model SRL yang kurang karena sedikitnya korpus anotasi Bahasa Indonesia dengan memanfaatkan korpus anotasi Bahasa Inggris yang memiliki jumlah sangat banyak. Metode ini membutuhkan model multilingual dan dataset dengan dua bahasa yang berbeda namun memiliki domain yang sama. Model multilingual yang digunakan pada Tugas Akhir ini adalah XLM-R dan mT5 dengan ukuran base dan large. Dataset yang digunakan adalah Universal PropBank dan data milik Gojali untuk dataset Bahasa Indonesia dan CoNLL-2012 untuk dataset Bahasa Inggris. Pengujian dilakukan untuk membuktikan kinerja dari model SRL yang dihasilkan dengan menggunakan data uji dari Universal PropBank Indonesia dan data milik Gojali. Dari seluruh model yang dihasilkan, model XLM-R large dengan menerapkan cross-lingual transfer memiliki kinerja yang terbaik. Model menghasilkan nilai skor F1 0.916 untuk data Gojali saja dan 0.858 untuk gabungan data Universal PropBank Indonesia dan data milik Gojali.