Muhammad Firas [13518117].pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Parafrasa adalah penyampaian kembali suatu kalimat menjadi kalimat yang berbeda
tanpa mengubah makna aslinya. Deteksi parafrasa merupakan permasalahan
klasifikasi teks dalam pembelajaran supervisi dengan menggunakan data berlabel
untuk menentukan apakah suatu pasangan kalimat merupakan parafrasa atau bukan.
Abstract Meaning Representation (AMR) merupakan suatu representasi semantik
dari suatu kalimat. AMR direpresentasikan sebagai graf yang berakar, berarah, dan
asiklik di mana setiap simpul merupakan suatu konsep dan sisi graf merupakan
hubungan semantik. Untuk saat ini, belum ada penelitian untuk deteksi parafrasa
kalimat bahasa Indonesia menggunakan AMR. Maka dari itu, tugas akhir ini
berfokus pada penggunaan AMR untuk deteksi parafrasa kalimat bahasa Indonesia.
Pada Tugas Akhir ini, nilai Smatch dari pasangan graf AMR dimanfaatkan sebagai
salah satu fitur untuk melatih model Support Vector Machine (SVM) pada masalah
klasifikasi teks berupa parafrasa. Fitur lainnya yang digunakan adalah jaccard
similarity, cosine similarity, dan BERTScore. Penggunaan AMR sebagai fitur ini
dibandingkan dengan baseline yang menggunakan penetapan threshold dari
Smatch AMR.
Eksperimen yang dilakukan berupa hyperparameter tuning pada model SVM untuk
mencari konfigurasi terbaik yang dilatih dengan empat fitur baik secara terpisah
maupun gabungan. Hasil eksperimen dan pengujian menunjukkan model klasifikasi
SVM dengan menggabungkan keempat fitur memiliki skor F1 yang tertinggi, yaitu
0.664 pada data uji terjemahan otomatis dan 0.658 pada data uji terjemahan manual
oleh manusia.