digilib@itb.ac.id +62 812 2508 8800

Muhammad Firas [13518117].pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Parafrasa adalah penyampaian kembali suatu kalimat menjadi kalimat yang berbeda tanpa mengubah makna aslinya. Deteksi parafrasa merupakan permasalahan klasifikasi teks dalam pembelajaran supervisi dengan menggunakan data berlabel untuk menentukan apakah suatu pasangan kalimat merupakan parafrasa atau bukan. Abstract Meaning Representation (AMR) merupakan suatu representasi semantik dari suatu kalimat. AMR direpresentasikan sebagai graf yang berakar, berarah, dan asiklik di mana setiap simpul merupakan suatu konsep dan sisi graf merupakan hubungan semantik. Untuk saat ini, belum ada penelitian untuk deteksi parafrasa kalimat bahasa Indonesia menggunakan AMR. Maka dari itu, tugas akhir ini berfokus pada penggunaan AMR untuk deteksi parafrasa kalimat bahasa Indonesia. Pada Tugas Akhir ini, nilai Smatch dari pasangan graf AMR dimanfaatkan sebagai salah satu fitur untuk melatih model Support Vector Machine (SVM) pada masalah klasifikasi teks berupa parafrasa. Fitur lainnya yang digunakan adalah jaccard similarity, cosine similarity, dan BERTScore. Penggunaan AMR sebagai fitur ini dibandingkan dengan baseline yang menggunakan penetapan threshold dari Smatch AMR. Eksperimen yang dilakukan berupa hyperparameter tuning pada model SVM untuk mencari konfigurasi terbaik yang dilatih dengan empat fitur baik secara terpisah maupun gabungan. Hasil eksperimen dan pengujian menunjukkan model klasifikasi SVM dengan menggabungkan keempat fitur memiliki skor F1 yang tertinggi, yaitu 0.664 pada data uji terjemahan otomatis dan 0.658 pada data uji terjemahan manual oleh manusia.