digilib@itb.ac.id +62 812 2508 8800

M. Abdi Haryadi. H [13519156].pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Penelitian tentang penyederhanaan teks berbahasa Indonesia masih sedikit dan belum mencakup banyak kasus. Metode penyederhanaan teks yang mencakup banyak kasus berasal dari metode-berbasis-aturan Siddharthan (2004), tetapi belum mencakup bahasa Indonesia. Pada tugas akhir ini, penyusunan penyederhanaan teks mengacu pada metode ini yang mencakup klausa relatif, aposisi, kalimat majemuk, dan rujukan. Modul ini kemudian digunakan sebagai praproses peringkasan otomatis ekstraktif Gojali (2022) yang meliputi mekanisme SRL. Proses yang dilibatkan dimulai dari penyusunan dataset penyederhanaan teks. Selanjutnya, modul penyederhanaan teks disusun dengan proses POS-tagging, noun chunking, ekstraksi fungsi gramatikal, ekstraksi agreement, resolusi kata ganti orang ketiga, penentuan subjek klausa relatif, penandaan batas klausa dan aposisi, transformasi, serta pergantian rujukan. Selanjutnya, evaluasi dilakukan pada dataset dan modul penyederhanaan teks, serta kinerja SRL dan peringkasan otomatis Gojali (2022) yang telah diintegrasikan dengan penyederhanaan teks. Hasil yang diperoleh adalah modul penyederhanaan teks memerlukan penyesuaian untuk diterapkan ke dalam bahasa Indonesia, seperti untuk kasus keterangan waktu dan tempat yang menyerupai aposisi, serta kalimat majemuk dengan unsur kalimat yang digunakan bersama. Selain itu, modul tersebut belum menangani resolusi kata ganti orang ketiga dengan baik. Penyederhanaan teks sebagai praproses SRL meningkatkan dan mengurangi kinerja identifikasi untuk role tertentu. Penyederhanaan teks juga meningkatkan kinerja precision dan menurunkan kinerja recall pada peringkasan otomatis hasil pengembangan Gojali (2022) dengan metrik ROUGE (Lin, 2004).