digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Yuly Haruka Berliana Gunawan
Terbatas Irwan Sofiyan
» ITB

Sistem peringkasan otomatis telah banyak dikembangkan untuk mengatasi perulangan informasi dan tidak lengkapnya informasi pada satu sumber berita. Sistem peringkasan abstraktif otomatis untuk kumpulan berita berbahasa Indonesia berbasis graf semantik yang menggunakan ekstraksi predicate argument structure (PAS) dan algoritma genetika telah dibangun dan mempunyai hasil yang optimal. Sistem tersebut masih menggunakan ekstraksi SPOK untuk ekstraksi PAS dikarenakan belum ada model SRL untuk bahasa Indonesia saat itu. Saat ini, model SRL untuk bahasa Indonesia telah dibangun dengan menggunakan BiLSTM dan mempunyai hasil optimal. Oleh karena itu model SRL tersebut dapat digunakan untuk menggantikan ekstraksi PAS. Selain itu, hasil kinerja ringkasan dengan menggunakan algoritma genetika terbaik lebih rendah dibandingkan dengan menggunakan bobot 1 pada fitur kalimat. Oleh karena itu, model klasifikasi decision tree digunakan untuk mengekstraksi fitur-fitur kalimat. Pada Tugas Akhir ini, dibangun sistem peringkasan abstraktif otomatis untuk kumpulan berita berbahasa Indonesia dengan menggunakan semantic role labeling (SRL) dan model klasifikasi decision tree. Model SRL yang digunakan merupakan hasil pemodelan ulang SRL milik Devina & Khodra dengan penambahan data latih. Model klasifikasi decision tree yang dibangun menggunakan 10 fitur kalimat dan 4 fitur kalimat sebagai fiturnya dan menghasilkan label ‘0’ atau ‘1’ untuk menentukan apakah kalimat tersebut penting atau tidak pada suatu dokumen. Pada Tugas Akhir ini dilakukan eksperimen dan pengujian terhadap model peringkasan. Eksperimen dilakukan untuk melihat kinerja model SRL dan memilih model decision tree terbaik. Model klasifikasi decision tree terbaik adalah model klasifikasi decision tree dengan 10 fitur kalimat. Model peringkasan terbaik menghasilkan rata-rata nilai recall ROUGE-2 0.313 untuk ringkasan 100 kata dan 0.394 untuk ringkasan 200 kata.