digilib@itb.ac.id +62 812 2508 8800

Sistem peringkasan otomatis multidokumen mentransformasikan sekumpulan dokumen dengan topik yang sama menjadi satu ringkasan yang memuat informasi umum topik berita dan informasi unik setiap dokumen. Tugas akhir ini memiliki tujuan untuk menghasilkan sistem peringkasan otomatis berbasis ekstraktif dengan memanfaatkan pembelajaran jaringan saraf buatan dan topologi GCN (Graph Convolutional Network). Topologi GCN mampu memperhitungkan masukan graf keterhubungan antarkalimat dalam pembangunan ringkasan. Sistem ini terdiri atas empat komponen utama, yaitu komponen praproses, komponen pembentukan graf, komponen penilaian kalimat, dan komponen seleksi kalimat. Komponen penilaian kalimat merupakan arsitektur jaringan saraf buatan yang memanfaatkan topologi RNN (Recurrent Neural Network) dan GCN untuk menghasilkan nilai kepentingan kalimat dengan masukan sekuens word embedding kalimat dan graf keterhubungan antarkalimat. Jumlah jenis masukan graf keterhubungan antarkalimat yang digunakan ada tiga jenis. Komponen seleksi kalimat kemudian akan membangun ringkasan dengan dua teknik, yaitu pemilihan greedy dan dengan MMR (Maximum Marginal Relevance). Eksperimen menghasilkan model dengan parameter terbaik untuk ringkasan 100 kata dan 200 kata. Peringkasan multidokumen dengan menggunakan GCN mampu menghasilkan kinerja rata-rata recall ROUGE-2 sebesar 0.370 pada ringkasan 100 kata dan 0.378 pada ringkasan 200 kata terhadap data uji. Penambahan masukan graf keterhubungan antar kalimat PDG (Personalized Discourse Graph) meningkatkan kinerja sistem tanpa masukan graf. Ringkasan 100 kata terbaik dibangun dengan seleksi greedy, sedangkan ringkasan 200 kata terbaik dibangun dengan seleksi MMR.