digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC karya

Abstrak dan Abstract
PUBLIC karya

Lembar Pengesahan
Terbatas karya
» ITB

Kata Pengantar
PUBLIC karya

BAB I
PUBLIC Irwan Sofiyan

BAB II
PUBLIC Irwan Sofiyan

BAB III
PUBLIC Irwan Sofiyan

BAB IV
PUBLIC Irwan Sofiyan

BAB V
PUBLIC Irwan Sofiyan

BAB VI
PUBLIC Irwan Sofiyan

Daftar Pustaka & Lampiran
PUBLIC Irwan Sofiyan

Seiring dengan banyaknya sumber berita online, ringkasan menjadi diperlukan untuk memperoleh informasi yang penting dalam waktu baca yang lebih singkat. Peringkasan dengan Abstract Meaning Representation (AMR) telah dilakukan pertama kalinya untuk bahasa Indonesia dengan menggunakan pembangkit graf AMR berbasis aturan. Graf AMR digunakan untuk merepresentasikan kalimat. Batasan yang dimiliki oleh pembangkit graf AMR tersebut adalah terdapat frasa pada simpul. Hal ini menimbulkan permasalahan pada proses penggabungan konsep yang sama ketika meringkas. Pada penelitian ini, pembangkit graf AMR berbasis pembelajaran mesin digunakan untuk menggantikan pembangkit graf AMR berbasis aturan. Pembangkit graf AMR ini telah dapat membangkitkan simpul dengan kata saja. Graf AMR yang dibangkitkan kemudian melalui penggabungan konsep berdasarkan kata yang sama dan sinonim untuk membentuk graf sumber. Graf sumber kemudian diseleksi menjadi subgraf (graf ringkasan) untuk dibangkitkan menjadi kumpulan kata oleh Simple Natural Language Generation (Simple NLG). Dari kumpulan kata, akan diekstraksi tiga kalimat artikel berita berdasarkan skor kalimat tertinggi. Data yang digunakan untuk sistem peringkasan ini adalah dataset IndoSum. Dari hasil penelitian, terbukti bahwa pembangkit graf AMR berbasis pembelajaran mesin dapat melalui proses penggabungan konsep dengan baik. Sebagai dasar perbandingan (baseline), dilakukan ekstraksi sebanyak tiga kalimat berita yang paling mirip dengan ringkasan referensi berdasarkan cosine similarity. Representasi yang digunakan adalah Word2Vec yang telah dilatih ulang. Sistem peringkasan dengan AMR masih belum melampaui kinerja baseline. Dari analisis yang dilakukan, terlihat bahwa sistem cenderung memilih simpul yang kata aslinya terdapat pada kalimat awal.