digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC karya

Abstrak
PUBLIC karya

Abstract
PUBLIC karya

Lembar Pengesahan
Terbatas karya
» ITB

Kata Pengantar
PUBLIC karya


BAB I
Terbatas karya
» ITB

BAB II
Terbatas karya
» ITB

BAB III
Terbatas karya
» ITB

BAB IV
Terbatas karya
» ITB

BAB V
Terbatas karya
» ITB

Daftar Pustaka
PUBLIC karya

Dengan adanya keterbatasan kemampuan membaca manusia dan masifnya jumlah data teks yang tersedia pada zaman modern, muncul kebutuhan terhadap sistem peringkasan teks otomatis. Salah satu metode peringkasan teks otomatis yang menghasilkan ringkasan yang memuaskan adalah peringkasan teks ekstraktif berbasis density peaks clustering. Penelitian sebelumnya yang menerapkan teknik tersebut berhasil menjadi state-of-the-art untuk dataset DUC 2004. Namun masih terdapat celah untuk pengembangan lebih lanjut, yakni dengan menerapkan teknik sentence embedding berbasis jaringan syaraf tiruan untuk menggantikan embedding vector space model dan topic modelling LDA yang digunakan pada penelitian sebelumnya. Penelitian ini mengusulkan suatu sistem peringkasan teks otomatis berbasis klaster dengan menggunakan Sentence-BERT (SBERT) untuk melakukan sentence embedding dan topic modeling sebagai penyempurnaan dari penelitian sebelumnya. SBERT dipilih karena merupakan teknik state-of-the-art di bidang sentence embedding, sehingga diharapkan dapat merepresentasikan arti semantik kalimat secara lebih baik daripada teknik yang digunakan pada penelitian sebelumnya. Penelitian ini merupakan penelitian pertama yang menerapkan SBERT untuk peringkasan teks. Penelitian ini juga mengusulkan beberapa penyempurnaan pada teknik pemilihan kalimat terbaik yang digunakan pada penelitian sebelumnya. Berdasarkan penilaian menggunakan ROUGEtoolkit, sistem peringkasan teks yang dibangun pada penelitian ini berhasil menciptakan ringkasan yang lebih baik daripada penelitian sebelumnya. Ketika diuji pada dataset DUC 2004, konfigurasi terbaik dari metode yang diusulkan menghasilkan ringkasan yang memiliki skor ROUGE-1 lebih baik sekitar 0,067 daripada ringkasan yang dihasilkan oleh metode sebelumnya.