Cover
PUBLIC karya Abstrak
PUBLIC karya Abstract
PUBLIC karya
Lembar Pengesahan
Terbatas karya
» ITB
Terbatas karya
» ITB
Kata Pengantar
PUBLIC karya Daftar Isi & Gambar Tabel
PUBLIC karya
BAB I
Terbatas karya
» ITB
Terbatas karya
» ITB
BAB II
Terbatas karya
» ITB
Terbatas karya
» ITB
BAB III
Terbatas karya
» ITB
Terbatas karya
» ITB
BAB IV
Terbatas karya
» ITB
Terbatas karya
» ITB
BAB V
Terbatas karya
» ITB
Terbatas karya
» ITB
Daftar Pustaka
PUBLIC karya
Dengan adanya keterbatasan kemampuan membaca manusia dan masifnya jumlah
data teks yang tersedia pada zaman modern, muncul kebutuhan terhadap sistem
peringkasan teks otomatis. Salah satu metode peringkasan teks otomatis yang
menghasilkan ringkasan yang memuaskan adalah peringkasan teks ekstraktif
berbasis density peaks clustering. Penelitian sebelumnya yang menerapkan teknik
tersebut berhasil menjadi state-of-the-art untuk dataset DUC 2004. Namun masih
terdapat celah untuk pengembangan lebih lanjut, yakni dengan menerapkan teknik
sentence embedding berbasis jaringan syaraf tiruan untuk menggantikan
embedding vector space model dan topic modelling LDA yang digunakan pada
penelitian sebelumnya. Penelitian ini mengusulkan suatu sistem peringkasan teks
otomatis berbasis klaster dengan menggunakan Sentence-BERT (SBERT) untuk
melakukan sentence embedding dan topic modeling sebagai penyempurnaan dari
penelitian sebelumnya. SBERT dipilih karena merupakan teknik state-of-the-art
di bidang sentence embedding, sehingga diharapkan dapat merepresentasikan arti
semantik kalimat secara lebih baik daripada teknik yang digunakan pada
penelitian sebelumnya. Penelitian ini merupakan penelitian pertama yang
menerapkan SBERT untuk peringkasan teks. Penelitian ini juga mengusulkan
beberapa penyempurnaan pada teknik pemilihan kalimat terbaik yang digunakan
pada penelitian sebelumnya. Berdasarkan penilaian menggunakan ROUGEtoolkit, sistem peringkasan teks yang dibangun pada penelitian ini berhasil
menciptakan ringkasan yang lebih baik daripada penelitian sebelumnya. Ketika
diuji pada dataset DUC 2004, konfigurasi terbaik dari metode yang diusulkan
menghasilkan ringkasan yang memiliki skor ROUGE-1 lebih baik sekitar 0,067
daripada ringkasan yang dihasilkan oleh metode sebelumnya.