digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC Open In Flip Book karya

Abstrak
PUBLIC Open In Flip Book karya

Abstract
PUBLIC Open In Flip Book karya

Lembar Pengesahan
Terbatas Open In Flip Book karya
» ITB



BAB I
Terbatas Open In Flip Book karya
» ITB

BAB II
Terbatas Open In Flip Book karya
» ITB

BAB III
Terbatas Open In Flip Book karya
» ITB

BAB IV
Terbatas Open In Flip Book karya
» ITB

BAB V
Terbatas Open In Flip Book karya
» ITB


Dengan adanya keterbatasan kemampuan membaca manusia dan masifnya jumlah data teks yang tersedia pada zaman modern, muncul kebutuhan terhadap sistem peringkasan teks otomatis. Salah satu metode peringkasan teks otomatis yang menghasilkan ringkasan yang memuaskan adalah peringkasan teks ekstraktif berbasis density peaks clustering. Penelitian sebelumnya yang menerapkan teknik tersebut berhasil menjadi state-of-the-art untuk dataset DUC 2004. Namun masih terdapat celah untuk pengembangan lebih lanjut, yakni dengan menerapkan teknik sentence embedding berbasis jaringan syaraf tiruan untuk menggantikan embedding vector space model dan topic modelling LDA yang digunakan pada penelitian sebelumnya. Penelitian ini mengusulkan suatu sistem peringkasan teks otomatis berbasis klaster dengan menggunakan Sentence-BERT (SBERT) untuk melakukan sentence embedding dan topic modeling sebagai penyempurnaan dari penelitian sebelumnya. SBERT dipilih karena merupakan teknik state-of-the-art di bidang sentence embedding, sehingga diharapkan dapat merepresentasikan arti semantik kalimat secara lebih baik daripada teknik yang digunakan pada penelitian sebelumnya. Penelitian ini merupakan penelitian pertama yang menerapkan SBERT untuk peringkasan teks. Penelitian ini juga mengusulkan beberapa penyempurnaan pada teknik pemilihan kalimat terbaik yang digunakan pada penelitian sebelumnya. Berdasarkan penilaian menggunakan ROUGEtoolkit, sistem peringkasan teks yang dibangun pada penelitian ini berhasil menciptakan ringkasan yang lebih baik daripada penelitian sebelumnya. Ketika diuji pada dataset DUC 2004, konfigurasi terbaik dari metode yang diusulkan menghasilkan ringkasan yang memiliki skor ROUGE-1 lebih baik sekitar 0,067 daripada ringkasan yang dihasilkan oleh metode sebelumnya.