Perpustakaan Digital - Digilib ITB

PENERAPAN SENTENCE-BERT UNTUK MENINGKATKAN KINERJA PERINGKASAN TEKS EKSTRAKTIF BERBASIS DENSITY PEAKS CLUSTERING

402 views

Penulis	:	Paulus Setiawan Suryadjaja [23519003]
Kontributor / Dosen Pembimbing	:	Ir. Rila Mandala, M.Eng., Ph.D.
Jenis Koleksi	:	Tesis
Tahun Terbit	:
Penerbit	:	Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	Peringkasan teks, density peaks clustering, sentence-BERT, topic modeling, peringkasan teks berbasis klaster, peringkasan teks ekstraktif, DUC 2004
Sumber	:
Staf Input/Edit	:	karya
File	:	12 file
Tanggal Input	:	17 Jun 2021

Cover

PUBLIC Open In Flip Book karya

Abstrak

PUBLIC Open In Flip Book karya

Abstract

PUBLIC Open In Flip Book karya

Lembar Pengesahan
Terbatas Open In Flip Book karya
» ITB

Kata Pengantar

PUBLIC Open In Flip Book karya

Daftar Isi & Gambar Tabel

PUBLIC Open In Flip Book karya

BAB I
Terbatas Open In Flip Book karya
» ITB

BAB II
Terbatas Open In Flip Book karya
» ITB

BAB III
Terbatas Open In Flip Book karya
» ITB

BAB IV
Terbatas Open In Flip Book karya
» ITB

BAB V
Terbatas Open In Flip Book karya
» ITB

Daftar Pustaka

PUBLIC Open In Flip Book karya

Dengan adanya keterbatasan kemampuan membaca manusia dan masifnya jumlah data teks yang tersedia pada zaman modern, muncul kebutuhan terhadap sistem peringkasan teks otomatis. Salah satu metode peringkasan teks otomatis yang menghasilkan ringkasan yang memuaskan adalah peringkasan teks ekstraktif berbasis density peaks clustering. Penelitian sebelumnya yang menerapkan teknik tersebut berhasil menjadi state-of-the-art untuk dataset DUC 2004. Namun masih terdapat celah untuk pengembangan lebih lanjut, yakni dengan menerapkan teknik sentence embedding berbasis jaringan syaraf tiruan untuk menggantikan embedding vector space model dan topic modelling LDA yang digunakan pada penelitian sebelumnya. Penelitian ini mengusulkan suatu sistem peringkasan teks otomatis berbasis klaster dengan menggunakan Sentence-BERT (SBERT) untuk melakukan sentence embedding dan topic modeling sebagai penyempurnaan dari penelitian sebelumnya. SBERT dipilih karena merupakan teknik state-of-the-art di bidang sentence embedding, sehingga diharapkan dapat merepresentasikan arti semantik kalimat secara lebih baik daripada teknik yang digunakan pada penelitian sebelumnya. Penelitian ini merupakan penelitian pertama yang menerapkan SBERT untuk peringkasan teks. Penelitian ini juga mengusulkan beberapa penyempurnaan pada teknik pemilihan kalimat terbaik yang digunakan pada penelitian sebelumnya. Berdasarkan penilaian menggunakan ROUGEtoolkit, sistem peringkasan teks yang dibangun pada penelitian ini berhasil menciptakan ringkasan yang lebih baik daripada penelitian sebelumnya. Ketika diuji pada dataset DUC 2004, konfigurasi terbaik dari metode yang diusulkan menghasilkan ringkasan yang memiliki skor ROUGE-1 lebih baik sekitar 0,067 daripada ringkasan yang dihasilkan oleh metode sebelumnya.

Perpustakaan Digital ITB

PENERAPAN SENTENCE-BERT UNTUK MENINGKATKAN KINERJA PERINGKASAN TEKS EKSTRAKTIF BERBASIS DENSITY PEAKS CLUSTERING

Artikel Terkait