Perpustakaan Digital ITB

Advanced Search

FEATURE-BASED CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN DENGAN REPRESENTASI TEKS TERSTRUKTUR

3 views

Penulis	:	RINDHU ASTRY NALISTIA (NIM 13504005)
Kontributor / Dosen Pembimbing	:	Pembimbing : Dr. Ir. G. A. Putri Saptawati, M.Comm.
Jenis Koleksi	:	Tugas Akhir
Tahun Terbit	:
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	Document clustering, Sequential patterns, Feature-based clustering, Representasi teks terstruktur, Makna semantik
Sumber	:
Staf Input/Edit	:	Rizki Aprianti Ena Sukmana
File	:	8 file
Tanggal Input	:	09 Okt 2017

2008 TA PP RINDHU ASTRY NALISTIA 1-COVER.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-BAB 1.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-BAB 2.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-BAB 3.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-BAB 4.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-BAB 5.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-BAB 6.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP RINDHU ASTRY NALISTIA 1-PUSTAKA.pdf

PUBLIC Open In Flip Book Ena Sukmana

Tugas Akhir ini menerapkan metode Feature-based Clustering (FBC) untuk pengelompokan dokumen dengan bentuk representasi teks terstruktur berbasis Sequential Patterns (SP) yaitu representasi Himpunan Frequent Word Sequences (HFWS) dan Frequent Word Itemsets (FWI). FBC merupakan metode clustering yang bekerja dengan memanfaatkan relasi sekuensial dari data yang diolahnya. Selain melakukan penerapan, Tugas Akhir ini juga menganalisis ketiga representasi teks untuk mengetahui representasi teks yang menjaga makna semantik dengan baik.Analisis dilakukan dengan mengevaluasi struktur dari tiap bentuk representasi dalam kaitannya dengan penjagaan makna semantik. Dari hasil analisis, diketahui bahwa bentuk representasi teks HFWS dan FWI membutuhkan adanya proses tambahan pada tahap feature generation dalam FBC. Hasil analisis diimplementasikan ke sebuah perangkat lunak bernama FeastClub yang dikembangkan di atas platform Windows XP dengan kakas pembangunan Netbeans 5.5 dan pengelola basis data hsqldb 1.8.0.Dengan menggunakan dataset yang dibentuk dari file e-mail informal Twenty Newsgroup Text Data, direkayasa kasus uji berdasarkan parameter pengelompokan yang terlibat yaitu threshold panjang, frekuensi dan gap, metode feature selection serta bentuk representasi teks. Hasil pengujian akurasi clusters menunjukkan bahwa nilai rata-rata akurasi clusters keseluruhan adalah 0,63. Hasil pengelompokan dengan bentuk representasi teks HFWS mencapai nilai akurasi maksimal sebesar 0,9759 serta memberikan nilai rata-rata akurasi hasil paling tinggi yaitu 0,724 dari skala 1.Dari Tugas Akhir ini, dapat disimpulkan bahwa FBC untuk document clustering dengan bentuk representasi teks HFWS dan FWI dapat secara sempurna diterapkan dengan nilai rata-rata akurasi clusters yang diberikan cukup baik untuk suatu sistem pengelompokan, yaitu 0,63. Dari aspek makna semantik, dapat disimpulkan bahwa dari ketiga representasi teks, makna semantik dokumen dapat dijaga dengan baik oleh representasi teks HFWS.