Perpustakaan Digital - Digilib ITB

PEMANFAATAN SEQUENTIAL PATTERNS DALAM PENGEMBANGAN ALGORITMA CFWS UNTUK DOCUMENT CLUSTERING

99 views

Save At List

Penulis	:	Andri Tanoto / 13503078
Kontributor / Dosen Pembimbing	:	Pembimbing : G.A. Putri Saptawati,Ir. , M.Comm. Scanner: Alice Diniarti 2008-02-13.
Jenis Koleksi	:	Tugas Akhir
Tahun Terbit	:
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	Clustering based on Frequent Word Sequences (CFWS), frequent word sequences, sequential patterns mining, preprocessing, document clustering.
Sumber	:
Staf Input/Edit	:	Alice D Ena Sukmana
File	:	8 file
Tanggal Input	:	09 Okt 2017

2007 TA PP ANDRI TANOTO 1-COVER.pdf

2007 TA PP ANDRI TANOTO 1-BAB 1.pdf

2007 TA PP ANDRI TANOTO 1-BAB 2.pdf

2007 TA PP ANDRI TANOTO 1-BAB 3.pdf

2007 TA PP ANDRI TANOTO 1-BAB 4.pdf

2007 TA PP ANDRI TANOTO 1-BAB 5.pdf

2007 TA PP ANDRI TANOTO 1-BAB 6.pdf

2007 TA PP ANDRI TANOTO 1-PUSTAKA.pdf

Abstrak: Berdasarkan hasil penelitian Li Yanjun, algoritma Clustering based on Frequent Word Sequences (CFWS) versi original menggunakan metode association rules mining pada tahap pencarian frequent word sequences. Pada Tugas Akhir ini dilakukan pengembangan algoritma CFWS tersebut dengan memanfaatkan metode sequential patterns mining untuk menggantikan metode association rules mining. Penggunaan sequential patterns mining tersebut bertujuan agar arti semantik dari kata-kata pada dokumen tetap terjaga. Selain itu, untuk merepresentasikan dokumen digunakan representasi pertama yang berupa himpunan frequent word sequences. Penggunaan metode sequential patterns mining menyebabkan perlunya tahap preprocessing pada algoritma CFWS. Preprocessing yang dilakukan meliputi penghapusan header setiap dokumen dan stopword removal. Tujuan dari preprocessing ini adalah untuk mengurangi ukuran dokumen sehingga proses mendapatkan frequent 2-word sequences dari setiap dokumen menjadi lebih cepat dan efisien. Selain itu, pada Tugas Akhir ini pun dilakukan pengujian terhadap hasil implementasi pengembangan algoritma CFWS serta melakukan analisis terhadap hasil pengujian dengan nilai minimum support, nilai k, dan nilai threshold yang berbeda-beda. Kesimpulan dari Tugas Akhir ini adalah representasi pertama dan metode sequential patterns mining dapat diterapkan pada algoritma CFWS untuk melakukan document clustering. Selain itu, pemilihan nilai minimum support, nilai k dan nilai threshold yang tepat akan menghasilkan hasil clustering yang optimal.

Perpustakaan Digital ITB

PEMANFAATAN SEQUENTIAL PATTERNS DALAM PENGEMBANGAN ALGORITMA CFWS UNTUK DOCUMENT CLUSTERING

Artikel Terkait

Daftar Simpan Judul

PEMANFAATAN SEQUENTIAL PATTERNS DALAM PENGEMBANGAN ALGORITMA CFWS UNTUK DOCUMENT CLUSTERING

Artikel Terkait