digilib@itb.ac.id +62 812 2508 8800

2009 TA PP KANIA ADITYARANI 1-COVER.pdf

File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-BAB 1.pdf
File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-BAB 2.pdf
File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-BAB 3.pdf
File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-BAB 4.pdf
File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-BAB 5.pdf
File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-BAB 6.pdf
File tidak tersedia

2009 TA PP KANIA ADITYARANI 1-PUSTAKA.pdf
File tidak tersedia

Terdapat tiga representasi untuk merepresentasikan suatu dokumen teks yaitu representasi Frequent Word Sequences (FWS), representasi Himpunan Frequent Word Sequences (HFWS), dan representasi Frequent Word Itemset (FWI). Sequential pattern mining adalah salah satu metode dalam data mining yang dapat menggunakan ketiga representasi tersebut. Tugas Akhir ini bertujuan menerapkan CFWS* (Clustering based on Frequent Word Sequences yang memanfaatkan sequential pattern mining) untuk representasi HFWS dan representasi FWI, dan menganalisis ketiga representasi teks dalam kaitannya dengan jumlah dan topik pada kelompok dokumen.Analisis dilakukan dengan melakukan evaluasi karakteristik dari masing-masing representasi teks. Representasi HFWS menjaga keterurutan kata berdasarkan kemunculan dan kalimat sedangkan representasi FWS dari kemunculannya saja. Representasi FWI serupa dengan representasi FWS namun tidak memperhatikan urutan elemennya. Hal ini menyebabkan jumlah kelompok dari kecil ke besar: HFWS