2007 TA PP HENDRA JAYA 1-COVER.pdf
2007 TA PP HENDRA JAYA 1-BAB 1.pdf
2007 TA PP HENDRA JAYA 1-BAB 2.pdf
2007 TA PP HENDRA JAYA 1-BAB 3.pdf
2007 TA PP HENDRA JAYA 1-BAB 4.pdf
2007 TA PP HENDRA JAYA 1-BAB 5.pdf
2007 TA PP HENDRA JAYA 1-PUSTAKA.pdf
Jumlah informasi yang tersedia di internet saat ini semakin banyak dan beragam. Pengguna membutuhkan mekanisme pencarian yang efektif dalam rangka mendapatkan informasi yang berguna dari sekian banyak informasi yang tersedia. Seringkali pengguna internet lebih menyukai himpunan kecil dokumen yang relevan dengan kebutuhan dibandingkan dengan himpunan dokumen yang besar namun banyak mengandung informasi yang tidak relevan. Dengan kata lain, pengguna internet membutuhkan suatu Sistem Temu Balik Informasi (Information Retrieval/IR) yang memiliki presisi (precision) tinggi.
Berbagai pendekatan untuk meningkatkan presisi Sistem Temu Balik Informasi telah dilakukan. Beberapa diantaranya adalah penggunaan pengindeksan kata adalah pengindeksan frase. Hal lain yang dicoba adalah mengganti model-model yang dipakai dalam Sistem Temu Balik Informasi. Model-model yang lazim dipakai adalah model ruang vektor, model boolean dan model probabilistik. Dalam pengindeksan kata, elemen pengindeksan yang dipakai adalah kata. Dalam pengindeksan frase, elemen pengindeksan yang dipakai adalah frase. Frase yang dimaksud dalam tugas akhir ini adalah frase non-sintaksis. Adapun pemodelan yang dipakai adalah model probabilistik, dimana Sistem Temu Balik Informasi menghitung kemungkinan munculnya elemen indeks dalam suatu dokumen.
Laporan Tugas Akhir ini berisi penjelasan mengenai pengindeksan kata, pengindeksan frase, model probabilistik, performansi pengindeksan kata dalam model probabilistik, performansi pengindeksan kata dalam model probabilistik, serta perbandingan antara performansi keduanya. Sebagai tambahan, tugas akhir ini juga membandingkan performansi pengindeksan kata dan pengindeksan frase dalam model ruang vektor dengan pengindeksan kata dan pengindeksan frase dalam model probabilistik.