digilib@itb.ac.id +62 812 2508 8800

Pseudo Relevance Feedback (PRF) dapat meningkatkan kinerja pada metode relevance feedback. Pseudo Relevance Feedback mengassumsikan bahwa k dokumen peringkat tertinggi pada first retrieval adalah dokumen relevan kemudian akan dibentuk query expansion berdasarkan dokumen relevan. Algoritma Rocchio adalah algoritma klasik untuk mengimplementasi relevance feedback ke dalam vector space model. Algoritma Rocchio membentuk query baru yang mendekati centroid dokumen relevan dan menjauhkan dari dokumen tidak relevan. Namun pada relevance feedback komponen dokumen tidak relevan sering diabaikan. Karya tulis ini melakukan penelitian terhadap metode untuk Pseudo Irrelevance Feedback (PIRF) yang efektif diterapkan pada algoritma Rocchio. Dokumen dengan peringkat tinggi pada first retrieval selain dari k dokumen relevan dan dokumen tersebut tidak memiliki nilai similaritas terhadap k dokumen relevan dapat menghasilkan query expansion yang bagus jika dokumen tersebut diterapkan sebagai dokumen tidak relevan. Algoritma Rocchio yang menggunakan hasil PRF sebagai komponen dokumen relevan dan hasil dari metode penelitian ini sebagai dokumen tidak relevan disebut sebagai Roc PRF PIRF (filter). Hasil penelitian Roc PRF PIRF (filter) terhadap dataset CISI menunjukkan peningkatan kinerja dengan pengujian terhadap beberapa variasi jumlah dokumen tidak relevan jika dibandingkan dengan algoritma Rocchio tanpa dokumen relevan dan Rocchio dengan dokumen tidak relevan tapi tanpa metode pada penelitian ini.