Pseudo Relevance Feedback (PRF) dapat meningkatkan kinerja pada metode
relevance feedback. Pseudo Relevance Feedback mengassumsikan bahwa k
dokumen peringkat tertinggi pada first retrieval adalah dokumen relevan kemudian
akan dibentuk query expansion berdasarkan dokumen relevan. Algoritma Rocchio
adalah algoritma klasik untuk mengimplementasi relevance feedback ke dalam
vector space model. Algoritma Rocchio membentuk query baru yang mendekati
centroid dokumen relevan dan menjauhkan dari dokumen tidak relevan. Namun
pada relevance feedback komponen dokumen tidak relevan sering diabaikan. Karya
tulis ini melakukan penelitian terhadap metode untuk Pseudo Irrelevance Feedback
(PIRF) yang efektif diterapkan pada algoritma Rocchio. Dokumen dengan
peringkat tinggi pada first retrieval selain dari k dokumen relevan dan dokumen
tersebut tidak memiliki nilai similaritas terhadap k dokumen relevan dapat
menghasilkan query expansion yang bagus jika dokumen tersebut diterapkan
sebagai dokumen tidak relevan. Algoritma Rocchio yang menggunakan hasil PRF
sebagai komponen dokumen relevan dan hasil dari metode penelitian ini sebagai
dokumen tidak relevan disebut sebagai Roc PRF PIRF (filter). Hasil penelitian Roc
PRF PIRF (filter) terhadap dataset CISI menunjukkan peningkatan kinerja dengan
pengujian terhadap beberapa variasi jumlah dokumen tidak relevan jika
dibandingkan dengan algoritma Rocchio tanpa dokumen relevan dan Rocchio
dengan dokumen tidak relevan tapi tanpa metode pada penelitian ini.