digilib@itb.ac.id +62 812 2508 8800

Saat melakukan pencarian informasi dengan sistem information retrieval (IR), terkadang hasil dokumen pencarian yang diberikan oleh sistem tidak sesuai dengan kebutuhan dari pengguna. Query expansion (QE) berbasis Pseudo Relevance Feedback (PRF) mencoba mengatasi permasalahan tersebut dengan menambahkan kata-kata yang diharapkan mampu meningkatkan hasil retrieval dari N dokumen ranking teratas yang diambil oleh sistem IR. Penggunaan firefly algorithm (FA) sebagai salah satu metode optimasi telah dibuktikan dalam penelitian sebelumnya dapat meningkatkan performansi dari sistem IR berbasis PRF, dengan memilih kombinasi kata terbaik untuk diekspansi. Namun, dalam penelitian tersebut dilakukan pembobotan kata menggunakan fungsi Rocchio terhadap PRD, akan mengurangi performa dari sistem IR jika jumlah dokumen relevan sedikit atau tidak ada sama sekali. Selain itu, peneitian tersebut juga tidak melihat hubungan antara term ekpansi dengan term dari query. Oleh karena itu, ditambahkan scoring terhadap term relationship antara query dan PRD, yaitu dengan word similarity dan word co-occurence. Hasil dari penelitian menunjukkan penggunaan term relationship mampu menaikkan performansi dari PRF menggunakan FA yang telah dilakukan sebelumnya. Selain itu word co-occurrence dengan jaccard memiliki performansi terbaik dibandingkan dengan pembobotan Rocchio, Word2Vec word similarity, ataupun Word2Vec word co-occurence. FA sendiri mampu mengambil kombinasi kata yang optimal meskipun jumlah PRD bertambah, namun dengan penambahan iterasi.