ABSTRAK
PENINGKATAN KINERJA EKSPANSI QUERY DENGAN PSEUDO RELEVANCE FEEDBACK DAN SIMILARITAS WU-PALMER PADA SISTEM TEMU BALIK LINTAS BAHASA
Oleh
Muhammad Akmal Pratama
NIM : 13515135
Semakin banyaknya informasi yang terdapat dalam berbagai bahasa membuat kebutuhan akan pencarian informasi relevan menjadi persoalan tersendiri. Sistem temu balik informasi lintas bahasa mengalami penurunan kinerja akibat hilangnya sebagian makna saat proses penerjemahan atau query awal yang tidak deskriptif terhadap informasi yang ingin dicari. Salah satu metode untuk meningkatkan kinerja sistem temu balik adalah ekspansi query relevance feedback. Metode lainnya memanfaatkan sumber teks eksternal seperti WordNet sebagai dasar dalam membangkitkan kandidat term ekspansi. Penelitian ini memanfaatkan pengukuran similaritas semantik Wu-Palmer yang ada pada WordNet untuk meningkatkan kinerja ekspansi query pseudo relevance feedback. Term yang terdapat pada dokumen feedback dipertimbangkan sebagai kandidat term ekspansi. Setiap kandidat diberi bobot berdasarkan nilai IDF, skor similaritas Wu-Palmer, dan skor dokumen menggunakan fungsi ranking Okapi. Sejumlah N kandidat term dengan bobot tertinggi digunakan dalam ekspansi query. Hasil pengujian pada koleksi CRAN menunjukan bahwa metode ekspansi query pseudo relevance feedback dengan similaritas semantik Wu-Palmer dapat memiliki kinerja yang lebih baik dibanding metode Rocchio pseudo relevance feedback untuk dokumen feedback kurang dari 5. Nilai mean average precision tertinggi didapat saat 1 dokumen feedback dan 2 term ekspansi digunakan dengan besar 0.6650 dibandingkan dengan parameter yang sama untuk metode Rocchio pseudo relevance feedback dengan besar 0.6425.
Kata kunci: query expansion, information retrieval, Wu-Palmer similarity, pseudo relevance feedback