digilib@itb.ac.id +62 812 2508 8800

Information Retrieval pada dasarnya merupakan proses untuk menentukan dokumen dalam koleksi yang harus ditemubalikkan untuk memenuhi keinginan pengguna akan informasi. Suatu sistem temu balik informasi dikatakan ideal jika sistem tersebut dapat menemukan seluruh dokumen yang relevan dan sistem hanya menemukan dokumen yang relevan saja. Term-term yang terdapat di dokumen dan di query sering memiliki banyak varian morfologik, sehingga pasangan term tersebut tidak akan dianggap ekuivalen oleh sistem tanpa suatu bentuk Natural Language Processing. Pada beberapa kasus, varian morfologik dari term-term memiliki interpretasi semantik yang sama dan dapat dianggap ekuivalen oleh sistem. Karena alasan tersebut, teknik stemming atau stemmers dikembangkan dengan tujuan mereduksi term menjadi bentuk akarnya. Stemming adalah proses pemotongan (pembuangan) affiks, baik prefiks maupun sufiks, dari sebuah term. Terdapat beberapa algoritma stemming yang sudah dikenal luas, diantaranya adalah algoritma Porter, algoritma Paice / Husk, dan algoritma Lovins. Suatu designer sistem temu balik informasi harus memahami karakteristik dari suatu algoritma stemming agar dapat memilih stemmer terbaik dalam pembuatan sistem temu balik informasi. Hal ini mendasari pemikiran akan pentingnya perbandingan algoritma-algoritma stemming. Pada tugas akhir ini, dilakukan studi dan implementasi berbagai algoritma stemming, serta analisis perbandingan tiap algoritma stemming dilihat dari segi performansi, kekuatan, maupun kemiripannya.