Cover
PUBLIC karya Abstrak
PUBLIC karya Abstract
PUBLIC karya
Lembar Pengesahan
Terbatas karya
» ITB
Terbatas karya
» ITB
Hal 1-18
Terbatas karya
» ITB
Terbatas karya
» ITB
Hal 19-43
Terbatas karya
» ITB
Terbatas karya
» ITB
Hal 44-69
Terbatas karya
» ITB
Terbatas karya
» ITB
Pencarian kata dalam Quran dengan masukan query suatu kata hanya menghasilkan
kata yang persis sama dengan query tersebut. Padahal, terdapat kata lain yang
memiliki akar kata yang sama. Namun, kata tersebut berubah bentuk dari bentuk
akarnya karena informasi tambahan sehingga tidak ditampilkan dalam hasil
pencarian. Pencarian dengan hasil kata-kata yang memiliki akar kata yang sama
dapat berguna untuk pencarian dalam Quran. Tugas akhir ini berfokus untuk
membuat pencarian kata dalam Quran berbasis kesamaan akar kata menggunakan
model ruang vektor.
Pencarian kata menerima masukan query berupa suatu kata, memprediksi akar kata
tersebut dengan akar kata lainnya, dan menghasilkan kata yang memiliki prediksi
akar kata yang sama. Pencarian kata dilakukan dengan prediksi akar kata
menggunakan word embedding (word2vec) dari akar kata Quran, lalu dilakukan
klasifikasi menggunakan algoritma SVM dan pembuatan kluster dengan algoritma
affinity propagation. Training SVM dan affinity propagation dilakukan dengan
pembagian data kata unik dalam Quran menjadi data latih sebanyak 5356 kata, data
uji sebanyak 670 kata, dan data validasi sebanyak 670 kata.
Hasil terbaik dari pencarian kata didapatkan skor F1 sebesar 0,91341 dengan
menggunakan algoritma SVM dari hasil word embedding dengan word2vec untuk
memprediksi akar kata. Parameter yang digunakan dalam word2vec yaitu banyak
vektor sebesar 500, window sebesar 10, dan menggunakan algoritma CBOW.
Parameter yang digunakan untuk algoritma SVM yaitu regularisasi sebesar 100 dan
tipe kernel yaitu RBF.