digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC karya

Abstrak
PUBLIC karya

Abstract
PUBLIC karya

Lembar Pengesahan
Terbatas karya
» ITB

Hal 1-18
Terbatas karya
» ITB

Hal 19-43
Terbatas karya
» ITB

Hal 44-69
Terbatas karya
» ITB

Pencarian kata dalam Quran dengan masukan query suatu kata hanya menghasilkan kata yang persis sama dengan query tersebut. Padahal, terdapat kata lain yang memiliki akar kata yang sama. Namun, kata tersebut berubah bentuk dari bentuk akarnya karena informasi tambahan sehingga tidak ditampilkan dalam hasil pencarian. Pencarian dengan hasil kata-kata yang memiliki akar kata yang sama dapat berguna untuk pencarian dalam Quran. Tugas akhir ini berfokus untuk membuat pencarian kata dalam Quran berbasis kesamaan akar kata menggunakan model ruang vektor. Pencarian kata menerima masukan query berupa suatu kata, memprediksi akar kata tersebut dengan akar kata lainnya, dan menghasilkan kata yang memiliki prediksi akar kata yang sama. Pencarian kata dilakukan dengan prediksi akar kata menggunakan word embedding (word2vec) dari akar kata Quran, lalu dilakukan klasifikasi menggunakan algoritma SVM dan pembuatan kluster dengan algoritma affinity propagation. Training SVM dan affinity propagation dilakukan dengan pembagian data kata unik dalam Quran menjadi data latih sebanyak 5356 kata, data uji sebanyak 670 kata, dan data validasi sebanyak 670 kata. Hasil terbaik dari pencarian kata didapatkan skor F1 sebesar 0,91341 dengan menggunakan algoritma SVM dari hasil word embedding dengan word2vec untuk memprediksi akar kata. Parameter yang digunakan dalam word2vec yaitu banyak vektor sebesar 500, window sebesar 10, dan menggunakan algoritma CBOW. Parameter yang digunakan untuk algoritma SVM yaitu regularisasi sebesar 100 dan tipe kernel yaitu RBF.