digilib@itb.ac.id +62 812 2508 8800

Abstrak
PUBLIC karya

Alquran merupakan sumber pengetahuan utama bagi umat Islam dalam menjalankan agamanya. Penelitian tentang Alquran di Indonesia masih belum banyak dilakukan, utamanya dalam pemanfaatan tekstual terjemah bahasa Indonesia. Sedangkan umat Islam di Indonesia mempunyai kebutuhan untuk mencari keterkaitan antara kehidupan sehari-hari dengan nilai Islam pada ayat Alquran. Pada tugas akhir ini, dirancang sebuah sistem untuk mencari ayat Alquran yang relevan terhadap dokumen bahasa Indonesia menggunakan klasifikasi multilabel dan information retrieval. Setidaknya terdapat dua metode yang dapat digunakan untuk mencari ayat yang relevan terhadap suatu dokumen. Pertama menggunakan information retrieval, kedua mengombinasikan kategorisasi teks atau keyword extraction dengan information retrieval. Pada persoalan ini, kedua metode tersebut digunakan dan dibandingkan kinerjanya. Untuk metode kedua, kategorisasi teks dilakukan menggunakan klasifikasi multilabel pada dokumen bahasa Indonesia untuk mendapatkan topik Alquran yang bersesuaian. Klasifikasi multilabel dilakukan dengan pendekatan problem transformation memanfaatkan algoritme SVM, Random Forest, Decision Tree, dan Naïve-Bayes. Teknik ekstraksi fitur yang digunakan adalah bag of words dan TF-IDF. Kemudian kumpulan label topik Alquran digunakan sebagai query untuk modul information retrieval pada ayat Alquran. Teknik information retrieval yang digunakan adalah vector space model dengan memanfaatkan fungsi cosine similarity. Berdasarkan eksperimen yang dilakukan, metode pertama dengan infromation retrieval saja memberikan kinerja terbaik dengan nilai micro-average precision sebesar 23.557%. Hal ini membuktikan bahwa penyederhanaan teks menjadi kumpulan kata kunci tidak memberikan kinerja yang lebih baik. Penggunaan basis pengetahuan yang kurang umum digunakan juga berpengaruh kepada kinerja klasifikasi multilabel, sehingga informatrion retrieval yang dilakukan menjadi kurang sesuai.