digilib@itb.ac.id +62 812 2508 8800

13519043 Reihan Andhika Putra.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Mekanisme penyimpanan dokumen sangat penting karena memengaruhi kemudahan dan keakuratan dalam proses pencarian kembali dokumen. Dalam pencarian kembali dokumen, sebaiknya dimanfaatkan informasi penting yang ada di dalam dokumen. Umumnya, penyimpanan dan pencarian kembali dokumen dilakukan oleh mesin pencarian. Oleh karena itu, dibutuhkan perangkat lunak Intelligent Repository System (IRyS) yang dapat melakukan penyimpanan dokumen elektronik, mampu menangani dan mengekstrak informasi dari dokumen dengan domain tertentu. Pada Tugas Akhir ini, dilakukan perancangan dan pengembangan komponen indexing, yaitu komponen utama pada mesin pencarian yang berguna untuk mempercepat proses pencarian serta memungkinkan pencarian dengan memanfaatkan informasi pada dokumen. Komponen indexing terdiri dari tiga tahapan yaitu akuisisi teks, transformasi teks, dan pembuatan index. Pada tahap akuisisi teks, dokumen dikonversi menjadi teks dan dokumen PDF berbasis gambar ditangani menggunakan OCR. Pada tahap transformasi teks, dilakukan konversi dan ekstraksi informasi dari teks menjadi bentuk lain yaitu term/fitur dan domain dokumen diklasifikasikan menggunakan SVM. Pada tahap pembuatan index, dilakukan pembobotan serta pembuatan struktur data index. Pembobotan dilakukan dengan menggunakan model BERT. Pembuatan index dilakukan dengan bantuan Elasticsearch. Evaluasi pada aplikasi menunjukkan bahwa komponen indexing pada mesin pencarian aplikasi IRyS memiliki kinerja yang baik dan memenuhi semua kebutuhan aplikasi. Berdasarkan analisis hasil evaluasi, disimpulkan bahwa komponen indexing berhasil memenuhi kebutuhan IRyS dan memberikan hasil yang optimal.