digilib@itb.ac.id +62 812 2508 8800

13519167 Reyhan Emyr Arrosyid.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Dokumen memiliki peran yang sangat penting dalam pertukaran dan penyimpanan informasi. Karena itu, pengelolaan dan penyimpanan dokumen perlu diperhatikan dengan baik. Selain pengelolaan dan penyimpanan, pencarian kembali dokumen yang sudah disimpan juga merupakan hal yang sering dilakukan. Tugas akhir ini bertujuan untuk mengembangkan sebuah aplikasi penyimpanan dan pengelolaan dokumen yang dilengkapi mesin pencarian bernama Intelligent Repository System (IRyS). Aplikasi IRyS dapat menangani dokumen pada domain umum, karya ilmiah, dan rekrutmen. Agar dokumen dalam IRyS dapat dicari berdasarkan informasi yang dikandung dokumen tersebut, mesin pencari harus dapat melakukan ekstraksi terhadap informasi yang dikandung suatu dokumen. Namun, informasi penting yang dikandung sebuah dokumen sangat bergantung terhadap domain dokumen tersebut. Sistem ekstraksi yang dibangun harus dapat melakukan ekstraksi informasi penting sesuai dengan domain dokumennya. Pada tugas akhir ini, dikembangkan sistem ekstraksi informasi yang dapat melakukan ekstraksi dari dokumen pada domain umum dan secara khusus pada domain karya ilmiah dan rekrutmen. Sistem ekstraksi informasi dibangun dengan beberapa metode yaitu named entity recognition, metode berbasis aturan, serta pembelajaran mesin. Implementasi sistem ekstraksi menggunakan pendekatan berorientasi objek. Berdasarkan hasil evaluasi, sistem ekstraksi dapat mengekstrak mayoritas elemen informasi yang dengan benar dan memperoleh nilai F1-score di atas 0,75. Namun masih terdapat beberapa kekurangan khususnya pada nilai recall untuk domain rekrutmen.