digilib@itb.ac.id +62 812 2508 8800

Abstrak
PUBLIC karya

COVER Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 1 Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 2 Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 3 Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 4 Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 5 Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 6 Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

PUSTAKA Irfan Ariq
Terbatas  karya
» Gedung UPT Perpustakaan

Pada saat ini sudah sangat banyak informasi yang ada pada halaman web. Informasi yang terdapat pada halaman web pun sangat beragam. Informasi tersebut akan sangat berguna apabila dapat diolah lebih lanjut. Oleh karena itu dikembangkan sistem ekstraksi informasi. Terdapat dua jenis sistem ekstraksi informasi yaitu sistem ekstraksi informasi terbuka dan sistem ekstraksi informasi spesifik domain. Untuk pemanfaatan informasi lebih lanjut, sistem ekstraksi informasi spesifik domain lebih dibutuhkan. Sudah terdapat beberapa metode berbeda untuk sistem ekstraksi informasi spesifk domain. Salah satunya dengan mengadaptasi sistem ekstraksi informasi terbuka menjadi relasi spesifik domain. Tugas akhir ini akan dikembangkan sistem ekstraksi informasi spesifik domain dengan memanfaatkan sistem ekstraksi informasi terbuka. Saat ini terdapat sistem ekstraksi informasi terbuka yang modular dan ekstensibel yang dikembangkan oleh Saputra (2018). Untuk mengubah hasil ekstraksi dari sistem ekstraksi informasi terbuka, akan ditambahkan dua komponen yaitu class recognizer dan domain relation mapper. Penambahan kedua komponen tersebut dapat mempertahankan sifat modular dan ekstensibel sistem sebelumnya. Komponen class recognizer memiliki fungsi untuk mengenali domain kelas pada hasil ekstraksi OpenIE dan domain data. Pengenalan domain kelas dilakukan menggunakan kumpulan kata dan pola regular expression. Komponen domain relation mapper memiliki fungsi untuk mengubah hasil ekstraksi OpenIE menjadi relasi domain spesifik menggunakan aturan pemetaan. Aturan pemetaan akan dibangkitkan menggunakan covering algorithm berdasarkan domain data yang ada. Menggunakan kedua komponen tersebut, sistem dapat mengekstrak informasi yang relevan pada suatu domain dan mengabaikan informasi yang tidak relevan pada domain.