Perpustakaan Digital - Digilib ITB

PEMBANGUNAN SISTEM QUESTION ANSWERING BAHASA INDONESIA UNTUK PERTANYAAN FACTOID DARI KNOWLEDGE GRAPH PRODUK KECANTIKAN WAJAH

127 views

Penulis	:	Mahanti Indah Rahajeng [13517085]
Kontributor / Dosen Pembimbing	:	Dr.Eng. Ayu Purwarianti, S.T., M.T.
Jenis Koleksi	:	Tugas Akhir
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	question answering, knowledge graph
Sumber	:
Staf Input/Edit	:	karya
File	:	0 file
Tanggal Input	:	01 Sep 2021

Question answering adalah salah satu riset dalam bidang pemrosesan bahasa alami yang bertujuan untuk mendapatkan jawaban yang benar dari pertanyaan dalam bahasa alami. Suatu sistem question answering dapat dimanfaatkan untuk membangun chatbot ataupun mesin pencarian. Sistem question answering yang dibahas selanjutnya adalah sistem yang menggunakan knowledge graph sebagai sumber data. Ide dari pembangunan sistem ini adalah mentranslasi pertanyaan menjadi kueri SPARQL. Proses umum dalam sistem question answering adalah analisis pertanyaan, pemetaan frasa, disambiguasi, dan pembentukan kueri. Solusi sistem yang dibangun terdiri dari empat modul, yaitu modul klasifikasi tipe jawaban serta modul ekstraksi informasi yang melakukan proses analisis pertanyaan, modul kemiripan teks yang melakukan pemetaan frasa sekaligus disambiguasi, dan modul pembentukan kueri yang membentuk kueri serta mengeksekusi kueri. Eksperimen dilakukan pada modul klasifikasi tipe jawaban dan modul ekstraksi informasi untuk menemukan model terbaik. Modul klasifikasi tipe jawaban melakukan eksperimen dengan tujuh model, yaitu SVM-tfidf, SVM-fastText, SVM-IndoBERT, LSTM-fastText, LSTM-IndoBERT, fine-tuning IndoBERT, dan fine-tuning IndoBERT auxiliary. Modul ekstraksi informasi melakukan eksperimen dengan lima model, yaitu SVM-fastText, SVM-IndoBERT, LSTM-fastText, LSTM-IndoBERT, dan fine-tuning IndoBERT. Model yang terbaik digunakan untuk membangun sistem question answering. Modul kemiripan teks yang dibangun memanfaatkan kemiripan leksikal yang dihitung dengan dua metrik jarak yaitu Jaccard dan Levenshtein. Modul pembentukan kueri dibangun dengan menggunakan template kueri. Berdasarkan hasil eksperimen, model fine-tuning IndoBERT mempunyai kinerja yang paling baik untuk klasifikasi tipe jawaban. Untuk ekstraksi informasi, model LSTM-IndoBERT dan fine-tuning IndoBERT mempunyai kinerja yang sama baik. Model tersebut mendapatkan akurasi 1.00 pada klasifikasi tipe jawaban dan F1-score 0.98 untuk ekstraksi informasi. Sistem question answering selanjutnya dibangun menggunakan model fine-tuning IndoBERT untuk modul klasifikasi tipe jawaban dan ekstraksi informasi karena kinerja model ini yang baik terhadap data validasi maupun data uji. Secara keseluruhan, sistem question answering mendapatkan nilai evaluasi rata-rata F1-score, precision, dan recall secara berurutan yaitu 0.8499703, 0.8823529 dan 0.8418301.

Perpustakaan Digital ITB

PEMBANGUNAN SISTEM QUESTION ANSWERING BAHASA INDONESIA UNTUK PERTANYAAN FACTOID DARI KNOWLEDGE GRAPH PRODUK KECANTIKAN WAJAH

Artikel Terkait