digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Ferdiant Joshua Muis
Terbatas Irwan Sofiyan
» ITB

Pembangkitan pertanyaan otomatis didefinisikan sebagai pekerjaan pengotomasian pembuatan pertanyaan dari berbagai masukan data tekstual. Dalam kurun waktu 10 tahun, penelitian untuk AQG (automatic question generator) sudah berkembang, dan terutama berofokus kepada pertanyaan faktoid. Dalam seluruh penelitian ini, state-of-the-art dari AQG diperoleh dengan menggunakan pendekatan sequence to sequence. Namun, belum pernah ada penelitian AQG untuk bahasa Indonesia yang dilakukan dan dipublikasikan. Pada penelitian ini, dibangun sebuah AQG berbahasa Indonesia, dengan mengadaptasi arsitektur dari penelitian sebelumnya. Secara garis besar, AQG dalam penelitian ini menggunakan pendekatan sequence to sequence dengan arsitektur bidirectional GRU, LSTM, Transformer, dengan tambahan fitur linguistik, mekanisme copy, serta mekanisme coverage. Sistem AQG dibangun dengan menggunakan dataset tanya-jawab SQuAD v2.0 yang diterjemahkan ke bahasa Indonesia menggunakan mesin, dengan tambahan data uji kedua dari dataset TyDiQA bagian bahasa Indonesia. Sistem AQG ini mampu memperoleh nilai BLEU-1,2,3,4 dan ROUGE-L hingga 39,2, 21,48, 10,88, 5,86, 43,32 untuk dataset SQuAD, dan 40,01, 20,68, 10,28, 6,44, 44,17 untuk dataset TyDiQA, secara berturutturut. Sistem ini dapat membangkitkan pertanyaan dengan baik jawaban dari pertanyaan adalah nama entitas dan ketika lokasi jawaban berdekatan dengan konteks yang terkait dengan jawaban tersebut. Kata kunci: deep learning, sequence to sequence, pembangkit pertanyaan otomatis, bidirectional, LSTM, GRU, Transformer, mekanisme copy, mekanisme coverage.