Perpustakaan Digital - Digilib ITB

PREDIKSI KOMPLEKSITAS KATA DENGAN METODE DEEP LEARNING DAN PENAMBAHAN FITUR KATA DAN KALIMAT

119 views

Penulis	:	Stefanus Stanley Yoga Setiawan [13518122]
Kontributor / Dosen Pembimbing	:	Dr. Ir. Rinaldi, M.T. Dr. Masayu Leylia Khodra, S.T., M.T. Fariska Zakhralativa Ruskanda, S.T., M.T.
Jenis Koleksi	:	Tugas Akhir
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	kompleksitas kata, fitur kata, fitur kalimat, BERT, RoBERTa, XLNet, stacking.
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi
File	:	0 file
Tanggal Input	:	29 Jun 2022

Tingkat kompleksitas dari kata atau frasa pada suatu kalimat merupakan salah satu cara mengetahui tingkat literasi dari teks bacaan. Informasi mengenai tingkat literasi dari suatu teks dapat digunakan untuk mengetahui kompleksitas dari suatu korpus. Kompleksitas suatu korpus tentu dapat mempengaruhi performa dari kecerdasan buatan untuk memahami konteks dari suatu teks. Tugas akhir ini bertujuan untuk membuat model yang dapat memprediksi nilai kompleksitas dari suatu kata (subtask 1) atau frasa (subtask 2) yang muncul pada suatu kalimat. Pada penelitian yang dilakukan sebelumnya pada kompetisi SemEval 2021 task 1, BERT dan RoBERTa merupakan dua contextual pretrained embedding yang berhasil mendapatkan performa paling bagus pada kedua subtask. Penelitian pada tugas akhir ini berfokus pada penambahan fitur kata dan kalimat pada model berbasis contextual pretrained embedding dan model yang berbasis static embedding untuk meningkatkan performa dari kompetisi sebelumnya. Berdasarkan eksperimen yang dilakukan, penggunaan fitur kata dan kalimat terbukti dapat meningkatkan performa dari model dan hasil dari stacking. Hasil model stacking terbaik berhasil menempati peringkat pertama pada subtask 1 dengan nilai pearson 0.7887. Pada subtask 2, berhasil menempati peringkat kedua dengan nilai pearson 0.8590. Berdasarkan analisa lebih lanjut, karakteristik dari model yang dibangun cenderung memprediksi kompleksitas kata atau frasa yang jarang digunakan lebih tinggi dibandingkan kata atau frasa yang sering digunakan.

Perpustakaan Digital ITB

PREDIKSI KOMPLEKSITAS KATA DENGAN METODE DEEP LEARNING DAN PENAMBAHAN FITUR KATA DAN KALIMAT

Artikel Terkait