13518096 Naufal Arfananda Ghifari.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Analisis sentimen berbasis aspek (ASBA) banyak digunakan dalam perusahaan yang bergerak dalam aspek pelayanan. Salah satu task dalam pemodelan ASBA adalah klasifikasi sentimen terhadap aspek yang diberikan. Pembuatan model automasi tidak terlepas dari kebutuhan data -resources yang banyak, kurangnya data berlabel yang tersedia serta banyaknya waktu dan besarnya biaya yang dikonsumsi. Setelah diusulkannya model berbasis transformer, mendorong banyaknya penelitian menggunakan model pembelajaran transfer berbasis transformer untuk menyelesaikan task pada pemrosesan bahasa alami
Penelitian pada tugas akhir ini melakukan pembuatan model untuk klasifikasi sentimen berbasis aspek menggunakan model XLNet Malay dengan pendekatan metode finetuning dan post-training yang menerima input dalam bentuk sentence-pair. XLNet merupakan model yang dikenalkan untuk mengatasi kelemahan model BERT yang merupakan model autoencoding. Post-training dilakukan untuk meningkatkan task dan/atau domain awareness untuk menghasilkan model finetuned yang lebih baik dengan data korpus tanpa label. Penelitian klasifikasi sentimen berbasis aspek bahasa Indonesia ini dilakukan untuk tiga domain berbeda, yakni hotel, mobil, dan restoran.
Hasil eksperimen menunjukkan terjadi peningkatan kinerja model ketika post-training dilakukan pada model pra-latih untuk pengerjaan task klasifikasi sentimen berbasis aspek berbahasa Indonesia. Model yang dibuat mampu mengungguli penelitian sebelumnya yang menggunakan model mBERT dengan skor f1 0.9778 dan 0.9411. Hasil penelitian menunjukkan bahwa melakukan post-training menggunakan data korpus ulasan dari domain yang berbeda mampu meningkatkan kinerja model dan akan lebih efektif apabila domain tersebut memiliki kedekatan dengan domain yang hendak dilatih. Kinerja model untuk domain restoran meningkat dari skor f1 0.8375 menjadi 0.9254 setelah melakukan post-training dengan gabungan data korpus hotel dan restoran.