Maraknya penggunaan media sosial sebagai sarana penyampaian opini publik
menjadikan analisis sentimen sebagai bidang studi yang makin menjanjikan
kedepannya. Analisis sentiment berbasis aspek (ASBA) dapat digunakan oleh
industri untuk melihat kritik maupun saran dari publik terkait aspek dari jasa
maupun produk industri yang mereka tawarkan. ASBA dapat dibagi lagi menjadi
sub-task yang lebih kecil berdasarkan identifikasi yang dilakukannya. Banyaknya
sub-task ASBA membuat perbandingan antara penelitian sebelumnya sulit dan juga
dibutuhkan penyesuaian model akibat desain spesifik untuk menyelesaikan sub-
task tertentu saja.
Pada penelitian ini dirancang sebuah sub-task bernama ekstraksi tuple opini yang
merupakan gabungan dari sub-task ASBA sebelumnya. Dari sebuah teks masukan
model akan memprediksi pasangan tuple opini yang terdiri dari (entitas, aspek,
opini, sentimen, kategori aspek) untuk setiap aspek di dalamnya. Ekstraksi tuple
opini dapat diselesaikan dengan pendekatan generatif berbasis model bahasa pra-
latih dan sub-task ASBA lainnya dapat diselesaikan dengan proses decoding
sederhana dari label ekstraksi tuple opini. Ekstraksi tuple opini memiliki kelebihan
fleksibilitas dalam penyelesaian berbagai sub-task ASBA karena hanya
memerlukan proses decoding dari label saja dibanding dengan penelitian
sebelumnya yang memerlukan penyesuaian arsitektur model. Penelitian tesis ini
akan melakukan pengujian terhadap pengaruh pra-proses teks, model bahasa pra-
latih yang digunakan, post-training, dan post-processing dengan jarak Levenshtein
terhadap kinerja ekstraksi tuple opini.
Model terbaik memiliki kinerja precision 0,836, recall 0.833, dan f1-score 0.834
yang didapatkan menggunakan pembersihan teks standar (penghilangan url,
mention, emoji, dan hashtag) ditambah penggunaan stemming, menggunakan
model bahasa pra-latih IndoT5 yang di post-training untuk meningkatkan domain
knowledge dan task awareness dan dengan post-processing. Model tersebut
mengungguli kinerja model baseline dari penelitian sebelumnya.