digilib@itb.ac.id +62 812 2508 8800

Danendra Athallariq Harya P [23522020].pdf
PUBLIC Dessy Rondang Monaomi

Maraknya penggunaan media sosial sebagai sarana penyampaian opini publik menjadikan analisis sentimen sebagai bidang studi yang makin menjanjikan kedepannya. Analisis sentiment berbasis aspek (ASBA) dapat digunakan oleh industri untuk melihat kritik maupun saran dari publik terkait aspek dari jasa maupun produk industri yang mereka tawarkan. ASBA dapat dibagi lagi menjadi sub-task yang lebih kecil berdasarkan identifikasi yang dilakukannya. Banyaknya sub-task ASBA membuat perbandingan antara penelitian sebelumnya sulit dan juga dibutuhkan penyesuaian model akibat desain spesifik untuk menyelesaikan sub- task tertentu saja. Pada penelitian ini dirancang sebuah sub-task bernama ekstraksi tuple opini yang merupakan gabungan dari sub-task ASBA sebelumnya. Dari sebuah teks masukan model akan memprediksi pasangan tuple opini yang terdiri dari (entitas, aspek, opini, sentimen, kategori aspek) untuk setiap aspek di dalamnya. Ekstraksi tuple opini dapat diselesaikan dengan pendekatan generatif berbasis model bahasa pra- latih dan sub-task ASBA lainnya dapat diselesaikan dengan proses decoding sederhana dari label ekstraksi tuple opini. Ekstraksi tuple opini memiliki kelebihan fleksibilitas dalam penyelesaian berbagai sub-task ASBA karena hanya memerlukan proses decoding dari label saja dibanding dengan penelitian sebelumnya yang memerlukan penyesuaian arsitektur model. Penelitian tesis ini akan melakukan pengujian terhadap pengaruh pra-proses teks, model bahasa pra- latih yang digunakan, post-training, dan post-processing dengan jarak Levenshtein terhadap kinerja ekstraksi tuple opini. Model terbaik memiliki kinerja precision 0,836, recall 0.833, dan f1-score 0.834 yang didapatkan menggunakan pembersihan teks standar (penghilangan url, mention, emoji, dan hashtag) ditambah penggunaan stemming, menggunakan model bahasa pra-latih IndoT5 yang di post-training untuk meningkatkan domain knowledge dan task awareness dan dengan post-processing. Model tersebut mengungguli kinerja model baseline dari penelitian sebelumnya.