Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Analisis sentimen kalimat kutipan langsung bertujuan untuk mengekstraksi opini
tokoh publik terhadap suatu hal dengan memanfaatkan kalimat kutipan langsung
pada berita. Kalimat kutipan langsung merupakan ucapan langsung seseorang
sehingga dapat digunakan sebagai opini langsung seseorang. Metode analisis
sentimen pada umumnya tidak dapat diaplikasikan begitu saja pada kalimat
kutipan langsung. Terdapat tiga tahapan dalam proses analisis sentimen pada
kalimat kutipan langsung, yakni ekstraksi, atribusi, dan analisis polaritas. Ketiga
tahap ini bertujuan untuk mengekstraksi kalimat kutipan, pembicara sumber
kutipan, target pembicaraan kutipan, serta polaritas kutipan.
Pada penelitian-penelitian sebelumnya, proses analisis sentimen kutipan langsung
dilakukan dengan sebuah sistem regex dan NER. Akan tetapi, pendekatan ini tidak
dapat berjalan dengan baik karena sistem tidak dapat memahami keseluruhan
konteks berita. Untuk mengatasi hal ini, pendekatan generatif dapat digunakan
untuk memproses keseluruhan konteks berita. Model yang digunakan akan
menerima dokumen berita sebagai input dan menghasilkan kalimat-kalimat
kutipan, pembicara sumber, target kutipan, dan polaritas kutipan sebagai output.
Variasi pendekatan lain melibatkan penggunaan regex pada tahapan ekstraksi
kalimat kutipan. Variasi ini dapat mengurangi resource yang digunakan model
generatif.
Proses konstruksi dataset melibatkan GPT-4 untuk meningkatkan kuantitas data
sehingga didapatkan 1000 dokumen data latih. 50 Dokumen berita data uji akan
dianotasi oleh seorang anotator. Model generatif akan dilatih pada data latih
melalui proses finetuning lalu akan diuji data uji. Hasil eksperimen menunjukkan
bahwa sistem dengan bantuan sistem regex memiliki kinerja terbaik. Sistem yang
menggunakan model IndoT5-base-paraphrase dengan bantuan sistem regex
berhasil mencapai skor F1 sebesar 0.99 untuk ekstraksi kutipan, 0.99 untuk
ekstraksi pembicara sumber, 0.74 untuk target kutipan, dan 0.81 untuk analisis
polaritas.