digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Analisis sentimen kalimat kutipan langsung bertujuan untuk mengekstraksi opini tokoh publik terhadap suatu hal dengan memanfaatkan kalimat kutipan langsung pada berita. Kalimat kutipan langsung merupakan ucapan langsung seseorang sehingga dapat digunakan sebagai opini langsung seseorang. Metode analisis sentimen pada umumnya tidak dapat diaplikasikan begitu saja pada kalimat kutipan langsung. Terdapat tiga tahapan dalam proses analisis sentimen pada kalimat kutipan langsung, yakni ekstraksi, atribusi, dan analisis polaritas. Ketiga tahap ini bertujuan untuk mengekstraksi kalimat kutipan, pembicara sumber kutipan, target pembicaraan kutipan, serta polaritas kutipan. Pada penelitian-penelitian sebelumnya, proses analisis sentimen kutipan langsung dilakukan dengan sebuah sistem regex dan NER. Akan tetapi, pendekatan ini tidak dapat berjalan dengan baik karena sistem tidak dapat memahami keseluruhan konteks berita. Untuk mengatasi hal ini, pendekatan generatif dapat digunakan untuk memproses keseluruhan konteks berita. Model yang digunakan akan menerima dokumen berita sebagai input dan menghasilkan kalimat-kalimat kutipan, pembicara sumber, target kutipan, dan polaritas kutipan sebagai output. Variasi pendekatan lain melibatkan penggunaan regex pada tahapan ekstraksi kalimat kutipan. Variasi ini dapat mengurangi resource yang digunakan model generatif. Proses konstruksi dataset melibatkan GPT-4 untuk meningkatkan kuantitas data sehingga didapatkan 1000 dokumen data latih. 50 Dokumen berita data uji akan dianotasi oleh seorang anotator. Model generatif akan dilatih pada data latih melalui proses finetuning lalu akan diuji data uji. Hasil eksperimen menunjukkan bahwa sistem dengan bantuan sistem regex memiliki kinerja terbaik. Sistem yang menggunakan model IndoT5-base-paraphrase dengan bantuan sistem regex berhasil mencapai skor F1 sebesar 0.99 untuk ekstraksi kutipan, 0.99 untuk ekstraksi pembicara sumber, 0.74 untuk target kutipan, dan 0.81 untuk analisis polaritas.