digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Dengan berlangsungnya konflik antara Rusia dan Ukraina, masyarakat memiliki beragam pendapat yang disampaikan dalam media sosial dengan jumlah yang banyak. Untuk mengetahui persebaran sentimen dari masyarakat terhadap konflik tersebut, maka dilakukan analisis sentimen. Namun, pelabelan dari setiap pendapat akan memakan waktu banyak, serta tidak diketahui model terbaik untuk melakukan analisis sentimen dalam konteks konflik ini. Oleh karena itu, akan digagas sebuah sistem analisis sentimen yang berisi 5 model yang akan dilatih sekaligus dibandingkan kinerjanya, yakni Random Forest, XGBoost, LSTM, GRU, dan RoBERTa. Data akan dilabel terlebih dahulu, lalu di-preprocess sebelum arsitektur dari setiap model akan dikonstruksi untuk proses latihan, yang meliputi hyperparameter tuning. Hasil evaluasi menunjukkan bahwa RoBERTa adalah model terbaik dengan pencapaian macro-average F1-score 0,726 di sentimen Rusia dan 0,730 di sentimen Ukraina, dengan selisih keunggulan 0,075 hingga 0,09 lebih tinggi jika dibandingkan dengan model terbaik kedua yakni XGBoost. Mengingat persebaran data yang imbalanced, RoBERTa adalah model yang bekerja dengan paling baik, sementara LSTM dan GRU kesulitan dalam menangkap pola sequence yang tepat.