Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Analisis Sentimen merupakan salah satu bidang pemrosesan bahasa alami
(Natural Language Processing/NLP) yang bertujuan untuk mengklasifikasikan
emosi atau opini yang terdapat pada suatu teks. Dalam melakukan pelatihan
machine learning untuk sentimen analisis, permasalahan yang umum ditemukan
adalah imbalanced dataset atau dataset dengan distribusi kelas tidak seimbang.
Penelitian ini bertujuan untuk mengetahui dampak dari metode Back Translation
(Terjemahan Bolak-Balik) terhadap kinerja machine learning dalam
menyelesaikan permasalahan imbalanced dataset. Dataset yang digunakan
berasal dari NusaX Analisis Sentimen yang terdiri atas 500 data pelatihan.Dataset
ini berisi ulasan dari berbagai sumber yang telah diberikan label sentimen negatif,
netral, dan positif. Dataset ini merupakan imbalanced dataset dengan distribusi
kelas negatif dan positif merupakan kelas mayoritas, sedangkan kelas netral
merupakan kelas minoritas. Model yang digunakan untuk mengevaluasi dampak
Back Translation adalah Support Vector Machine (SVM) dan Naive Bayes. Hasil
evaluasi menunjukkan bahwa model SVM dengan Back Translation bahasa Jawa
memberikan peningkatan skor F1 macro terbaik yaitu 1.89% dan F1 weighted
terbaik yaitu 1.52%. Hasil evaluasi juga menunjukkan bahwa tidak terdapat
peningkatan skor secara signifikan pada model Naive Bayes yang menggunakan
metode Back Translation. Hasil evaluasi ini menunjukkan bahwa metode Back
Translation dapat mengatasi permasalahan imbalanced dataset dengan
meningkatkan jumlah kelas minoritas. Hasil evaluasi ini juga menunjukkan bahwa
metode Back Translation dapat meningkatkan kinerja machine learning pada
model tertentu dalam melakukan analisis sentimen.
Perpustakaan Digital ITB