digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Analisis Sentimen merupakan salah satu bidang pemrosesan bahasa alami (Natural Language Processing/NLP) yang bertujuan untuk mengklasifikasikan emosi atau opini yang terdapat pada suatu teks. Dalam melakukan pelatihan machine learning untuk sentimen analisis, permasalahan yang umum ditemukan adalah imbalanced dataset atau dataset dengan distribusi kelas tidak seimbang. Penelitian ini bertujuan untuk mengetahui dampak dari metode Back Translation (Terjemahan Bolak-Balik) terhadap kinerja machine learning dalam menyelesaikan permasalahan imbalanced dataset. Dataset yang digunakan berasal dari NusaX Analisis Sentimen yang terdiri atas 500 data pelatihan.Dataset ini berisi ulasan dari berbagai sumber yang telah diberikan label sentimen negatif, netral, dan positif. Dataset ini merupakan imbalanced dataset dengan distribusi kelas negatif dan positif merupakan kelas mayoritas, sedangkan kelas netral merupakan kelas minoritas. Model yang digunakan untuk mengevaluasi dampak Back Translation adalah Support Vector Machine (SVM) dan Naive Bayes. Hasil evaluasi menunjukkan bahwa model SVM dengan Back Translation bahasa Jawa memberikan peningkatan skor F1 macro terbaik yaitu 1.89% dan F1 weighted terbaik yaitu 1.52%. Hasil evaluasi juga menunjukkan bahwa tidak terdapat peningkatan skor secara signifikan pada model Naive Bayes yang menggunakan metode Back Translation. Hasil evaluasi ini menunjukkan bahwa metode Back Translation dapat mengatasi permasalahan imbalanced dataset dengan meningkatkan jumlah kelas minoritas. Hasil evaluasi ini juga menunjukkan bahwa metode Back Translation dapat meningkatkan kinerja machine learning pada model tertentu dalam melakukan analisis sentimen.