digilib@itb.ac.id +62 812 2508 8800

23521011 Dionisius Pratama.pdf
PUBLIC Dessy Rondang Monaomi

Transportasi adalah salah satu masalah utama bagi penduduk yang tinggal di perkotaan, khususnya di kota-kota besar. Penanganan masalah transportasi secara tradisional tidak lagi dianggap cocok karena volume data yang semakin besar dan beragam, sehingga diperlukan sistem transportasi cerdas. Salah satu sumber data yang dapat digunakan untuk membangunnya adalah media sosial (Twitter), di mana pengembangan konten yang dihasilkan pengguna dapat meningkatkan pengelolaan sistem transportasi yang ada. Dalam penelitian ini, IndoBERT, sebagai model bahasa state-of-the-art dalam tugas pemrosesan bahasa alami, digunakan untuk melakukan analisis sentimen pada tweet berbahasa Indonesia tentang transportasi umum untuk memahami konteks tweet dengan lebih baik. Terdapat tiga kelas sentimen yang digunakan: positif, negatif, dan netral. Hasil eksperimen menunjukkan bahwa IndoBERT memiliki kinerja yang lebih baik dibandingkan dengan algoritma traditional machine learning, dengan kombinasi hyperparameter tuning terbaik menghasilkan akurasi sebesar 90.9% dan memiliki generalisasi baik pada dataset. Untuk meningkatkan kualitas hasil analisis sentimen, dilakukan pula mekanisme analisis teks, yang terdiri dari pemodelan topik dengan klasterisasi topik, pemetaan topik-sentimen, dan pencarian kata-kata terkait dengan kata kunci untuk memperluas insight dari dataset yang digunakan. Data tweet disediakan oleh Continuum Data Indonesia dan NoLimit Indonesia dengan jumlah 23.200 tweet.