Transportasi adalah salah satu masalah utama bagi penduduk yang tinggal di
perkotaan, khususnya di kota-kota besar. Penanganan masalah transportasi secara
tradisional tidak lagi dianggap cocok karena volume data yang semakin besar dan
beragam, sehingga diperlukan sistem transportasi cerdas. Salah satu sumber data
yang dapat digunakan untuk membangunnya adalah media sosial (Twitter), di mana
pengembangan konten yang dihasilkan pengguna dapat meningkatkan pengelolaan
sistem transportasi yang ada. Dalam penelitian ini, IndoBERT, sebagai model
bahasa state-of-the-art dalam tugas pemrosesan bahasa alami, digunakan untuk
melakukan analisis sentimen pada tweet berbahasa Indonesia tentang transportasi
umum untuk memahami konteks tweet dengan lebih baik. Terdapat tiga kelas
sentimen yang digunakan: positif, negatif, dan netral. Hasil eksperimen
menunjukkan bahwa IndoBERT memiliki kinerja yang lebih baik dibandingkan
dengan algoritma traditional machine learning, dengan kombinasi hyperparameter
tuning terbaik menghasilkan akurasi sebesar 90.9% dan memiliki generalisasi baik
pada dataset. Untuk meningkatkan kualitas hasil analisis sentimen, dilakukan pula
mekanisme analisis teks, yang terdiri dari pemodelan topik dengan klasterisasi topik,
pemetaan topik-sentimen, dan pencarian kata-kata terkait dengan kata kunci untuk
memperluas insight dari dataset yang digunakan. Data tweet disediakan oleh
Continuum Data Indonesia dan NoLimit Indonesia dengan jumlah 23.200 tweet.