digilib@itb.ac.id +62 812 2508 8800

ABSTRAK - RAMADIDA RAI PAHLEVI
PUBLIC Didin Syafruddin Asa, S.Sos

ABSTRAK Indonesia adalah salah satu negara dengan penggunaan sosial media yang sangat kuat. Penelitian oleh Carley pada 2018 menyatakan setiap tahunnya, Indonesia selalu menduduki 10 besar negara pengguna sosial media terbanyak, khususnya Twitter. Fakta ini menunjukkan bahwa Twitter sebagai platform sosial media berperan besar dalam arus informasi secara real-time. Dewasa ini, instansi pemerintah sudah memanfaatkan Twitter sebagai media penyampaian informasi. Berdasarkan jurnal Kominfo tahun 2018, pemanfaatan sosial media sebagai media informasi untuk instansi pemerintah akan meningkatkan kepercayaan publik. Pada masa pandemi ini, sosial media mulai menjadi salah satu sumber informasi primer dengan keterbatasan jalur komunikasi pada praktik social distancing. Sebagai pembuat keputusan, pemerintah sangat memperhatikan reaksi publik terhadap kebijakan-kebijakan yang dibuat pada masa genting. Twitter merupakan salah satu cara paling efektif untuk menggali opini terhadap kebijakan pandemi. Melalui teknologi natural language processing, penggalian opini dan analisis lebih lanjut dapat dilakukan untuk memenuhi kebutuhan siklus informasi yang baik, khususnya saat masa pandemi. Melalui penelitian tugas akhir ini, akan dilakukan pemodelan analisis sentimen pada twitter dengan studi kasus kebijakan Pembatasan Sosial Berskala Besar Jakarta tahap pertama. Penelitian dilakukan dengan ekstraksi data twitter menggunakan Twitter API, melakukan praproses data, analisis sentimen menggunakan metode Na¨?ve Bayes dan Support Vector Machine, dan melakukan komparasi kedua metode klasifikasi tersebut. Penelitian membuat kombinasi beberapa model dengan algoritma na¨?ve Bayes dan SVM. Model mengkombinasikan beberapa fitur yang terdapat pada parameter algoritma seperti fitur k-fold, tf-idf, dan fitur tambahan khusus untuk model support vector machine yaitu kernel. Penelitian menilai performa model yang optimal dan menemukan faktor pengaruh performa model berdasarkan fitur model dan faktor dataset. Hasil analisis tugas akhir menunjukan algoritma support vector machine menghasilkan nilai akurasi lebih besar dibandingkan dengan na¨?e Bayes. Faktor lain yang mempengaruhi performa model adalah istilah yang saling beririsan pada setiap label pada dataset. Evaluasi model dengan mengurangi istilah yang beririsan dengan menghilangkan label netral berhasil meningkatkan akurasi model secara signifikan. iii Kata kunci: E-government, NLP, PSBB, analisis sentimen, klasifikasi teks, twitter