ABSTRAK
Indonesia adalah salah satu negara dengan penggunaan sosial media yang sangat
kuat. Penelitian oleh Carley pada 2018 menyatakan setiap tahunnya, Indonesia selalu
menduduki 10 besar negara pengguna sosial media terbanyak, khususnya Twitter. Fakta
ini menunjukkan bahwa Twitter sebagai platform sosial media berperan besar dalam
arus informasi secara real-time. Dewasa ini, instansi pemerintah sudah memanfaatkan
Twitter sebagai media penyampaian informasi. Berdasarkan jurnal Kominfo tahun 2018,
pemanfaatan sosial media sebagai media informasi untuk instansi pemerintah akan
meningkatkan kepercayaan publik. Pada masa pandemi ini, sosial media mulai menjadi
salah satu sumber informasi primer dengan keterbatasan jalur komunikasi pada praktik
social distancing. Sebagai pembuat keputusan, pemerintah sangat memperhatikan reaksi
publik terhadap kebijakan-kebijakan yang dibuat pada masa genting. Twitter merupakan
salah satu cara paling efektif untuk menggali opini terhadap kebijakan pandemi. Melalui
teknologi natural language processing, penggalian opini dan analisis lebih lanjut dapat
dilakukan untuk memenuhi kebutuhan siklus informasi yang baik, khususnya saat
masa pandemi. Melalui penelitian tugas akhir ini, akan dilakukan pemodelan analisis
sentimen pada twitter dengan studi kasus kebijakan Pembatasan Sosial Berskala Besar
Jakarta tahap pertama. Penelitian dilakukan dengan ekstraksi data twitter menggunakan
Twitter API, melakukan praproses data, analisis sentimen menggunakan metode Na¨?ve
Bayes dan Support Vector Machine, dan melakukan komparasi kedua metode klasifikasi
tersebut. Penelitian membuat kombinasi beberapa model dengan algoritma na¨?ve Bayes
dan SVM. Model mengkombinasikan beberapa fitur yang terdapat pada parameter
algoritma seperti fitur k-fold, tf-idf, dan fitur tambahan khusus untuk model support
vector machine yaitu kernel. Penelitian menilai performa model yang optimal dan
menemukan faktor pengaruh performa model berdasarkan fitur model dan faktor
dataset. Hasil analisis tugas akhir menunjukan algoritma support vector machine
menghasilkan nilai akurasi lebih besar dibandingkan dengan na¨?e Bayes. Faktor lain
yang mempengaruhi performa model adalah istilah yang saling beririsan pada setiap
label pada dataset. Evaluasi model dengan mengurangi istilah yang beririsan dengan
menghilangkan label netral berhasil meningkatkan akurasi model secara signifikan.
iii
Kata kunci: E-government, NLP, PSBB, analisis sentimen, klasifikasi teks, twitter