digilib@itb.ac.id +62 812 2508 8800

SARAH FADHILA ABSTRAK
PUBLIC Dwi Ary Fuziastuti

Peran media sosial di era digital yang semakin berkembang membuat penyebaran informasi di Indonesia semakin meningkat. Salah satu media sosial paling populer, Twitter atau yang sekarang dikenal dengan X, adalah wadah yang kerap digunakan oleh masyarakat Indonesia untuk menyuarakan opini mereka mengenai berbagai topik, temasuk politik, ekonomi, sosial, dan budaya. Selain itu, masalah penyebaran berita palsu juga merupakan salah satu masalah penting yang masih dihadapi oleh bangsa ini. Tujuan dari penelitian ini adalah untuk membuat model Jaringan Syaraf Tiruan untuk klasifikasi teks bahasa Indonesia biner dan multikelas. Tiga arsitektur jaringan saraf yang akan dibentuk dalam penelitian ini adalah Convolutional Neural Networks (CNN), Long Short-Term Memory (LSTM), dan CNN-LSTM. Klasifikasi teks biner akan menggunakan dataset yang berisi 5000 berita dari sumber terpercaya yang sudah diberi label “Hoax” dan “Valid”. Sedangkan, klasifikasi teks multikelas akan menggunakan dataset yang berisi 5000 tweets yang sudah dikategorikan ke dalam delapan kelompok. Langkah-langkah pra-pemrosesan data dalam penelitian ini meliputi pembersihan teks, tokenisasi, dan penyematan kata. Model yang dihasilkan akan dilatih menggunakan teknik optimasi Adam dengan validasi silang k-fold. Hasil penelitian ini menunjukkan bahwa metode CNN-LSTM merupakan metode paling optimal dengan nilai akurasi sebesar 96.10% untuk klasifikasi teks biner dan 94.44% untuk klasifikasi teks multikelas.