digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Klasifikasi jenis kejahatan di Indonesia berdasarkan data dari media sosial, khususnya X (Twitter), merupakan tantangan yang signifikan dalam mendeteksi dan mencegah tindakan kriminal di era digital ini. Dengan meningkatnya penggunaan platform media sosial sebagai sarana komunikasi, penting untuk mengembangkan sistem yang efektif dalam menganalisis dan mengklasifikasikan informasi terkait kejahatan untuk membantu penegakan hukum dan masyarakat. Penelitian ini menawarkan solusi dengan memanfaatkan pretrained model IndoBERT untuk klasifikasi kejahatan. Data dikumpulkan dari X (Twitter) yang terdiri dari tweet-tweet terkait jenis tindak kejahatan, yaitu pembunuhan, kekerasan, pemerkosaan, penculikan, pencurian, narkotika, dan penipuan. IndoBERT, yang telah dilatih pada sejumlah besar teks bahasa Indonesia, diadaptasi untuk tugas klasifikasi ini, sedangkan kombinasi Word2Vec-LSTM sebagai baseline model. Hasil evaluasi menunjukkan bahwa model IndoBERT berhasil mendapatkan akurasi sebesar 99,20% dan F1-Score sebesar 98,90%. Model IndoBERT memberikan performa yang lebih baik dalam hal akurasi dibandingkan dengan model Word2Vec-LSTM dengan peningkatan sebesar 0,70%. Penelitian ini diharapkan dapat memberikan kontribusi pada pengembangan sistem deteksi kejahatan yang lebih responsif dan akurat, serta menggambarkan potensi besar model berbasis transformer dalam analisis teks di konteks lokal.