digilib@itb.ac.id +62 812 2508 8800

Penelitian ini berfokus pada pengembangan model untuk deteksi dan klasifikasi cyberbullying, terutama yang berkaitan dengan ujaran kebencian berbasis SARA, dengan menggunakan Support Vector Machine (SVM) dan pembobotan TF-IDF. Data diambil dari komentar YouTube dan dikategorikan menjadi dua kelas: noncyberbully dan cyberbully dengan kategori SARA. Model ini dikembangkan untuk mengklasifikasikan komentar berbasis sentimen negatif yang mengandung cyberbullying. Penelitian ini menggunakan pengujian confusion matrix untuk mengevaluasi akurasi, presisi, dan recall model, dengan menerapkan metode validasi silang k-fold. Hasil uji menunjukkan variasi performa model pada setiap fold. Secara keseluruhan, model menunjukkan akurasi rata-rata sebesar 85%, F1- score 89%, dan recall 90%, dengan performa terbaik pada fold 3 dan fold 4. Model memiliki kelemahan dalam mendeteksi kelas cyberbullying pada fold 5, terutama dalam mengidentifikasi cyberbullying berbasis SARA, yang memengaruhi performa keseluruhan. Penelitian ini menunjukkan bahwa SVM cukup efektif dalam mendeteksi cyberbullying, namun masih memerlukan perbaikan dalam akurasi klasifikasi untuk memastikan bahwa berbagai bentuk dan kategori cyberbullying dapat terdeteksi dengan baik.