Tahapan penelitian ini berfokus pada klasifikasi dokumen cyberbullying dengan
mengembangkan metode Ensemble Learning untuk mengatasi tantangan utama
seperti variasi bahasa, gaya komunikasi yang tidak terstruktur, serta
ketidakseimbangan dataset. Penelitian ini bertujuan menghasilkan klasifikasi yang
akurat dengan teknik Ensemble Learning dengan Incremental Threshold untuk
mengoptimalkan pemilihan classifier, serta mencapai akurasi yang optimal pada
dataset yang tidak seimbang. Pengembangan model merupakan inovasi dari metode
bagging dengan seleksi classifier berdasarkan ambang batas akurasi yang optimum.
Model ini diuji pada dataset cyberbullying dengan variasi dalam kata, struktur
kalimat, dan penggunaan bahasa, serta menggunakan teknik oversampling,
smoothing, dan ekstraksi fitur Large Scale n-Gram. Hasil penelitian menunjukkan
bahwa penggunaan Ensemble Learning dengan Incremental Threshold
meningkatkan akurasi klasifikasi dibandingkan model tunggal, dengan pemilihan
classifier yang tepat menghasilkan prediksi lebih akurat pada berbagai skenario
data. Metode ini terbukti efektif dalam menangani distribusi data yang tidak merata
dan meningkatkan performa klasifikasi pada kelas minoritas. Penelitian ini
memberikan kontribusi signifikan dalam pengembangan metode klasifikasi
cyberbullying yang lebih efektif dan responsif terhadap variasi teks dan data yang
tidak seimbang, terutama pada sintaksis Bahasa Indonesia