Abstrak:
Pendeteksian intrusi pada jaringan penting sebagai bagian dari pertahanan. Teknik yang biasa diterapkan yaitu teknik signature based (misuse detection) memiliki kelemahan karena signature-nya harus dibuat secara manual. Dengan teknik data mining, signature ini dapat
dibangun secara otomatis lewat pelatihan. Selain itu, dapat diimplementasikan dalam bentuk anomaly detection. Support Vector Machine (SVM) adalah salah satu teknik data mining yang dapat diterapkan dalam bentuk misuse detection dan anomaly detection. Untuk anomaly detection, SVM dapat diterapkan dengan menggunakan One Class SVM baik dengan pelatihan menggunakan data normal (supervised training) atau data pelatihan mengandung data intrusi (unsupervised training). Untuk misuse detection, SVM dapat diterapkan dengan menggunakan SVM biner, multi class SVM atau kombinasinya. Seluruh alternatif implementasi SVM ini dieksplorasi untuk mengetahui bagaimana model terbaik untuk mengimplementasikan SVM.
Untuk itu, eksperimen dilakukan dengan menggunakan dataset KDDCUP 99. Hasilnya menunjukkan bahwa SVM memiliki performansi dan tingkat generalisasi yang cukup baik pada berbagai variasi distribusi data pada dataset. Untuk model misuse detection terbaik dipilih kombinasi antara SVM biner dan Multi Class SVM One-Against-One, sedangkan untuk model anomaly detection terbaik dipilih One Class SVM dengan supervised training.
Implementasi misuse detection terbaik yang dipilih cukup scalable karena dapat menangani data pelatihan dalam jumlah yang besar sedangkan One Class SVM tidak scalable untuk pelatihan dalam jumlah data yang besar. Dari hasil eksperimen ditunjukkan juga bahwa penggunaan parameter dan teknik normalisasi data sangat berpengaruh pada efektifitas dan efisiensi SVM.
Upaya peningkatan kinerja model terbaik dilakukan dengan menggunakan feature selection menggunakan f-score, penggunaan nilai C berbeda untuk mengatasi permasalahan
imbalanced dataset dan incremental training. Penggunaan nilai C berbeda tidak berhasil mengatasi masalah imbalance dataset pada data KDDCUP 99. Akan tetapi, feature selection dan incremental training dapat meningkatkan efisiensi secara signifikan. Untuk misuse
detection, efektifitas cenderung tidak berubah akan tetapi pada anomaly detection efektifitas One Class SVM meningkat secara signifikan.