Article Details

PERBANDINGAN PERFORMA BERBAGAI KUMPULAN FITUR UNTUK KLASIFIKASI NETWORK TRAFFIC MENGGUNAKAN SELEKSI FITUR RECURSIVE FEATURE ELIMINATION DAN ALGORITMA ONE-VS-REST RANDOM FOREST

Oleh   Arba Robbani [23220346]
Kontributor / Dosen Pembimbing : Dr.-Ing. Eueung Mulyana, S.T., M.Sc.;
Jenis Koleksi : S2 - Tesis
Penerbit : STEI - Teknik Elektro
Fakultas : Sekolah Teknik Elektro dan Informatika (STEI)
Subjek :
Kata Kunci : kumpulan fitur, one-vs-rest, random forest, multi kelas, imbalance, network traffic, klasifikasi, flow-based, session-based, time-based, packet-based
Sumber :
Staf Input/Edit : karya  
File : 0 file
Tanggal Input : 2021-09-21 12:13:08

Tidak ada file


Klasifikasi network traffic adalah sebuah proses identifikasi aplikasi jaringan seperti Yahoo, YouTube, Facebook, dan Skype. Hal ini dibutuhkan oleh manajemen jaringan untuk mengatur sumber daya dan untuk mengetahui berbagai aplikasi yang sedang digunakan konsumen sehingga dapat membantu operator jaringan memberikan kualitas layanan yang baik, jaringan yang aman, dan memonitor jaringan yang sedang diakses konsumen. Pada tesis ini, kita fokus melakukan klasifikasi pada layer 7 OSI, aplikasi dan hanya menggunakan data dari protokol TCP. Beberapa tahun sebelumnya, telah banyak penelitian mengenai hal ini menggunakan supervised, unsupervised, atau deep learning tetapi masih jarang yang mengklasifikasikan langsung aplikasi yang digunakan. Berbagai kumpulan fitur digunakan untuk menemukan mana yang menghasilkan performa terbaik untuk klasifikasi network traffic menggunakan seleksi fitur recursive feature elimination dan algoritma One-Vs-Rest Random Forest. Enam kumpulan fitur yang digunakan: flow-based, session-based, time-based, packet-based, flow+ sessionbased, and packet+time-based. Selain itu, pada kasus ini terdapat imbalance pada pengklasifikasi multi kelas yang membuat susah karena terdapat distribusi fitur yang tidak seimbang, adanya outlier, dan adanya fitur yang tidak relevan. Menggunakan metode ini, kita dapat menyelesaikan masalahnya. Dari hasil percobaan, diperoleh flow-based yang memiliki performa terbaik dengan f1-score sebesar 0,81, GM sebesar 0,85 dan waktu build selama 2634,987 detik. Sebenarnya, kita juga dapat menggunakan packet-based, flow+session-based, packet+timebased tetapi memerlukan waktu build yang lebih lama.