Klasifikasi network traffic adalah sebuah proses identifikasi aplikasi jaringan
seperti Yahoo, YouTube, Facebook, dan Skype. Hal ini dibutuhkan oleh
manajemen jaringan untuk mengatur sumber daya dan untuk mengetahui berbagai
aplikasi yang sedang digunakan konsumen sehingga dapat membantu operator
jaringan memberikan kualitas layanan yang baik, jaringan yang aman, dan
memonitor jaringan yang sedang diakses konsumen. Pada tesis ini, kita fokus
melakukan klasifikasi pada layer 7 OSI, aplikasi dan hanya menggunakan data dari
protokol TCP. Beberapa tahun sebelumnya, telah banyak penelitian mengenai hal
ini menggunakan supervised, unsupervised, atau deep learning tetapi masih jarang
yang mengklasifikasikan langsung aplikasi yang digunakan. Berbagai kumpulan
fitur digunakan untuk menemukan mana yang menghasilkan performa terbaik
untuk klasifikasi network traffic menggunakan seleksi fitur recursive feature
elimination dan algoritma One-Vs-Rest Random Forest. Enam kumpulan fitur yang
digunakan: flow-based, session-based, time-based, packet-based, flow+ sessionbased, and packet+time-based. Selain itu, pada kasus ini terdapat imbalance pada
pengklasifikasi multi kelas yang membuat susah karena terdapat distribusi fitur
yang tidak seimbang, adanya outlier, dan adanya fitur yang tidak relevan.
Menggunakan metode ini, kita dapat menyelesaikan masalahnya. Dari hasil
percobaan, diperoleh flow-based yang memiliki performa terbaik dengan f1-score
sebesar 0,81, GM sebesar 0,85 dan waktu build selama 2634,987 detik. Sebenarnya,
kita juga dapat menggunakan packet-based, flow+session-based, packet+timebased tetapi memerlukan waktu build yang lebih lama.