digilib@itb.ac.id +62 812 2508 8800

Malware atau Malicious Software merupakan perangkat lunak berbahaya yang dirancang dengan tujuan untuk merusak, mencuri informasi atau data penting, mengganggu kinerja komputer, dan tindakan kejahatan lainnya pada komputer atau devices yang dapat merugikan pemilik komputer hingga perusahaan besar. Malware dapat menginfeksi komputer melalui flashdisk, link yang disebar melalui email, aplikasi bajakan, Operating System bajakan, iklan, tombol download palsu, dan sebagainya. Beberapa contoh spesifikasi malware berdasarkan tipe atau cara penyebaran dan dampaknya yaitu: virus, trojan, spyware, worm, adware, scareware, ransomware, dan sebagainya. Jumlah malware setiap harinya terus bertambah banyak. Pusat Operasi Keamanan Siber Nasional Badan Siber dan Sandi Negara (BSSN) mencatat 88.414.296 serangan siber telah terjadi sejak 1 Januari 2020 hingga 12 April 2020. Hal ini tentunya sangat menyulitkan proses analisis dan klasifikasi malware. Dengan adanya permasalahan tersebut, maka diperlukan suatu sistem yang dapat mengklasifikasi malware secara otomatis. Salah satu teknik yang dapat digunakan yaitu dengan machine learning (ML). Tujuan dari tesis ini adalah membuat suatu sistem yang dapat mengklasifikasi malware secara otomatis menggunakan machine learning. Sistem klasifikasi menggunakan algoritma Support Vector Machine (SVM) dengan pendekatan LinearSVC dan diuji dengan dataset EMBER. Pada skenario pengujian pertama yaitu membandingkan hasil akurasi dari tiga pendekatan pada SVM yaitu SVC, NuSVC, dan LinearSVC. Akurasi tertinggi didapatkan dari pendekatan LinearSVC, yaitu 84.91% yang menggunakan 14710 sample data train dan 10000 sample data test. Pada skenario kedua dan ketiga, dapat disimpukan bahwa jumlah data yang digunakan serta parameter-parameter dari LinearSVC yang diubah dapat berpengaruh terhadap hasil accuracy, precision, recall, dan f1score. Semakin banyaknya data, maka performansinya akan semakin meningkat.