digilib@itb.ac.id +62 812 2508 8800

Malware atau Malicious Software merupakan perangkat lunak berbahaya yang dirancang untuk merusak, mencuri informasi atau data penting, mengganggu kinerja komputer, dan tindakan kejahatan lainnya pada komputer atau devices yang dapat merugikan penggunanya. Badan Siber dan Sandi Negara (BSSN) menyebut serangan siber yang bersifat teknis pada 2020 mencapai 495.337.202 di Indonesia. Jumlah ini meningkat dua kali lipat dibandingkan 2019 yang hanya mencapai 228.277.875. Untuk mencegah penyebaran dan kerugian yang disebabkan oleh malware, terdapat berbagai metode seperti penggunaan machine learning untuk mendeteksi dan mengelompokkan perangkat lunak yang dicurigai sebagai malware. Metode analisa malware terdiri dari metode statik, dimana perangkat lunak yang dicurigai malware tidak dijalankan dan metode dinamik, ketika perangkat lunak dijalankan untuk dilihat dan dianalisis perilakunya. Namun, pendekatan seperti itu masih memakan waktu yang cukup lama karena membutuhkan berbagai macam analisa fitur yang diperoleh dari berbagai macam malware (feature extraction). Pada tesis ini, akan diajukan metode analisa malware dengan cara yang berbeda, yaitu menggunakan visualisasi program dan image processing. Cara ini dinilai mampu menghasilkan proses analisa yang lebih cepat dikarenakan proses analisa yang bersifat uniform dan keseluruhan berdasarkan visual. Tesis ini bertujuan untuk menjelaskan proses klasifikasi malware menggunakan metode machine learning berbasis image processing. Langkah yang dilakukan adalah melakukan konversi program perangkat lunak yang diduga malware menjadi bit binary, lalu diubah menjadi bentuk string, 8-bit vector, lalu menjadi grayscale image. Convolutional Neural Network (CNN) digunakan untuk memproses dataset visualisasi malware sehingga dapat ditemukan pola visual satu sama lainnya. Model akhir diharapkan dapat mengidentifikasi malware kedalam salah satu dari kategori/famili suatu sistem operasi. Pengujian parameter yang dilakukan berupa pengukuran akurasi, kesalahan, presisi, dan sensitivitas model menggunakan confusion matrix. Pada akhirnya, percobaan mampu menghasilkan model machine learning dengan tingkat keakurasian sebesar 94%.