Crowdstrike adalah perusahaan Amerika yang bergerak pada bidang keamanan
informasi menjelaskan fakta bahwa di tahun 2023 adanya peningkatan celah
keamanan yang menjadi penyebab e-crime (kejahatan siber). Laporan Global
Threat dari pimpinan keamanan siber edisi ke-sembilan membahas perkembangan
perilaku, tren siber, serta strategi dari negara-negara yang paling mengkhawatirkan
terkena kejahatan siber. Aktivitas berupa laporan 200+ ancaman e-crime
ditemukan 33 ancaman baru yang teridentifikasi. Pada tahun 2022, adanya lonjakan
ancaman berbasis identitas, eksploitasi sistem jaringan dari kelompok pengintai
tiongkok (china-nexus), serta serangan terhadap perangkat yang telah dilindungi.
Tahun 2021, serangan siber naik dari 62% menjadi 71 % dan aktivitas gangguan
konfidensialitas (dari keyboard langsung) yang meningkat 50% pada awal tahun
2022. Data ini menjelaskan semakin maraknya ancaman kejahatan siber yang
dilakukan oleh manusia untuk mengakali perlindungan kerentanan dan ketahanan
perangkat. Laporan terkini dibuat oleh tim intelijen CrowdStrike yang prominen
di dunia keamanan informasi. Tim intelijen CrowdStrike memanfaatkan jutaan
data dari peristiwa harian yang masuk ke platform CrowdStrike Falcon (the
CrowdStrike Falcon platform) dan pengetahuan yang dalam dari CrowdStrike
Falcon OverWatch.
Laporan serangan siber di Indonesia dari akhir tahun 2022 hingga Februari 2023
dengan total keseluruhan serangan mencakup 1.433 insiden siber yang ditangani
oleh BSSN (Badan Siber dan Sandi Negara). Laporan diantaranya berisi persentase
bahwa kejadian 26 % data breach, 26 % web defacement yaitu penggantian
tampilan website, 24% adalah serangan ransomware, sementara 24 % lainnya
adalah jenis serangan siber yang masuk dalam kategori lain. BSSN sendiri tidak
merinci berapa banyak total insiden siber maupun ancaman siber yang berhasil
merkea deteksi. Prediksi perkembangan aktivitas malware di Indonesia tahun 2023
adalah 26 % serangan siber yang terjadi bentuknya adalah malware dan ransomware
dan 74 % lainnya berupa data breach. Bagaimana mengatasi serangan siber yang
marak terjadi. Pengguna dapat menghindari celah keamanan yang mudah disisipi
malware dengan cara kebiasaan positifmisalnya antisipasi back up data, identifikasi
serangan, tidak klik link berbahaya saat berselancar di dunia maya maupun
mengenali modus-modus kejahatan siber yang memanfaatkan korban. Selanjutnya
tanggapan untuk 26 % serangan yang terjadi akibat malware. Menandakan malware
ii
sebagai induk perangkat lunak yang digunakan berbagai macam peretas.
Dibutuhkan analisa seberapa cepat malware dapat terdeteksi. Melalui analisis statis
menggunakan kumpulan data malware yang disatukan menjadi dataset. Analisis
statis ini dapat memberikan hasil berupa pola yang dapat dipelajari oleh algoritma.
Algoritma mesin pembelajaran terus belajar dari sebuah dataset yang dibangun.
Pola ini terbentuk dari kumpulan atribut yang mendeskripsikan sejauh mana
malware menyerang. Atribut seperti IP, port, source, flow duration, user maupun
lainnya dapat memberikan sebuah informasi nyata kapan terakhir malware
menyerang dengan menginfeksi perangkat. Tentu saja tiap algoritma memiliki
kelebihan dan kekurangan dalam deteksi.
Dalam penelitian ini penulis mengusulkan pendekatan baru untuk menggabungkan
dua algoritma mesin pembelajaran yang berbeda yaitu algoritma memiliki label
ataupun tidak berlabel. Berlandaskan dari dua pendekatan yang masing-masing
mempunyai kelebihan. Penelitian ini melakukan eksperimen sebanyak empat kali
penggabungan dengan lima dataset berbeda untuk menguji akurasi dan kecepatan
waktu. Algoritma yang diuji yaitu antara algoritma random forest dengan k-means
clustering, algoritma k-means clustering dengan random forest, algoritma naive
bayes dengan algoritma k-means clustering serta algoritma k-means clustering
dengan algoritma naive bayes. Hasil eksperimen tertinggi ada pada penggabungan
algoritma k-means clustering dan algoritma naive bayes dengan rata-rata 96,12 %
dan kecepatan waktu 5,36 milidetik.