Perpustakaan Digital - Digilib ITB

EXPLAINABLE AI PADA GRADIENT BOOSTING ALGORITHM UNTUK PHISHING WEBSITE DETECTION

374 views

Penulis	:	Alvin Rizqi Alfisyahrin [13519126]
Kontributor / Dosen Pembimbing	:	Ir. Windy Gambetta, M.B.A. Rizal Dwi Prayogo, S.Si., M.Si., M.Sc.
Jenis Koleksi	:	Tugas Akhir
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	explainable ai, gradient boosting, hyperparameter tuning, phishing website.
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi Dessy Rondang Monaomi
File	:	1 file
Tanggal Input	:	18 Sep 2023

Alvin Rizqi Alfisyahrin [13519126].pdf
Terbatas Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Seiring meningkatnya kebutuhan untuk menghasilkan kinerja terbaik dalam implementasi AI, telah dibuat beberapa model terbaru yang kompleks sehingga model tersebut tidak memiliki kemampuan untuk menjelaskan atas hasil prediksi yang dihasilkan. Dalam beberapa tahun terakhir, disarankan tiga metode gradient boosting methods yang kompleks berdasarkan decision tree, yaitu: XGBoost, CatBoost, dan LightGBM. Metode tersebut terbukti menghasilkan kinerja yang kompetitif dengan waktu training yang cepat. Namun dalam konteks kritis seperti security, medical, dan finance. kebutuhan akan peningkatan transparansi dari berbagai stakeholder di AI. Salah satunya adalah kejahatan yang sedang marak terjadi pada bidang security adalah phishing websites. Oleh karena itu, diperkenalkan sebuah konsep baru yang disebut Explainable AI (XAI). Eksperimen dilakukan dengan tiga dataset phishing website menggunakan tiga algoritma gradient boosting dan dilakukan hyperparameter tuning. Eksperimen ini menghasilkan penjelasan bahwa model yang memiliki tingkat akurasi terbaik untuk setiap dataset adalah CatBoost dengan tuning menggunakan Randomized Search. Setelah itu, dilakukan implementasi XAI untuk penjelasan secara global (SHAP dan PDP) dan secara lokal (LIME dan Anchor) dari dataset yang sudah dipilih. Hasil eksperimen menunjukkan bahwa terdapat beberapa fitur yang kerap kali dianggap penting dalam prediksi yang dilakukan oleh model, yaitu, length_url, time_domain_activation, dan directory_length. Bahkan dengan hanya menggunakan tiga fitur ini dari total awal 90 fitur, tingkat akurasi yang tinggi dapat tetap tercapai.

Perpustakaan Digital ITB

EXPLAINABLE AI PADA GRADIENT BOOSTING ALGORITHM UNTUK PHISHING WEBSITE DETECTION

Artikel Terkait