Alvin Rizqi Alfisyahrin [13519126].pdf
EMBARGO  2024-12-31 
EMBARGO  2024-12-31 
Seiring meningkatnya kebutuhan untuk menghasilkan kinerja terbaik dalam
implementasi AI, telah dibuat beberapa model terbaru yang kompleks sehingga model
tersebut tidak memiliki kemampuan untuk menjelaskan atas hasil prediksi yang
dihasilkan. Dalam beberapa tahun terakhir, disarankan tiga metode gradient boosting
methods yang kompleks berdasarkan decision tree, yaitu: XGBoost, CatBoost, dan
LightGBM. Metode tersebut terbukti menghasilkan kinerja yang kompetitif dengan
waktu training yang cepat. Namun dalam konteks kritis seperti security, medical, dan
finance. kebutuhan akan peningkatan transparansi dari berbagai stakeholder di AI.
Salah satunya adalah kejahatan yang sedang marak terjadi pada bidang security adalah
phishing websites. Oleh karena itu, diperkenalkan sebuah konsep baru yang disebut
Explainable AI (XAI).
Eksperimen dilakukan dengan tiga dataset phishing website menggunakan tiga
algoritma gradient boosting dan dilakukan hyperparameter tuning. Eksperimen ini
menghasilkan penjelasan bahwa model yang memiliki tingkat akurasi terbaik untuk
setiap dataset adalah CatBoost dengan tuning menggunakan Randomized Search.
Setelah itu, dilakukan implementasi XAI untuk penjelasan secara global (SHAP dan
PDP) dan secara lokal (LIME dan Anchor) dari dataset yang sudah dipilih. Hasil
eksperimen menunjukkan bahwa terdapat beberapa fitur yang kerap kali dianggap
penting dalam prediksi yang dilakukan oleh model, yaitu, length_url,
time_domain_activation, dan directory_length. Bahkan dengan hanya menggunakan
tiga fitur ini dari total awal 90 fitur, tingkat akurasi yang tinggi dapat tetap tercapai.