digilib@itb.ac.id +62 812 2508 8800

Alvin Rizqi Alfisyahrin [13519126].pdf
EMBARGO  2024-12-31 

Seiring meningkatnya kebutuhan untuk menghasilkan kinerja terbaik dalam implementasi AI, telah dibuat beberapa model terbaru yang kompleks sehingga model tersebut tidak memiliki kemampuan untuk menjelaskan atas hasil prediksi yang dihasilkan. Dalam beberapa tahun terakhir, disarankan tiga metode gradient boosting methods yang kompleks berdasarkan decision tree, yaitu: XGBoost, CatBoost, dan LightGBM. Metode tersebut terbukti menghasilkan kinerja yang kompetitif dengan waktu training yang cepat. Namun dalam konteks kritis seperti security, medical, dan finance. kebutuhan akan peningkatan transparansi dari berbagai stakeholder di AI. Salah satunya adalah kejahatan yang sedang marak terjadi pada bidang security adalah phishing websites. Oleh karena itu, diperkenalkan sebuah konsep baru yang disebut Explainable AI (XAI). Eksperimen dilakukan dengan tiga dataset phishing website menggunakan tiga algoritma gradient boosting dan dilakukan hyperparameter tuning. Eksperimen ini menghasilkan penjelasan bahwa model yang memiliki tingkat akurasi terbaik untuk setiap dataset adalah CatBoost dengan tuning menggunakan Randomized Search. Setelah itu, dilakukan implementasi XAI untuk penjelasan secara global (SHAP dan PDP) dan secara lokal (LIME dan Anchor) dari dataset yang sudah dipilih. Hasil eksperimen menunjukkan bahwa terdapat beberapa fitur yang kerap kali dianggap penting dalam prediksi yang dilakukan oleh model, yaitu, length_url, time_domain_activation, dan directory_length. Bahkan dengan hanya menggunakan tiga fitur ini dari total awal 90 fitur, tingkat akurasi yang tinggi dapat tetap tercapai.