digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Aulia Mey Diva Annandya
Terbatas  Esha Mustika Dewi
» Gedung UPT Perpustakaan

Tugas akhir ini membahas pengembangan dan evaluasi pertahanan terhadap serangan Conditional Backdoor Generating Network (c-BaN) pada model Convolutional Neural Network (CNN). Serangan backdoor c-BaN menyisipkan trigger pada data pelatihan yang menyebabkan model memetakan input ber-trigger ke kelas target saat inferensi. Tujuan penelitian ini adalah untuk mengeksplorasi kombinasi teknik Convolutional Denoising Autoencoder (CNN-DAE), Defensive Distillation (DD), dan Test-Time Augmentation (TTA) untuk meningkatkan ketahanan model terhadap serangan backdoor c-BaN, dengan menjaga akurasi pada data bersih. CNN-DAE bertugas menyaring trigger pada input, DD mengurangi sensitivitas model terhadap gangguan dengan soft-label, dan TTA memberikan variasi input untuk membingungkan trigger. Eksperimen dilakukan pada tiga dataset: MNIST, Fashion MNIST, dan CIFAR-10, dengan mengevaluasi pengaruh teknik pertahanan terhadap utility dan Attack Success Rate (ASR). Ablation study dilakukan untuk mengevaluasi kontribusi setiap teknik secara terpisah dan dalam kombinasi, mengidentifikasi teknik yang efektif menurunkan ASR tanpa mengorbankan utility secara signifikan. Hasilnya menunjukkan bahwa kombinasi CNN-DAE dan DD memberikan hasil terbaik dengan penurunan ASR signifikan pada semua dataset, sementara TTA memberikan manfaat terbatas dan menurunkan utility secara signifikan. Penelitian ini juga membahas trade-off antara robustness dan utility, serta memberikan rekomendasi penggunaan teknik pertahanan yang optimal dalam menghadapi serangan backdoor c-BaN.