digilib@itb.ac.id +62 812 2508 8800

ABSTRAK - AZHAR ABDURRASYID
PUBLIC Didin Syafruddin Asa, S.Sos

ABSTRAK ADVERSARIAL TRAINING UNTUK KATEGORISASI ASPEK PADA TEKS ULASAN MULTILABEL Oleh Azhar Abdurasyid NIM : 13517097 Adversarial Training (AT) adalah teknik pembelajaran yang menggunakan adversarial example pada tahap training sehingga model akan dapat menangani data masukan tersebut dengan baik. Adversarial example adalah sebuah masukan yang telah ditambahkan dengan gangguan kecil sehingga ketika model menerima masukan tersebut, model akan gagal menghasilkan prediksi yang benar. Selain tahan terhadap adversarial example, AT dipercaya dapat mengeneralisir model dan mencegah overfit karena AT dapat dipandang sebagai salah satu teknik regularisasi yang memperkenalkan data baru yang berbeda. Salah satu tantangan yang dihadapi ketika ingin mengadaptasi teknik AT untuk task pemrosesan bahasa alami adalah dibutuhkannya data masukan yang bersifat continuous. Tugas Akhir ini berfokus untuk mengadaptasi teknik AT pada task kategorisasi aspek multilabel berbahasa Indonesia. Untuk mendapatkan data masukan yang continuous pada data teks, Tugas Akhir ini melakukan pendekatan dengan menggunakan data masukan berupa word embedding. Selain itu, Tugas Akhir ini juga mengadopsi topologi CNN ekstraksi fitur pada penelitian kategoriasi aspek sebelumnya untuk mendapatkan vektor fitur bersifat continuous yang dapat digunakan sebagai data masukan model AT. Dengan begitu akan dibangun dua model AT, yaitu model AT word embedding dan model AT feature-map. Kemudian untuk menyelesaikan masalah klasifikasi multilabel, Tugas Akhir ini akan membandingkan penggunaan strategi binary relevance dan classifier chain. Hasil pengujian menunjukkan model AT word embedding dan AT feature-map memiliki kinerja F1-macro yang lebih baik dibanding baseline dengan skor secara urut yaitu 0.9253 dan 0.9234 pada data uji I serta 0.8531 dan 0.8505 pada data uji II. Model AT feature-map berhasil meningkatkan kinerja F1-score rata-rata baseline pada data uji adversarial dengan kenaikan sebesar 0.3291. Sedangkan model AT word embedding tidak berhasil meningkatkan kinerja F1-score rata-rata baseline pada data uji adversarial. Kata kunci: adversarial training, adversarial example, kategorisasi aspek, klasifikasi multilabel, binary relevance, classifier chain