digilib@itb.ac.id +62 812 2508 8800

23521021 Miftahul Mahfuzh.pdf
PUBLIC Dessy Rondang Monaomi

Klasifikasi multi-label adalah salah satu jenis task dalam pemrosesan teks, yang mengklasifikasikan data ke dalam lebih dari satu kategori / label. Terdapat dua pendekatan umum dalam penyelesaian masalah multi-label, yaitu adaptasi algoritma yang melakukan perubahan pada algoritma pembelajaran untuk bisa menangani permasalahan multi-label, dan transformasi data, yang melakukan perubahan pada data agar bisa diselesaikan dengan algoritma multi-class. Penelitian ini mengajukan metode multi-task learning yang bertujuan untuk menutupi kelemahan-kelemahan pada transformasi data dan adaptasi algoritma. Penggunaan teknik binary relevance pada saat pembelajaran menutupi kelemahan pada adaptasi algoritma, yaitu meningkatnya kesulitan dalam pembelajaran seiring dengan bertambahnya jumlah label. Selain itu, adanya sharing parameter yang diterapkan selama pembelajaran menutupi kelemahan pada transformasi data, yaitu hilangnya informasi yang berkaitan dengan korelasi antar label, yang bisa membantu meningkatkan kinerja untuk tipe data yang banyak mengandung informasi korelasi ini. Pada penelitian ini, eksperimen dilakukan menggunakan 6 arsitektur varian Transformer pada dua dataset, yaitu dataset perbankan yang terdiri dari 1599 data latih dan 400 data uji dengan 16 label, dan dataset sintaksis, yang terdiri dari 8000 data latih dan 2000 data uji dengan 19 label. Eksperimen dilakukan dengan membandingkan kinerja F1 antara pendekatan adaptasi algoritma, transformasi data, dan multi-task learning. Pada dataset perbankan didapatkan kinerja F1 terbaik sebesar .8843 oleh pendekatan transformasi data, dan pada dataset sintaksis didapatkan kinerja F1 terbaik sebesar .8822 oleh pendekatan adaptasi algoritma.