Klasifikasi multi-label adalah salah satu jenis task dalam pemrosesan teks, yang
mengklasifikasikan data ke dalam lebih dari satu kategori / label. Terdapat dua
pendekatan umum dalam penyelesaian masalah multi-label, yaitu adaptasi
algoritma yang melakukan perubahan pada algoritma pembelajaran untuk bisa
menangani permasalahan multi-label, dan transformasi data, yang melakukan
perubahan pada data agar bisa diselesaikan dengan algoritma multi-class.
Penelitian ini mengajukan metode multi-task learning yang bertujuan untuk
menutupi kelemahan-kelemahan pada transformasi data dan adaptasi algoritma.
Penggunaan teknik binary relevance pada saat pembelajaran menutupi kelemahan
pada adaptasi algoritma, yaitu meningkatnya kesulitan dalam pembelajaran
seiring dengan bertambahnya jumlah label. Selain itu, adanya sharing parameter
yang diterapkan selama pembelajaran menutupi kelemahan pada transformasi
data, yaitu hilangnya informasi yang berkaitan dengan korelasi antar label, yang
bisa membantu meningkatkan kinerja untuk tipe data yang banyak mengandung
informasi korelasi ini.
Pada penelitian ini, eksperimen dilakukan menggunakan 6 arsitektur varian
Transformer pada dua dataset, yaitu dataset perbankan yang terdiri dari 1599 data
latih dan 400 data uji dengan 16 label, dan dataset sintaksis, yang terdiri dari 8000
data latih dan 2000 data uji dengan 19 label. Eksperimen dilakukan dengan
membandingkan kinerja F1 antara pendekatan adaptasi algoritma, transformasi
data, dan multi-task learning. Pada dataset perbankan didapatkan kinerja F1
terbaik sebesar .8843 oleh pendekatan transformasi data, dan pada dataset
sintaksis didapatkan kinerja F1 terbaik sebesar .8822 oleh pendekatan adaptasi
algoritma.