Perpustakaan Digital - Digilib ITB

KLASIFIKASI MULTI-LABEL PADA PEMROSESAN TEKS MENGGUNAKAN ARSITEKTUR TRANSFORMER DENGAN PENDEKATAN MULTI-TASK LEARNING

260 views

Save At List

Penulis	:	Miftahul Mahfuzh [23521021]
Kontributor / Dosen Pembimbing	:	Dr. Eng. Ayu Purwarianti, S.T, M.T.
Jenis Koleksi	:	Tesis
Tahun Terbit	:
Penerbit	:	Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	multi-label, multi-task learning, Transformer.
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi
File	:	1 file
Tanggal Input	:	24 Feb 2023

23521021 Miftahul Mahfuzh.pdf

PUBLIC Open In Flipbook Dessy Rondang Monaomi

Klasifikasi multi-label adalah salah satu jenis task dalam pemrosesan teks, yang mengklasifikasikan data ke dalam lebih dari satu kategori / label. Terdapat dua pendekatan umum dalam penyelesaian masalah multi-label, yaitu adaptasi algoritma yang melakukan perubahan pada algoritma pembelajaran untuk bisa menangani permasalahan multi-label, dan transformasi data, yang melakukan perubahan pada data agar bisa diselesaikan dengan algoritma multi-class. Penelitian ini mengajukan metode multi-task learning yang bertujuan untuk menutupi kelemahan-kelemahan pada transformasi data dan adaptasi algoritma. Penggunaan teknik binary relevance pada saat pembelajaran menutupi kelemahan pada adaptasi algoritma, yaitu meningkatnya kesulitan dalam pembelajaran seiring dengan bertambahnya jumlah label. Selain itu, adanya sharing parameter yang diterapkan selama pembelajaran menutupi kelemahan pada transformasi data, yaitu hilangnya informasi yang berkaitan dengan korelasi antar label, yang bisa membantu meningkatkan kinerja untuk tipe data yang banyak mengandung informasi korelasi ini. Pada penelitian ini, eksperimen dilakukan menggunakan 6 arsitektur varian Transformer pada dua dataset, yaitu dataset perbankan yang terdiri dari 1599 data latih dan 400 data uji dengan 16 label, dan dataset sintaksis, yang terdiri dari 8000 data latih dan 2000 data uji dengan 19 label. Eksperimen dilakukan dengan membandingkan kinerja F1 antara pendekatan adaptasi algoritma, transformasi data, dan multi-task learning. Pada dataset perbankan didapatkan kinerja F1 terbaik sebesar .8843 oleh pendekatan transformasi data, dan pada dataset sintaksis didapatkan kinerja F1 terbaik sebesar .8822 oleh pendekatan adaptasi algoritma.

Perpustakaan Digital ITB

KLASIFIKASI MULTI-LABEL PADA PEMROSESAN TEKS MENGGUNAKAN ARSITEKTUR TRANSFORMER DENGAN PENDEKATAN MULTI-TASK LEARNING

Artikel Terkait

Daftar Simpan Judul

KLASIFIKASI MULTI-LABEL PADA PEMROSESAN TEKS MENGGUNAKAN ARSITEKTUR TRANSFORMER DENGAN PENDEKATAN MULTI-TASK LEARNING

Artikel Terkait