Perpustakaan Digital - Digilib ITB

PENGEMBANGAN MODEL KLASIFIKASI MULTI-LABEL EMOSI TEKS BAHASA INDONESIA DENGAN WEIGHTED PAIRWISE LOSS

477 views

Save At List

Penulis	:	Safiq Faray [13519145]
Kontributor / Dosen Pembimbing	:	Dr. Masayu Leylia Khodra, S.T, M.T.
Jenis Koleksi	:	Tugas Akhir
Tahun Terbit	:
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	Klasifikasi multi-label, emosi, IndoBERT, SpanEmo, Pembangunan Dataset, bahasa Indonesia
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi
File	:	1 file
Tanggal Input	:	20 Agu 2024

Dokumen Asli
Terbatas Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Klasifikasi multi-label emosi pada teks bertujuan untuk menentukan beberapa label emosi pada suatu teks. Penelitian di bidang ini biasanya mencakup pengembangan dataset dan model pembelajaran mesin/mendalam. Model SpanEmo, yang memiliki kinerja unggul pada dataset SemEval 18 Task 1E-c, menggunakan fungsi loss gabungan binary cross entropy serta label correlation aware. Namun, model ini kurang efektif pada dataset yang tidak seimbang. Penelitian ini mengembangkan dataset emosi multi-label teks bahasa Indonesia dengan mengevaluasi label dari dataset publik karena dataset tersebut tidak dianotasi oleh orang Indonesia asli sehingga terdapat potensi kesalahan pemberian label dan mengembangkan model IndoBERT serta SpanEmo dengan menambahkan fungsi loss Zero Bounder Log-sum-exp & Pairwise Rank-based atau ZLPR untuk meningkatkan kinerja pada dataset tidak seimbang. Dataset yang dibangun memiliki nilai kappa 0.623, yang menunjukkan kualitas yang baik. Eksperimen menunjukkan bahwa kombinasi fungsi loss binary cross entropy dan label correlation aware dengan bobot 0.1 dan 0.9 pada IndoBERT menghasilkan kinerja terbaik. Pada SpanEmo, kombinasi fungsi loss label correlation aware dan ZLPR dengan bobot 0.6 dan 0.4 menghasilkan kinerja terbaik. Secara umum, SpanEmo memiliki kinerja lebih baik dibandingkan IndoBERT

Perpustakaan Digital ITB

PENGEMBANGAN MODEL KLASIFIKASI MULTI-LABEL EMOSI TEKS BAHASA INDONESIA DENGAN WEIGHTED PAIRWISE LOSS

Artikel Terkait

Daftar Simpan Judul

PENGEMBANGAN MODEL KLASIFIKASI MULTI-LABEL EMOSI TEKS BAHASA INDONESIA DENGAN WEIGHTED PAIRWISE LOSS

Artikel Terkait