digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Klasifikasi multi-label emosi pada teks bertujuan untuk menentukan beberapa label emosi pada suatu teks. Penelitian di bidang ini biasanya mencakup pengembangan dataset dan model pembelajaran mesin/mendalam. Model SpanEmo, yang memiliki kinerja unggul pada dataset SemEval 18 Task 1E-c, menggunakan fungsi loss gabungan binary cross entropy serta label correlation aware. Namun, model ini kurang efektif pada dataset yang tidak seimbang. Penelitian ini mengembangkan dataset emosi multi-label teks bahasa Indonesia dengan mengevaluasi label dari dataset publik karena dataset tersebut tidak dianotasi oleh orang Indonesia asli sehingga terdapat potensi kesalahan pemberian label dan mengembangkan model IndoBERT serta SpanEmo dengan menambahkan fungsi loss Zero Bounder Log-sum-exp & Pairwise Rank-based atau ZLPR untuk meningkatkan kinerja pada dataset tidak seimbang. Dataset yang dibangun memiliki nilai kappa 0.623, yang menunjukkan kualitas yang baik. Eksperimen menunjukkan bahwa kombinasi fungsi loss binary cross entropy dan label correlation aware dengan bobot 0.1 dan 0.9 pada IndoBERT menghasilkan kinerja terbaik. Pada SpanEmo, kombinasi fungsi loss label correlation aware dan ZLPR dengan bobot 0.6 dan 0.4 menghasilkan kinerja terbaik. Secara umum, SpanEmo memiliki kinerja lebih baik dibandingkan IndoBERT