Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Patronizing and condescending language adalah bahasa yang mungkin digunakan
dengan intensi yang baik, dapat menyebabkan diskriminasi, menyebabkan stigma
buruk, dan menghambat inklusi pada pihak rentan. Task deteksi patronizing and
condescending language (PCL) diangkat dalam SemEval 2022 sebagai task
keempat yang terdiri dari klasifikasi biner serta klasifikasi multilabel PCL.
Penelitian ini membahas pengembangan model deteksi PCL menggunakan model
berbasis transformer karena kemampuannya dalam mendeteksi fitur linguistic yang
kompleks. Hasil eksperimen menunjukkan bahwa pada task pertama, yakni
klasifikasi biner DeBERTa-v3-large menghasilkan kinerja f1-score yang lebih baik
dibandingkan LLaMA-3-8B, berturut-turut sebesar 0,549 dan 0,361. Selain itu,
data augmentation menunjukkan kinerja yang bervariasi bergantung pada subtask
dan model yang digunakan dan menunjukan inkonsistensi penggunaannya. Lain
dari pada itu, strategi weighted random sampling cukup efektif dalam
meningkatkan kinerja pada task multilabel menggunakan binary relevance. Hasil
kinerja menggunakan strategi transformasi task, seperti binary relevance dan label
powerset, berturut-turut menghasilkan kinerja macro-average f1-score 0,346 dan
0,17 dan belum mampu menghasilkan kinerja yang lebih baik dibandingkan kinerja
model pada SemEval 2022 task ke-4.