digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Patronizing and condescending language adalah bahasa yang mungkin digunakan dengan intensi yang baik, dapat menyebabkan diskriminasi, menyebabkan stigma buruk, dan menghambat inklusi pada pihak rentan. Task deteksi patronizing and condescending language (PCL) diangkat dalam SemEval 2022 sebagai task keempat yang terdiri dari klasifikasi biner serta klasifikasi multilabel PCL. Penelitian ini membahas pengembangan model deteksi PCL menggunakan model berbasis transformer karena kemampuannya dalam mendeteksi fitur linguistic yang kompleks. Hasil eksperimen menunjukkan bahwa pada task pertama, yakni klasifikasi biner DeBERTa-v3-large menghasilkan kinerja f1-score yang lebih baik dibandingkan LLaMA-3-8B, berturut-turut sebesar 0,549 dan 0,361. Selain itu, data augmentation menunjukkan kinerja yang bervariasi bergantung pada subtask dan model yang digunakan dan menunjukan inkonsistensi penggunaannya. Lain dari pada itu, strategi weighted random sampling cukup efektif dalam meningkatkan kinerja pada task multilabel menggunakan binary relevance. Hasil kinerja menggunakan strategi transformasi task, seperti binary relevance dan label powerset, berturut-turut menghasilkan kinerja macro-average f1-score 0,346 dan 0,17 dan belum mampu menghasilkan kinerja yang lebih baik dibandingkan kinerja model pada SemEval 2022 task ke-4.