Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Penelitian ini berfokus pada pengembangan model penalaran hukum
berbasis Natural Language Processing (NLP) dengan menggunakan dataset soal
pilihan ganda berbasis teks panjang mengenai hukum acara perdata di Amerika
Serikat dari SemEval24 Task 5. Latar belakang penelitian ini adalah adanya
kebutuhan terhadap sistem yang mampu memahami teks hukum acara perdata yang
kompleks serta mendukung proses pengambilan keputusan. Tujuan utama
penelitian ini adalah membangun model penalaran hukum yang mampu memproses
teks panjang, menangani ketidakseimbangan data, serta membandingkan performa
berbagai pretrained models dengan random baseline dan majority baseline untuk
memperoleh hasil yang lebih akurat. Tahapan penelitian meliputi text
preprocessing untuk penanganan teks panjang, data balancing untuk mengatasi
distribusi kelas yang tidak seimbang, serta pembangunan model binary
classification dan multiclass classification dengan metode fine-tuning. Eksperimen
dilakukan dengan melatih model pada dataset hukum yang terdiri atas bagian
introduction, question, dan answer. Hasil penelitian menunjukkan bahwa
penerapan text preprocessing, data balancing, hyperparameter tuning, serta
pemilihan pretrained models khusus domain hukum mampu memberikan
peningkatan kinerja dibandingkan baseline. Namun, pembangunan model
multiclass classification dan penggunaan pretrained models khusus teks panjang
seperti BigBird dan LongFormer belum memberikan hasil yang memuaskan. Model
terbaik diperoleh dari Legal-BERT-base dengan metode SWC MaxPool yang
menghasilkan nilai F1-score sebesar 0,7385. Ke depan, penelitian ini dapat
dikembangkan lebih lanjut melalui penerapan teknik data augmentation yang lebih
bervariasi serta pemanfaatan fitur analysis dalam dataset untuk memperkaya
informasi yang dapat dipelajari model.
Perpustakaan Digital ITB