digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Penelitian ini berfokus pada pengembangan model penalaran hukum berbasis Natural Language Processing (NLP) dengan menggunakan dataset soal pilihan ganda berbasis teks panjang mengenai hukum acara perdata di Amerika Serikat dari SemEval24 Task 5. Latar belakang penelitian ini adalah adanya kebutuhan terhadap sistem yang mampu memahami teks hukum acara perdata yang kompleks serta mendukung proses pengambilan keputusan. Tujuan utama penelitian ini adalah membangun model penalaran hukum yang mampu memproses teks panjang, menangani ketidakseimbangan data, serta membandingkan performa berbagai pretrained models dengan random baseline dan majority baseline untuk memperoleh hasil yang lebih akurat. Tahapan penelitian meliputi text preprocessing untuk penanganan teks panjang, data balancing untuk mengatasi distribusi kelas yang tidak seimbang, serta pembangunan model binary classification dan multiclass classification dengan metode fine-tuning. Eksperimen dilakukan dengan melatih model pada dataset hukum yang terdiri atas bagian introduction, question, dan answer. Hasil penelitian menunjukkan bahwa penerapan text preprocessing, data balancing, hyperparameter tuning, serta pemilihan pretrained models khusus domain hukum mampu memberikan peningkatan kinerja dibandingkan baseline. Namun, pembangunan model multiclass classification dan penggunaan pretrained models khusus teks panjang seperti BigBird dan LongFormer belum memberikan hasil yang memuaskan. Model terbaik diperoleh dari Legal-BERT-base dengan metode SWC MaxPool yang menghasilkan nilai F1-score sebesar 0,7385. Ke depan, penelitian ini dapat dikembangkan lebih lanjut melalui penerapan teknik data augmentation yang lebih bervariasi serta pemanfaatan fitur analysis dalam dataset untuk memperkaya informasi yang dapat dipelajari model.