Dependency parser merupakan salah satu hasil penelitian dalam NLP (natural
language processing) yang terus berkembang hingga saat ini. Dependency parser
digunakan pada salah satu tahapan dalam task NLP lain, seperti analisis sentimen dan
semantic role labelling. Terdapat beberapa penelitian dependency parser Bahasa
Indonesia yang telah dilakukan sebelumnya. Namun, model parsing yang dihasilkan
masih tetap memiliki kasus-kasus kesalahan parsing. Hal ini disebabkan oleh kinerja
algoritma parser yang digunakan sebelumnya, serta kualitas dataset yang digunakan.
Di sisi lain, pada penelitian sebelumnya belum dilakukan evaluasi per label
dependency parser yang menunjukkan kinerja dependency parser secara spesifik untuk
relasi kata tertentu.
Oleh karena itu, pada penelitian ini dilakukan eksperimen parsing menggunakan Malt
Parser, MST Parser, BIST Transition-based parser, Spacy dan Stanza. Proses
eksperimen meliputi eksperimen masing-masing parser dan dilakukan parameter
tuning pada sebagian parser, pemilihan parser yang terbaik, serta dilakukan evaluasi
dan analisis hasil parsing berdasarkan label untuk dua parser terbaik. Dataset yang
digunakan untuk eksperimen ini adalah dataset Indonesian_GSD. Untuk membantu
analisis hasil parsing, pada penelitian ini juga dilakukan pembuatan prototipe aplikasi
berbasis web yang dapat melakukan visualisasi hasil parsing, evaluasi yang dapat
dilakukan berdasarkan label tertentu, memberikan informasi perbandingan dua hasil
parser, serta parsing kalimat berbahasa Indonesia.
Hasil evaluasi menunjukkan Stanza memiliki kinerja umum paling tinggi, dengan UAS
sebesar 87,01, serta LAS sebesar 83,21. Meski begitu, masih ada beberapa label
dependency tertentu yang masih memiliki skor UAS, LAS atau label akurasi yang
rendah (bahkan dibawah 70), diantaranya label conj, iobj, parataxis.