digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Akhmal Iswara Adjie
PUBLIC Alice Diniarti

Dependency parser merupakan salah satu hasil penelitian dalam NLP (natural language processing) yang terus berkembang hingga saat ini. Dependency parser digunakan pada salah satu tahapan dalam task NLP lain, seperti analisis sentimen dan semantic role labelling. Terdapat beberapa penelitian dependency parser Bahasa Indonesia yang telah dilakukan sebelumnya. Namun, model parsing yang dihasilkan masih tetap memiliki kasus-kasus kesalahan parsing. Hal ini disebabkan oleh kinerja algoritma parser yang digunakan sebelumnya, serta kualitas dataset yang digunakan. Di sisi lain, pada penelitian sebelumnya belum dilakukan evaluasi per label dependency parser yang menunjukkan kinerja dependency parser secara spesifik untuk relasi kata tertentu. Oleh karena itu, pada penelitian ini dilakukan eksperimen parsing menggunakan Malt Parser, MST Parser, BIST Transition-based parser, Spacy dan Stanza. Proses eksperimen meliputi eksperimen masing-masing parser dan dilakukan parameter tuning pada sebagian parser, pemilihan parser yang terbaik, serta dilakukan evaluasi dan analisis hasil parsing berdasarkan label untuk dua parser terbaik. Dataset yang digunakan untuk eksperimen ini adalah dataset Indonesian_GSD. Untuk membantu analisis hasil parsing, pada penelitian ini juga dilakukan pembuatan prototipe aplikasi berbasis web yang dapat melakukan visualisasi hasil parsing, evaluasi yang dapat dilakukan berdasarkan label tertentu, memberikan informasi perbandingan dua hasil parser, serta parsing kalimat berbahasa Indonesia. Hasil evaluasi menunjukkan Stanza memiliki kinerja umum paling tinggi, dengan UAS sebesar 87,01, serta LAS sebesar 83,21. Meski begitu, masih ada beberapa label dependency tertentu yang masih memiliki skor UAS, LAS atau label akurasi yang rendah (bahkan dibawah 70), diantaranya label conj, iobj, parataxis.