digilib@itb.ac.id +62 812 2508 8800

Abstrak chalvin.pdf
PUBLIC Alice Diniarti

Rhetorical Document Profile (RDP) adalah suatu kerangka informasi yang digunakan untuk menstrukturkan isi sebuah makalah ilmiah. RDP membagi kalimat pada makalah ilmiah ke dalam 7 hingga 16 kategori berdasarkan retorik dari kalimat tersebut. RDP dapat dipakai sebagai data terstruktur untuk dijadikan masukan dari sistem lain seperti sistem peringkasan makalah ilmiah. Telah terdapat beberapa penelitian yang mencoba mengotomatisasi klasifikasi retorik. Untuk kategorisasi 7 retorik kalimat, penelitian Teufel berhasil mendapatkan f-score sebesar 0.51 menggunakan naive bayes pada tahun 2002. Merity dkk. berhasil mendapatkan fscore 0.93 dengan menggunakan maximum entropy classifier pada tahun 2009. Penelitian klasifikasi 16 kategori dipionir oleh Widyantoro dkk. yang berhasil mendapatkan f-score sebesar 0.25 dengan menggunakan berbagai teknik. Rachman pada tahun 2017 berhasil mendapatkan f-measure sekitar 0.43 dengan metode shallow learning dengan word2vec dan sequence labelling. Hal ini menunjukkan rekayasa fitur pada penelitian sebelumnya belum optimal. Belakangan ini banyak penelitian dalam bilang pemrosesan bahasa alami yang menggunakan deep learning. Hal ini terjadi karena deep learning mampu untuk menangkap fitur high level secara otomatis dengan cara menggabungkan fitur-fitur yang lebih sederhana. Tanpa deep learning, fitur-fitur high level hanya bisa didapat jika suatu sistem dengan pengertian akan data yang mirip dengan pengertian manusia dapat dibuat. Dengan digunakannya deep learning, berbagai model yang dibangun untuk menjawab persoalan pada pemrosesan bahasa alami mendapatkan kinerja terbaik. Pada penelitian ini, dicoba berbagai arsitektur deep learning untuk mengoptimalkan rekayasa fitur pada penelitian kategorisasi retorik kalimat. Arsitektur yang dicoba pada penelitian ini antara lain CNN, GRU, LSTM, Bi-GRU, dan Bi-LSTM. Arsitektur ini dipilih karena telah terbukti mendapatkan hasil yang baik dalam kategorisasi kalimat. Model terbaik pada penelitian ini mendapatkan f-measure sebesar 0.457.