Dalam interaksi manusia, emosi merupakan aspek yang memiliki peranan dalam
memengaruhi informasi yang disampaikan. Pengembangan bentuk interaksi manusi
dan komputer telah banyak melibatkan aspek emosi. Beberapa penelitian
pengenalan emosi dalam bahasa Indonesia telah dilakukan untuk mengenali emosi
per segmen ucapan. Natur pengenalan emosi tidak hanya dilakukan per ucapan,
namun per cakapan yaitu ucapan berurutan yang mengandung sebuah konteks
tertentu. Oleh karena itu, dilakukan eksperimen guna membangun sistem pengenal
emosi cakapan dalam bahasa Indonesia.
Untuk membangun sistem pengenal emosi cakapan, diperlukan korpus emosi yang
sesuai dan dapat digunakan untuk melakukan pemodelan. Korpus data tersebut
belum tersedia. Pada penelitian ini, dibangun sebuah korpus emosi baru yang
diperoleh dengan melakukan akuisisi data rekaman 46 tayangan podcast. Korpus
emosi yang dibangun terdiri 2003 cakapan dan 10822 ucapan yang memiliki label
diantara 6 kelas emosi yaitu senang, sedih, marah, jijik, takut, dan terkejut.
Sistem pengenal emosi cakapan dalam bahasa Indonesia dibangun melalui
eksperimen dengan melibatkan algoritma Recurrent Neural Network (RNN) guna
menangkap informasi antar ucapan yang bersifat sekuensial. Pembelajaran
pengenalan emosi cakapan dilakukan berdasarkan kelompok fitur akustik/prosodi
dan fitur leksikal. Dalam eksperimen, dilakukan proses pencarian fitur dan teknik
pemodelan terbaik untuk menghasilkan model yang memberikan performa paling
optimal.
Model dilakukan pengujian berdasarkan pengenalan emosi terhadap data. Model
pengenal emosi gabungan bertahap level fitur yang dibangun berdasarkan fitur
akustik/prosodi dan leksikal teruji memiliki performa terbaik dengan F-measure
sebesar 0.5817 untuk 6 kelas emosi dan 0.7252 untuk 4 kelas emosi. Model
gabungan bertahap level keputusan memberikan nilai F-measure sebesar 0.5578
untuk 6 kelas emosi dan 0.6924 untuk 4 kelas emosi. Selain itu, dalam eksperimen,
diperoleh model gabungan langsung level fitur, model gabungan langsung level
keputusan, model akustik langsung, model akustik bertahap, model leksikal
langsung, dan model leksikal bertahap untuk masing-masing 6 kelas emosi dan 4
kelas emosi.