digilib@itb.ac.id +62 812 2508 8800

Abstrak
PUBLIC karya

COVER Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 1 Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 2 Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 3 Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 4 Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 5 Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

PUSTAKA Andika Kusuma
Terbatas  karya
» Gedung UPT Perpustakaan

Sistem pengenal pembicara merupakan sistem yang dapat mengenali identitas pembicara melalui gelombang suara. Sistem pengenal pembicara dapat memudahkan berbagai layanan sehari-hari seperti transaksi bank melalui telepon. Saat ini, sistem pengenal pembicara untuk Bahasa Indonesia berbasis IVector belum dapat menangani permasalahan perbedaan emosi. Padahal pada kenyataannya, pendaftaran dan pengenalan suara pembicara sering dilakukan pada kondisi emosi yang berbeda. Perbedaan emosi ini juga seringkali menurunkan kinerja sistem yang ada. Oleh karena itu, pada penelitian ini dibangun sistem pengenal pembicara untuk Bahasa Indonesia yang dapat menangani permasalahan perbedaan emosi dengan menggunakan teknik pemodelan IVector serta teknik transformasi Atom Aligned Sparse Representation (AASR). Penelitian ini dimulai dengan pengumpulan data berupa rekaman suara beberapa pembicara pada kondisi emosi netral dan kondisi emosi lain. Jenis emosi selain netral yang digunakan pada penelitian ini adalah emosi sedih, senang, marah, dan puas. Dibandingkan dengan sistem baseline yang dibangun dengan menggunakan teknik IVector saja, sistem AASR dapat menunjukkan peningkatan kinerja yaitu penurunan nilai Equal Error Rate (EER) sebesar 3,79% pada data uji emosi selain netral. Pada data pengujian kondisi netral, sistem AASR juga mengalami penurunan nilai EER sebesar 2,24%. Secara keseluruhan, sistem AASR meningkatkan kinerja pengenalan pembicara dengan menurunkan nilai EER sebesar 3,46%.