digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Muhammad Farhan
PUBLIC Alice Diniarti

COVER Muhammad Farhan
PUBLIC Alice Diniarti

BAB 1 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 2 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 3 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 4 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 5 Muhammad Farhan
PUBLIC Alice Diniarti

PUSTAKA Muhammad Farhan
PUBLIC Alice Diniarti

Saat ini, belum umum untuk menemukan penggunaan sistem verifikasi pembicara bergantung teks pada bahasa Indonesia, terutama dengan menggunakan bagian kata yang telah didaftarkan. Sebagai contoh, jika kita mendaftarkan ????kalimat saya adalah kata sandi saya????, kita dapat menggunakan kombinasi setiap bagian kata agar dapat dikenali. Umumnya, kalimat yang digunakan ketika proses pengenalan harus sama dengan kalimat yang didaftarkan. Hal tersebut menjadi merepotkan karena kita harus menghafal urutan kata secara keseluruhan. Tugas Akhir ini dikerjakan untuk mengatasi permasalahan tersebut. Tahapan yang dilakukan dimulai dari mengumpulkan data suara, melakukan eksperimen ekstraksi fitur, melakukan eksperimen pemodelan, dan mengimplementasikannya pada telepon genggam. Eksperimen yang dilakukan memerlukan dataset yang sesuai sebagai data untuk pelatihan model dan juga pengujian model. Pada permasalahan ini, dataset yang sesuai belum ditemukan. Dalam proses pengerjaan Tugas Akhir ini, berhasil dikumpulkan dataset sebanyak 3547 perekaman dengan jumlah 60 pembicara lakilaki dan 60 pembicara perempuan. Berdasarkan hasil eksperimen, didapatkan Equal Error Rate (EER) sebesar 10,08% untuk laki-laki dan 12,5% untuk perempuan. Teknik ekstraksi fitur yang digunakan adalah Mel Frequency Cepstral Coefficient (MFCC) dengan 12 koefisien cepstral dan 1 log-energy serta turunan pertama (delta) dan turunan kedua (delta-delta). Fitur MFCC kemudian diproses dengan melakukan Voice Activity Detection (VAD) untuk menghilangkan jeda pada data suara dan Cepstral Mean and Variance Normalization (CMVN) untuk menormalisasi efek kanal pada sinyal suara. Terakhir, dilakukan ekstraksi i-vector dengan 175 dimensi. Pemodelan memanfaatkan GMM bergantung jenis kelamin dengan 64 mixture.