ABSTRAK Muhammad Farhan
PUBLIC Alice Diniarti COVER Muhammad Farhan
PUBLIC Alice Diniarti
BAB 1 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
BAB 2 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
BAB 3 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
BAB 4 Muhammad Farhan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan
BAB 5 Muhammad Farhan
PUBLIC Alice Diniarti PUSTAKA Muhammad Farhan
PUBLIC Alice Diniarti
Saat ini, belum umum untuk menemukan penggunaan sistem verifikasi pembicara
bergantung teks pada bahasa Indonesia, terutama dengan menggunakan bagian kata
yang telah didaftarkan. Sebagai contoh, jika kita mendaftarkan ????kalimat saya adalah
kata sandi saya????, kita dapat menggunakan kombinasi setiap bagian kata agar dapat
dikenali. Umumnya, kalimat yang digunakan ketika proses pengenalan harus sama
dengan kalimat yang didaftarkan. Hal tersebut menjadi merepotkan karena kita
harus menghafal urutan kata secara keseluruhan.
Tugas Akhir ini dikerjakan untuk mengatasi permasalahan tersebut. Tahapan yang
dilakukan dimulai dari mengumpulkan data suara, melakukan eksperimen ekstraksi
fitur, melakukan eksperimen pemodelan, dan mengimplementasikannya pada
telepon genggam.
Eksperimen yang dilakukan memerlukan dataset yang sesuai sebagai data untuk
pelatihan model dan juga pengujian model. Pada permasalahan ini, dataset yang
sesuai belum ditemukan. Dalam proses pengerjaan Tugas Akhir ini, berhasil
dikumpulkan dataset sebanyak 3547 perekaman dengan jumlah 60 pembicara lakilaki
dan 60 pembicara perempuan.
Berdasarkan hasil eksperimen, didapatkan Equal Error Rate (EER) sebesar 10,08%
untuk laki-laki dan 12,5% untuk perempuan. Teknik ekstraksi fitur yang digunakan
adalah Mel Frequency Cepstral Coefficient (MFCC) dengan 12 koefisien cepstral
dan 1 log-energy serta turunan pertama (delta) dan turunan kedua (delta-delta).
Fitur MFCC kemudian diproses dengan melakukan Voice Activity Detection (VAD)
untuk menghilangkan jeda pada data suara dan Cepstral Mean and Variance
Normalization (CMVN) untuk menormalisasi efek kanal pada sinyal suara.
Terakhir, dilakukan ekstraksi i-vector dengan 175 dimensi. Pemodelan
memanfaatkan GMM bergantung jenis kelamin dengan 64 mixture.