ABSTRAK Muhammad Hanan
Terbatas  Esha Mustika Dewi
» Gedung UPT Perpustakaan
Terbatas  Esha Mustika Dewi
» Gedung UPT Perpustakaan
Variabilitas sesi akibat perubahan kanal dan kondisi akustik sering menurunkan kinerja sistem identifikasi pembicara berbasis i-vector. Penelitian ini menerapkan teknik augmentasi data untuk mengurangi efek tersebut dan meningkatkan ketahanan sistem.
Dataset dibangun dari lima korpus bahasa Indonesia dengan enam kondisi rekaman (tanpa augmentasi, additive noise, dua tingkat reverberasi, gain, dan speed perturbation). Setiap sinyal dipraposes ke MFCC 39 dimensi, dilatih GMM-UBM 128 komponen, diekstrak i-vector 200 dimensi, lalu di-scoring dengan Linear Discriminant Analysis (LDA) + Cosine Distance dan Probabilistic Linear Discriminant Analysis (PLDA). untuk mengevaluasi kesamaan i-vector uji dan referensi.
Eksperimen faktorial dibagi dalam delapan konfigurasi, yaitu augmentasi data latih (ada/tidak) dan empat tingkat overlap antara data latih dan pendaftaran. Evaluasi dilakukan pada empat skenario pendaftaran menggunakan metrik akurasi dan Equal Error Rate (EER).
Hasil menunjukkan bahwa augmentasi tidak selalu meningkatkan akurasi pada LDA+Cosine (tertinggi 98,5 % tanpa augmentasi), tetapi pada PLDA memberikan peningkatan konsisten, akselerasi hingga 94,7% dan penurunan EER hingga 1,74%, terutama pada skenario full overlap dengan augmentasi simetris.
Penelitian ini membuktikan bahwa augmentasi data simetris pada pelatihan dan pendaftaran, dipadukan dengan model PLDA, secara signifikan meningkatkan robustness, ketahanan sistem terhadap variabilitas akustik, sistem identifikasi pembicara berbasis i-vector.
Perpustakaan Digital ITB