Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Komunikasi suara memainkan peran penting dalam interaksi manusia dan telah
digunakan dalam sistem biometrik seperti Automatic Speaker Verification (ASV).
Namun, sistem ASV rentan terhadap serangan suara palsu yang dapat
mengakibatkan pelanggaran privasi dan pencurian identitas.
Penelitian ini mengembangkan sistem deteksi suara palsu berbahasa Indonesia
menggunakan model Residual Network (ResNet) dan Light Convolutional Neural
Network (LCNN) dengan fitur Linear Frequency Cepstral Coefficient (LFCC).
Model dilatih dan diuji menggunakan dataset dari Common Voice dan Prosa.ai,
dengan metrik evaluasi berupa Equal Error Rate, Minimal Detection Cost
Function, Actual Detection Cost Function, dan Cost Log-Likelihood Ratio.
Hasil eksperimen menunjukkan bahwa model ResNet sedikit lebih unggul
dibandingkan LCNN. Namun, kedua model menghadapi tantangan dalam
generalisasi, terutama pada skenario akses fisik. Akan tetapi, model yang dilatih
dengan dataset Prosa.ai pada skenario akses logis menunjukkan kemampuan
generalisasi yang lebih baik sehingga disarankan untuk menggunakan dataset
yang bervariasi dengan kualitas rekaman konsisten dan dari berbagai sumber
untuk meningkatkan kemampuan generalisasi model.
Penelitian ini berkontribusi dalam pengembangan dataset pertama untuk deteksi
suara palsu berbahasa Indonesia. Selain itu, penelitian ini juga menunjukkan
bahwa model berbasis CNN seperti ResNet dan LCNN dapat mencapai performa
tinggi dalam mendeteksi suara palsu berbahasa Indonesia.