digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Komunikasi suara memainkan peran penting dalam interaksi manusia dan telah digunakan dalam sistem biometrik seperti Automatic Speaker Verification (ASV). Namun, sistem ASV rentan terhadap serangan suara palsu yang dapat mengakibatkan pelanggaran privasi dan pencurian identitas. Penelitian ini mengembangkan sistem deteksi suara palsu berbahasa Indonesia menggunakan model Residual Network (ResNet) dan Light Convolutional Neural Network (LCNN) dengan fitur Linear Frequency Cepstral Coefficient (LFCC). Model dilatih dan diuji menggunakan dataset dari Common Voice dan Prosa.ai, dengan metrik evaluasi berupa Equal Error Rate, Minimal Detection Cost Function, Actual Detection Cost Function, dan Cost Log-Likelihood Ratio. Hasil eksperimen menunjukkan bahwa model ResNet sedikit lebih unggul dibandingkan LCNN. Namun, kedua model menghadapi tantangan dalam generalisasi, terutama pada skenario akses fisik. Akan tetapi, model yang dilatih dengan dataset Prosa.ai pada skenario akses logis menunjukkan kemampuan generalisasi yang lebih baik sehingga disarankan untuk menggunakan dataset yang bervariasi dengan kualitas rekaman konsisten dan dari berbagai sumber untuk meningkatkan kemampuan generalisasi model. Penelitian ini berkontribusi dalam pengembangan dataset pertama untuk deteksi suara palsu berbahasa Indonesia. Selain itu, penelitian ini juga menunjukkan bahwa model berbasis CNN seperti ResNet dan LCNN dapat mencapai performa tinggi dalam mendeteksi suara palsu berbahasa Indonesia.