ABSTRAK Louis Caesa Kesuma
Terbatas  Esha Mustika Dewi
» Gedung UPT Perpustakaan
Terbatas  Esha Mustika Dewi
» Gedung UPT Perpustakaan
Kemajuan teknologi suara sintetis menghadirkan tantangan baru bagi sistem Automatic Speaker Verification (ASV), karena suara palsu semakin sulit dibedakan dari suara asli. Penelitian ini mengembangkan dan mengevaluasi tiga versi RawNet (RawNet1, RawNet2, dan RawNet3) dengan penambahan fitur patologis suara seperti jitter, shimmer, dan glottal-to-noise excitation ratio (GNE), yang umumnya digunakan dalam analisis klinis.
Data yang digunakan mencakup suara asli dan sintetis berbahasa Indonesia, sebagai upaya memperkuat sistem pendeteksi untuk bahasa yang kurang terwakili dalam penelitian terdahulu yang didominasi oleh bahasa Inggris dan Mandarin.
Penggabungan dilakukan melalui dua pendekatan, yaitu pada level fitur dan level arsitektur, guna mengevaluasi metode terbaik dalam integrasi fitur patologis ke dalam model RawNet. Hasil menunjukkan bahwa semua model gabungan memiliki kinerja lebih baik dibandingkan baseline. Penggabungan pada level arsitektur menghasilkan performa terbaik dalam mendeteksi suara palsu, terutama dalam skenario yang melibatkan teknologi atau konten yang tidak dikenal selama pelatihan.
Penelitian ini menunjukkan bahwa integrasi fitur patologis dapat meningkatkan akurasi dan robustness sistem deteksi suara sintetis, serta sebagai referensi untuk riset serupa dalam pengembangan sistem deteksi suara palsu berbahasa Indonesia.
Perpustakaan Digital ITB