mam Nurul Hukmi [13519150].pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Babble noise atau derau celoteh sudah menjadi salah satu jenis derau sinyal suara yang sulit ditangani.
Pada penelitian ini, dilakukan penanganan derau ini dengan memanfaatkan model deep learning, lebih
tepatnya perpaduan antara arsitektur berbasis CNN dan RNN. Model dengan basis ini dipilih karena
pertimbangan adanya keunggulan yang dimiliki oleh setiap jenis. Arsitektur berbasis CNN dapat
menangani data spasial, memiliki generalisasi yang lebih baik, dan dapat melakukan inferensi dengan
cepat. Arsitektur berbasis RNN merupakan spesialis dalam menangani data yang memiliki keterurutan.
Model yang dibangun dilatih agar dapat mengidentifikasi derau yang terkandung pada sinyal berderau
dalam bentuk spektogram. Untuk mengetahui seberapa bagus kinerja model, model perpaduan ini
dibandingkan dengan model berbasis CNN maupun model berbasis RNN. Terkhusus untuk model
berbasis perpaduan CNN dan RNN sebagai model utama, akan dilakukan eksperimen untuk
mendapatkan konfigurasi terbaik dari arsitektur model tersebut. Metrik yang akan digunakan adalah
PESQ (perceptual evaluation of speech quality), yaitu metrik yang dibangun menyerupai bagaimana
manusia menilai kualitas sinyal dan menilai perbedaan antara sinyal berderau terhadap sinyal bersih
acuan. Hasil eksperimen menunjukkan bahwa konfigurasi terbaik bagi model perpaduan CNN dan RNN
adalah model dengan arsitektur CNN U-Net, fungsi aktivasi PReLU, dan jenis layer RNN berupa GRU.
Setelah melakukan pelatihan, didapatkan hasil bahwa model berbasis perpaduan CNN-RNN, CNN, dan
RNN memiliki nilai PESQ sebesar 2,23, 1,95, dan 1,58 secara terurut. Hasil dari penelitian lanjutan
menunjukkan bahwa model perpaduan berhasil memberikan keluaran yang lebih baik dibandingkan
dengan dua model lainnya pada data dengan tingkat SNR yang berada pada jangkauan pelatihannya.