digilib@itb.ac.id +62 812 2508 8800

mam Nurul Hukmi [13519150].pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Babble noise atau derau celoteh sudah menjadi salah satu jenis derau sinyal suara yang sulit ditangani. Pada penelitian ini, dilakukan penanganan derau ini dengan memanfaatkan model deep learning, lebih tepatnya perpaduan antara arsitektur berbasis CNN dan RNN. Model dengan basis ini dipilih karena pertimbangan adanya keunggulan yang dimiliki oleh setiap jenis. Arsitektur berbasis CNN dapat menangani data spasial, memiliki generalisasi yang lebih baik, dan dapat melakukan inferensi dengan cepat. Arsitektur berbasis RNN merupakan spesialis dalam menangani data yang memiliki keterurutan. Model yang dibangun dilatih agar dapat mengidentifikasi derau yang terkandung pada sinyal berderau dalam bentuk spektogram. Untuk mengetahui seberapa bagus kinerja model, model perpaduan ini dibandingkan dengan model berbasis CNN maupun model berbasis RNN. Terkhusus untuk model berbasis perpaduan CNN dan RNN sebagai model utama, akan dilakukan eksperimen untuk mendapatkan konfigurasi terbaik dari arsitektur model tersebut. Metrik yang akan digunakan adalah PESQ (perceptual evaluation of speech quality), yaitu metrik yang dibangun menyerupai bagaimana manusia menilai kualitas sinyal dan menilai perbedaan antara sinyal berderau terhadap sinyal bersih acuan. Hasil eksperimen menunjukkan bahwa konfigurasi terbaik bagi model perpaduan CNN dan RNN adalah model dengan arsitektur CNN U-Net, fungsi aktivasi PReLU, dan jenis layer RNN berupa GRU. Setelah melakukan pelatihan, didapatkan hasil bahwa model berbasis perpaduan CNN-RNN, CNN, dan RNN memiliki nilai PESQ sebesar 2,23, 1,95, dan 1,58 secara terurut. Hasil dari penelitian lanjutan menunjukkan bahwa model perpaduan berhasil memberikan keluaran yang lebih baik dibandingkan dengan dua model lainnya pada data dengan tingkat SNR yang berada pada jangkauan pelatihannya.