Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Menurut WHO pada tahun 2050, diperkirakan lebih dari 700 juta orang akan
mengalami gangguan pendengaran. Namun, hanya sedikit penderita yang
menggunakan alat bantu dengar. Salah satu alasan adalah karena perangkat kurang
memberi manfaat terutama pada lingkungan yang bising. Alat bantu dengar tidak
lagi hanya berfungsi untuk amplifikasi suara, tetapi juga untuk peningkatan sinyal
ucapan (speech enhancement), yang mana bertujuan memisahkan sinyal ucapan
target dari ucapan lain atau noise lingkungan. Metode konvensional yang
menggunakan faktor pembobotan seperti spectral subtraction atau wiener filtering
tidak optimal untuk mengatasi interferer yang tidak stasioner. Saat ini, metode deep
learning sedang banyak dikembangkan untuk pemisahan sinyal suara. Tantangan
utama penggunaan metode ini sering kali muncul dari segi komputasi dan
kompleksitasnya. Salah satu metode yang digunakan untuk penelitian ini adalah
MC-ConvTasNet. Penelitian ini mengevaluasi model menggunakan dataset CEC1
yang menyediakan skenario menggunakan pendekatan model pendengaran
binaural, multi-channel, keadaan statis, dua tipe interferer, serta variasi SNR.
Untuk menilai inteligibilitas suara, analisis dilakukan menggunakan metrik
MBSTOI. Hasil menunjukan bahwa dari berbagai kombinasi jumlah filter pada
tumpukan dilated-convolution block (H) dan jumlah filter pada bottleneck (B),
didapatkan kombinasi terbaik terletak pada angka 256 dan 128. Variasi parameter
H dan B yang lebih tinggi tidak menghasilkan performa yang lebih baik. Penurunan
kompleksitas melalui parameter H dan B hingga 94,3% mengakibatkan penurunan
performa MBSTOI sebesar 10,9%. Perbandingan antara train dan validation loss
menunjukan bahwa penggunaan early stopping dapat mencegah terjadinya
overfitting, meskipun bisa menyebabkan penurunan performa MBSTOI. Untuk
mengkompensasi penurunan tersebut, dimanfaatkan penambahan variasi lapisan
dropout pada berbagai posisi di model yang dikembangkan dan juga dilakukan
modifikasi encoder-decoder. Lapisan dropout dapat mengurangi gap antara train
dan validation loss sehingga dapat menurunkan test loss. Modifikasi decoder pada
bagian blok pemisahan sinyal dilakukan dengan mengkombinasikan fitur spatial
dari 6 channel dengan fitur spektral.