digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Menurut WHO pada tahun 2050, diperkirakan lebih dari 700 juta orang akan mengalami gangguan pendengaran. Namun, hanya sedikit penderita yang menggunakan alat bantu dengar. Salah satu alasan adalah karena perangkat kurang memberi manfaat terutama pada lingkungan yang bising. Alat bantu dengar tidak lagi hanya berfungsi untuk amplifikasi suara, tetapi juga untuk peningkatan sinyal ucapan (speech enhancement), yang mana bertujuan memisahkan sinyal ucapan target dari ucapan lain atau noise lingkungan. Metode konvensional yang menggunakan faktor pembobotan seperti spectral subtraction atau wiener filtering tidak optimal untuk mengatasi interferer yang tidak stasioner. Saat ini, metode deep learning sedang banyak dikembangkan untuk pemisahan sinyal suara. Tantangan utama penggunaan metode ini sering kali muncul dari segi komputasi dan kompleksitasnya. Salah satu metode yang digunakan untuk penelitian ini adalah MC-ConvTasNet. Penelitian ini mengevaluasi model menggunakan dataset CEC1 yang menyediakan skenario menggunakan pendekatan model pendengaran binaural, multi-channel, keadaan statis, dua tipe interferer, serta variasi SNR. Untuk menilai inteligibilitas suara, analisis dilakukan menggunakan metrik MBSTOI. Hasil menunjukan bahwa dari berbagai kombinasi jumlah filter pada tumpukan dilated-convolution block (H) dan jumlah filter pada bottleneck (B), didapatkan kombinasi terbaik terletak pada angka 256 dan 128. Variasi parameter H dan B yang lebih tinggi tidak menghasilkan performa yang lebih baik. Penurunan kompleksitas melalui parameter H dan B hingga 94,3% mengakibatkan penurunan performa MBSTOI sebesar 10,9%. Perbandingan antara train dan validation loss menunjukan bahwa penggunaan early stopping dapat mencegah terjadinya overfitting, meskipun bisa menyebabkan penurunan performa MBSTOI. Untuk mengkompensasi penurunan tersebut, dimanfaatkan penambahan variasi lapisan dropout pada berbagai posisi di model yang dikembangkan dan juga dilakukan modifikasi encoder-decoder. Lapisan dropout dapat mengurangi gap antara train dan validation loss sehingga dapat menurunkan test loss. Modifikasi decoder pada bagian blok pemisahan sinyal dilakukan dengan mengkombinasikan fitur spatial dari 6 channel dengan fitur spektral.