digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Open In Flipbook Dessy Rondang Monaomi

automatic speech recognition (ASR), terutama dalam domain spesifik seperti medis yang melibatkan istilah teknis dan campuran bahasa. Penelitian ini bertujuan untuk membangun sistem G2P dwibahasa untuk Bahasa Indonesia dan Bahasa Inggris yang mampu menangani masukan kata dari kedua bahasa secara simultan. Sistem yang diusulkan mengadopsi pendekatan dua tahap, yaitu model language identification (LID) untuk mengklasifikasikan bahasa dari kata input, serta model G2P language-dependent yang dilatih secara terpisah berdasarkan hasil klasifikasi. Evaluasi awal terhadap dataset IPA-dict menunjukkan bahwa sistem G2P usulan mampu menurunkan nilai phone error rate (PER) sebesar ~0,8% dibandingkan model baseline. Namun, saat digunakan dalam pembangunan sistem ASR domain medis, sistem G2P usulan menghasilkan nilai word error rate (WER) yang lebih tinggi dibandingkan model baseline dan leksikon manual. Analisis lebih lanjut menunjukkan bahwa sebagian besar kesalahan berasal dari transkripsi kata-kata non-medis. Sebagai solusi, dikembangkan pendekatan hybrid yang memanfaatkan sistem G2P usulan untuk kosakata medis, dan model baseline untuk kosakata non-medis. Pendekatan hybrid dengan algoritma Naive Bayes sebagai model LID berhasil menurunkan nilai WER sebesar ~0,118%. Hasil ini menunjukkan bahwa pendekatan modular berdasarkan kosakata memiliki potensi untuk meningkatkan kinerja ASR pada domain medis, meskipun masih diperlukan eksplorasi lebih lanjut untuk memastikan konsistensi hasil pada domain data yang lebih luas.