Ambiguitas struktural, yaitu kondisi ketika sebuah kalimat memiliki lebih dari satu
penguraian, merupakan salah satu permasalahan dalam bahasa alami yang masih
diabaikan oleh kebanyakan sistem terjemahan ucapan-ke-teks saat ini sehingga
menghasilkan terjemahan yang masih mengandung ambiguitas struktural atau
tidak tepat. Sementara itu, pada ucapan terdapat informasi prosodik seperti
jeda dan pitch yang dapat dimanfaatkan untuk menangani ambiguitas struktural
tersebut. Oleh karena itu, penelitian ini mengembangkan sistem terjemahan
ucapan-ke-teks bebas ambigu struktural yaitu sistem terjemahan ucapan-ke-teks
yang tidak hanya menerjemahkan ucapan pada satu bahasa ke teks dalam bahasa
lain, tapi juga menangani ambiguitas struktural yang ada pada ucapan masukan
tersebut sehingga menghasilkan terjemahan yang bebas dari ambiguitas struktural
dengan memanfaatkan informasi prosodik ucapan.
Pada penelitian ini dibangun korpus terjemahan ucapan-ke-teks bebas ambigu
struktural untuk bahasa Indonesia ke bahasa Inggris dengan menerjemahkan korpus
ambigu struktural bahasa Indonesia ke bahasa Inggris. Penelitian ini mengusulkan
sistem terjemahan ucapan-ke-teks bebas ambigu struktural dengan memodifikasi
kedua pendekatan cascade dan direct (end-to-end) pada sistem terjemahan
ucapan-ke-teks biasa sehingga mampu memanfaatkan informasi prosodik dalam
menghasilkan keluaran bebas ambigu struktural. Pendekatan cascade biasa yang
terdiri dari automatic speech recognition (ASR) dan machine translation (MT)
dimodifikasi menjadi tiga usulan cascade, yaitu (1) ASR dengan tambahan tag
arti + text disambiguation (TD) + MT, (2) speech disambiguation (SD) + MT, dan
(3) ASR dengan tambahan tag arti + disambiguation MT (DMT). Adapun untuk
pendekatan direct diperkenalkan model direct speech translation (DST).
Hasil eksperimen menunjukkan dengan pendekatan yang diajukan sistem mampu
memberikan terjemahan bebas ambigu struktural dengan cukup baik. Sistem terbaik
pada penelitian ini, yaitu sistem cascade yang terdiri dari ASR dengan tambahan
tag dan model baru yang disebut model disambiguation MT (DMT), mampu
memberikan akurasi disambiguasi hingga 78.13%.