digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Dessy Rondang Monaomi

Ambiguitas struktural, yaitu kondisi ketika sebuah kalimat memiliki lebih dari satu penguraian, merupakan salah satu permasalahan dalam bahasa alami yang masih diabaikan oleh kebanyakan sistem terjemahan ucapan-ke-teks saat ini sehingga menghasilkan terjemahan yang masih mengandung ambiguitas struktural atau tidak tepat. Sementara itu, pada ucapan terdapat informasi prosodik seperti jeda dan pitch yang dapat dimanfaatkan untuk menangani ambiguitas struktural tersebut. Oleh karena itu, penelitian ini mengembangkan sistem terjemahan ucapan-ke-teks bebas ambigu struktural yaitu sistem terjemahan ucapan-ke-teks yang tidak hanya menerjemahkan ucapan pada satu bahasa ke teks dalam bahasa lain, tapi juga menangani ambiguitas struktural yang ada pada ucapan masukan tersebut sehingga menghasilkan terjemahan yang bebas dari ambiguitas struktural dengan memanfaatkan informasi prosodik ucapan. Pada penelitian ini dibangun korpus terjemahan ucapan-ke-teks bebas ambigu struktural untuk bahasa Indonesia ke bahasa Inggris dengan menerjemahkan korpus ambigu struktural bahasa Indonesia ke bahasa Inggris. Penelitian ini mengusulkan sistem terjemahan ucapan-ke-teks bebas ambigu struktural dengan memodifikasi kedua pendekatan cascade dan direct (end-to-end) pada sistem terjemahan ucapan-ke-teks biasa sehingga mampu memanfaatkan informasi prosodik dalam menghasilkan keluaran bebas ambigu struktural. Pendekatan cascade biasa yang terdiri dari automatic speech recognition (ASR) dan machine translation (MT) dimodifikasi menjadi tiga usulan cascade, yaitu (1) ASR dengan tambahan tag arti + text disambiguation (TD) + MT, (2) speech disambiguation (SD) + MT, dan (3) ASR dengan tambahan tag arti + disambiguation MT (DMT). Adapun untuk pendekatan direct diperkenalkan model direct speech translation (DST). Hasil eksperimen menunjukkan dengan pendekatan yang diajukan sistem mampu memberikan terjemahan bebas ambigu struktural dengan cukup baik. Sistem terbaik pada penelitian ini, yaitu sistem cascade yang terdiri dari ASR dengan tambahan tag dan model baru yang disebut model disambiguation MT (DMT), mampu memberikan akurasi disambiguasi hingga 78.13%.