digilib@itb.ac.id +62 812 2508 8800


Tesis
PUBLIC Open In Flip Book Irwan Sofiyan

Sistem pengenal ucapan atau Automatic Speech Recognition (ASR) memberikan keluaran berupa teks hasil pengenalan ucapan. Teks ini umumnya tidak bertanda baca dan tidak berisi huruf kapital. Hasil pengenalan ucapan sering digunakan sebagai masukan untuk task lain dalam natural language processing. Pemformatan hasil pengenalan ucapan menjadi penting untuk dilakukan baik bagi manusia maupun mesin. Salah satu teknik pemformatan transkrip adalah menggunakan pendekatan penerjemah mesin (machine translation). Pendekatan mesin translasi terdiri dari dua teknik yang umum digunakan: berbasis statistik dan berbasis deep learning. Penelitian ini bermaksud untuk menambahkan tanda titik, koma, dan huruf kapital dengan menggunakan pendekatan statistical machine translation (SMT) dan neural machine translation (NMT). F-measure terbaik untuk pendekatan SMT dengan satuan data berupa kalimat tunggal adalah: 22,16% untuk titik; 20,69% untuk koma; dan 56,49% untuk huruf kapital. Hasil NMT adalah: 86,51% untuk titik; 54,05% untuk koma; dan 91,01% untuk huruf kapital. Selain itu, dilakukan simulasi berbagai variasi akurasi pengenalan ASR yang satuan datanya berupa sekuens kalimat (bukan kalimat tunggal). F-measure terbaik didapat dari simulasi ASR dengan akurasi 100% dengan pendekatan NMT, yaitu: 42,38% untuk titik; 37,56% untuk koma; dan 83,94% untuk huruf kapital.