digilib@itb.ac.id +62 812 2508 8800

Abstrak
PUBLIC karya

COVER Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 1 Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 2 Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 3 Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 4 Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 5 Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

BAB 6 Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

PUSTAKA Patrick Nugroho Hadiwinoto
Terbatas  karya
» Gedung UPT Perpustakaan

Model bahasa berperan penting dalam sebuah sistem pengenal ucapan. Akurasi pengenalan ucapan spontan masih sangat rendah dibandingkan ucapan diktasi pada sistem pengenal ucapan Bahasa Indonesia. Hal ini karena sedikitnya jumlah data spontan yang ada. Jumlah data yang sedikit ini menyebabkan karakteristik ucapan spontan tidak dapat terwakili dalam model bahasa. Pengumpulan data pun sulit dilakukan sehingga salah satu kandidat solusinya adalah melakukan augmentasi data dari data spontan yang sudah ada. Pada penelitian ini dilakukan eksperimen pada model bahasa untuk meningkatkan akurasi pengenalan ucapan spontan Bahasa Indonesia dengan melakukan augmentasi data. Augmentasi data dilakukan demi efisiensi penambahan jumlah data pada korpus teks spontan. Hal ini dilakukan agar dapat meningkatkan akurasi pengenalan ucapan spontan pada sistem pengenal ucapan Bahasa Indonesia. Augmentasi data pada penelitian ini dilakukan menggunakan penerjemah mesin berbasis statistik. Teknik pemodelan bahasa yang digunakan berbasis n-gram. Pemodelan akustik menggunakan teknik GMM-HMM. Data latih dan data uji pada penelitian ini bersumber dari penelitian sebelumnya. Augmentasi data dilakukan pada model bahasa yang terlebih dahulu ditambahkan dengan korpus teks spontan karena teks spontan pada dasarnya diperoleh dari hasil transkripsi percakapan secara manual. Pada pengujian menggunakan data uji spontan terjadi peningkatan akurasi relatif terhadap baseline sebesar 2,74%. Saat model bahasa dibentuk dari penambahan korpus teks spontan terjadi peningkatan akurasi relatif terhadap baseline sebesar 3,59%. Terdapat penurunan akurasi pengenalan ucapan spontan sebesar 0,85% saat dilakukan augmentasi data dibandingkan dengan penambahan korpus teks spontan yang diperoleh secara manual. Penurunan ini dinilai tidak terlalu signifikan dibanding usaha yang harus dilakukan jika mengumpulkan data spontan secara manual.