digilib@itb.ac.id +62 812 2508 8800

2007 TS PP CUT FIARNI 1-COVER.pdf

File tidak tersedia

2007 TS PP CUT FIARNI 1-BAB 1.pdf
File tidak tersedia

2007 TS PP CUT FIARNI 1-BAB 2.pdf
File tidak tersedia

2007 TS PP CUT FIARNI 1-BAB 3.pdf
File tidak tersedia

2007 TS PP CUT FIARNI 1-BAB 4.pdf
File tidak tersedia

2007 TS PP CUT FIARNI 1-BAB 5.pdf
File tidak tersedia

2007 TS PP CUT FIARNI 1-PUSTAKA.pdf
File tidak tersedia

Suatu sistem Speech recognition (SR) yang berkualitas paling tidak dilatih menggunakan corpus yang terdiri dari ratusan ribu atau lebih sampel ucapan dan diucapkan oleh ratusan sampai ribuan pengucap. Dalam pembuatan corpus untuk suatu sistem SR, dibutuhkan segmentasi dalam menandai sinyal ucapan untuki masing-masing satuan bahasa berdasarkan satuan waktu dari seluruh file data latih secara manual. Dengan demikian, usaha untuk mengembangkan suatu corpus yang berkualitas akan memerlukan sumber daya dan biaya yang sangat besar.Salah satu cara untuk mempercepat pengembangan corpus tersebut adalah menggunakan pendekatan iteratif dengan HTK. Pada pendekatan ini, corpus volume kecil dikembangkan dengan penandaan yang sepenuhnya dilakukan secara manual. Selanjutnya, corpus kecil tersebut digunakan untuk mengenali dan menandai secara otomatis sejumlah kata atau kalimat yang akan digunakan untuk isi corpus berikutnya. Hasil pengenalannya akan dikoreksi secara manual dan digabungkan dengan corpus pertama yang ditandai sepenuhnya secara manual. Corpus gabungan ini akan digunakan untuk mengenali lagi isi corpus berikutnya, hasilnya dikoreksi lagi secara manual dan digabungkan. Dengan demikian, secara gradual diperoleh corpus yang semakin besar volumenya. Pada penelitian ini, dilakukan pengembangan corpus SR berbahasa Indonesia yang terdiri dari 10860 file data ucap menggunakan pendekatan iteratif.Dari hasil analisis dan pengukuran menunjukan bahwa akurasi sistem mencapai 95,28%. Dari hasil yang diperoleh tersebut, dapat disimpulkan bahwa pembuatan corpus secara iteratif menghasilkan performa yang baik serta lebih efisien dibandingkan dengan labeling secara manual.