digilib@itb.ac.id +62 812 2508 8800

Kendala utama dalam membangun sebuah mesin translasi berbasis statistik adalah kemampuan untuk menyediakan parallel corpus dengan ukuran yang sebesar-besarnya. Hal ini coba diatasi menggunakan pendekatan Bootstrap. Pada penelitian ini, dilakukan proses bootstrap pada mesin penerjemah yang telah dibangun dengan melakukan proses koreksi kalimat yang diterjemahkan secara salah oleh sistem. Jumlah kalimat yang salah dijadikan parameter untuk mengukur efisiensi dari proses bootstrap. Nilai akurasi didapatkan dari nilai BLEU score untuk proses translasi. Dari hasil penelitian ini, disimpulkan bahwa skema Bootstrap dengan koreksi kalimat memberikan nilai akurasi sebesar 89,91%. Namun skema ini mengharuskan adanya proses koreksi terhadap 52,47% parallel corpus atau sebanyak 787 kalimat dari keseluruhan jumlah kalimat pada corpus.