Perpustakaan Digital - Digilib ITB

ANALISIS METODE BOOTSTRAP UNTUK PEMBANGUNAN PARALLEL CORPUS PADA STATISTICAL MACHINE TRANSLATION

176 views

Penulis	:	Kurniawan Nur Ramadhani, Arry Akhmad Arman
Kontributor / Dosen Pembimbing	:	#CONTRIBUTOR#
Jenis Koleksi	:	Prosiding
Tahun Terbit	:
Penerbit	:
Fakultas	:
Subjek	:
Kata Kunci	:	bootstrap, parallel corpus, phrase based SMT, statistical machine translation
Sumber	:
Staf Input/Edit	:
File	:	1 file
Tanggal Input	:	14 Mar 2014

proceedings knsi 2014 full edition(228).pdf

PUBLIC Open In Flip Book

Kendala utama dalam membangun sebuah mesin translasi berbasis statistik adalah kemampuan untuk menyediakan parallel corpus dengan ukuran yang sebesar-besarnya. Hal ini coba diatasi menggunakan pendekatan Bootstrap. Pada penelitian ini, dilakukan proses bootstrap pada mesin penerjemah yang telah dibangun dengan melakukan proses koreksi kalimat yang diterjemahkan secara salah oleh sistem. Jumlah kalimat yang salah dijadikan parameter untuk mengukur efisiensi dari proses bootstrap. Nilai akurasi didapatkan dari nilai BLEU score untuk proses translasi. Dari hasil penelitian ini, disimpulkan bahwa skema Bootstrap dengan koreksi kalimat memberikan nilai akurasi sebesar 89,91%. Namun skema ini mengharuskan adanya proses koreksi terhadap 52,47% parallel corpus atau sebanyak 787 kalimat dari keseluruhan jumlah kalimat pada corpus.

Perpustakaan Digital ITB

ANALISIS METODE BOOTSTRAP UNTUK PEMBANGUNAN PARALLEL CORPUS PADA STATISTICAL MACHINE TRANSLATION

Artikel Terkait