digilib@itb.ac.id +62 812 2508 8800

Permasalahan kurang lengkapnya pembuatan rekam medis pasien dokter gigi karena keterbatasan waktu dapat diatasi dengan mengembangkan sistem pengenal ucapan domain kedokteran gigi untuk menulis rekam medis pasien. Sistem pengenal ucapan domain kedokteran gigi telah dikembangkan oleh peneliti Islami & Lestari (2020) dengan menggunakan teknik Convolutional Neural Network (CNN) untuk mengembangkan model akustik dan teknik n-gram untuk mengembangkan model bahasa. Didapatkan performansi dengan nilai word error rate (WER) sebesar 14.47%. Performansi ini dapat ditingkatkan dengan mengembangkan model akustik dan/atau model bahasa dengan teknik lain dan juga dengan penanganan permasalahan out of vocabulary (OOV). Pada penelitian ini dikembangkan model akustik dengan teknik lain yang dapat meningkatkan performansi dari sistem pengenal ucapan domain kedokteran gigi. Pada beberapa peneliti pengembangan model akustik dengan teknik Time Delay Neural Network (TDNN) dan Long Short-Term Memory (LSTM) menghasilkan performansi yang lebih baik dibandingkan dengan teknik CNN. Kemudian pengembangan model akustik dengan chain model dapat meningkatkan performansi dari sistem pengenal ucapan. Sehingga pada penelitian ini dikembangan model akustik menggunakan CNN, TDNN, LSTM dan penerapan chain model pada ketiga teknik tersebut. Model Bahasa pada penelitian ini menggunakan teknik n-gram, dan penanganan permasalahan OOV diatasi dengan penambahan korpus teks domain kedokteran gigi. Hasil dari penelitian ini didapatkan bahwa penanganan OOV dengan penambahan korpus teks domain kedokteran gigi tidak menurunkan nilai OOV secara signifikan. Pengembangan model akustik dengan teknik TDNN dan LSTM belum bisa mengungguli teknik baseline (CNN). Pengembangan model akustik dengan chain model pada teknik TDNN menghasilkan performansi yang bagus dibandingkan dengan teknik lain dan baseline. Pada TDNN chain didapatkan penurunan WER sebesar 3.6% dari baseline, dengan nilai WER 10.85%.