Permasalahan kurang lengkapnya pembuatan rekam medis pasien dokter gigi
karena keterbatasan waktu dapat diatasi dengan mengembangkan sistem pengenal
ucapan domain kedokteran gigi untuk menulis rekam medis pasien. Sistem
pengenal ucapan domain kedokteran gigi telah dikembangkan oleh peneliti Islami
& Lestari (2020) dengan menggunakan teknik Convolutional Neural Network
(CNN) untuk mengembangkan model akustik dan teknik n-gram untuk
mengembangkan model bahasa. Didapatkan performansi dengan nilai word error
rate (WER) sebesar 14.47%. Performansi ini dapat ditingkatkan dengan
mengembangkan model akustik dan/atau model bahasa dengan teknik lain dan juga
dengan penanganan permasalahan out of vocabulary (OOV).
Pada penelitian ini dikembangkan model akustik dengan teknik lain yang dapat
meningkatkan performansi dari sistem pengenal ucapan domain kedokteran gigi.
Pada beberapa peneliti pengembangan model akustik dengan teknik Time Delay
Neural Network (TDNN) dan Long Short-Term Memory (LSTM) menghasilkan
performansi yang lebih baik dibandingkan dengan teknik CNN. Kemudian
pengembangan model akustik dengan chain model dapat meningkatkan
performansi dari sistem pengenal ucapan. Sehingga pada penelitian ini
dikembangan model akustik menggunakan CNN, TDNN, LSTM dan penerapan
chain model pada ketiga teknik tersebut. Model Bahasa pada penelitian ini
menggunakan teknik n-gram, dan penanganan permasalahan OOV diatasi dengan
penambahan korpus teks domain kedokteran gigi.
Hasil dari penelitian ini didapatkan bahwa penanganan OOV dengan penambahan
korpus teks domain kedokteran gigi tidak menurunkan nilai OOV secara signifikan.
Pengembangan model akustik dengan teknik TDNN dan LSTM belum bisa
mengungguli teknik baseline (CNN). Pengembangan model akustik dengan chain
model pada teknik TDNN menghasilkan performansi yang bagus dibandingkan
dengan teknik lain dan baseline. Pada TDNN chain didapatkan penurunan WER
sebesar 3.6% dari baseline, dengan nilai WER 10.85%.
Perpustakaan Digital ITB