Dalam mengatasi permasalahan kurang lengkapnya pembuatan rekam medis dokter gigi karena
keterbatasan waktu dikembangkan sebuah sistem pengenal suara domain kedokteran gigi untuk
menulis rekam medis pasien. Diperlukan korpus suara dan korpus teks domain kedokteran gigi
serta teknik yang tepat dalam membangun model akustik untuk sistem pengenal suara. Pada
tugas akhir ini membahas mengenai pembangunan korpus suara dan korpus teks domain
kedokteran gigi serta pembangunan model akustik dan model bahasa untuk menjadi solusi dari
permasalahan tersebut.
Korpus teks domain kedokteran gigi didapatkan dari skenario rekam medis yang
dikembangkan oleh dokter gigi. Korpus suara didapatkan dengan melakukan perekaman suara
kepada 100 orang yang mana setiap orang mengucapkan teks yang telah ditentukan. Pada tugas
akhir ini dalam membangun model akustik dilakukan perbandingan antara teknik GMM-HMM
dan teknik CNN-HMM untuk memilih teknik yang terbaik.
Korpus teks dan korpus suara yang telah dikumpulkan kemudian dijadikan sebagai masukan
dalam pengembangkan sistem pengenal suara. Pembangunan model akustik menggunakan
teknik GMM-HMM dan CNN-HMM. Pengujian sistem dilakukan dengan menghitung nilai
word error rate (WER), semakin rendah nilai WER akan semakin bagus sistem tersebut.
Model akustik yang telah dikembangkan dievaluasi dan dibandingkan nilai WER. Nilai WER
pada teknik CNN-HMM menghasilkan penurunan 8.61% dibandingkan teknik GMM-HMM.
Solusi dari tugas akhir ini menggunakan teknik CNN-HMM karena memiliki performa yang
lebih baik dari GMM-HMM.