Perkembangan sistem Speech-to-Text (STT) telah membuka peluang pencatatan otomatis dalam rekaman pertemuan, namun tantangan utama masih ditemukan pada faktor lingkungan seperti tingkat kebisingan dan jenis mikrofon. Penelitian ini bertujuan mengevaluasi performa sistem STT berbasis Azure Speech dalam aplikasi web, dengan fokus pada analisis pengaruh variasi noise dan tipe mikrofon terhadap akurasi transkripsi.
Pengujian dilakukan menggunakan empat jenis mikrofon (built-in laptop, meeting, podcast, dan TWS) pada berbagai tingkat kebisingan buatan. Data sinyal suara diukur menggunakan Sound Level Meter untuk memperoleh parameter amplitudo, dB, dan Signal-to-Noise Ratio (SNR), sementara akurasi transkripsi dievaluasi menggunakan Word Error Rate (WER). Hasil eksperimen menunjukkan penurunan performa STT seiring peningkatan kebisingan, terutama pada mikrofon internal, sedangkan mikrofon eksternal menunjukkan hasil yang lebih stabil.
Aplikasi web yang dikembangkan mendukung transkripsi real-time dan ekspor hasil ke format PDF. Berdasarkan feedback dari beberapa pengguna di perusahaan mitra yang sudah pernah menjalin kerjasama, fitur export transcript ke dalam bentuk PDF sangat membantu dalam dokumentasi rapat. Temuan ini menegaskan pentingnya pemilihan perangkat keras serta pengelolaan lingkungan audio, dan memberikan rekomendasi untuk pengembangan sistem STT yang lebih adaptif di masa depan.
Penelitian ini memberikan kontribusi pada pemahaman keterbatasan sistem STT dalam kondisi noise tinggi serta menawarkan rekomendasi untuk perbaikan di masa mendatang, baik dari sisi perangkat keras maupun penerapan algoritma pengurangan noise.