Penelitian ini bertujuan untuk mengevaluasi efisiensi dan kinerja metode
Quantized Low Rank Adaptation (QLoRA) dalam pelatihan model pengenalan
suara otomatis (Automatic Speech Recognition/ASR) Bahasa Indonesia. Penelitian
ini menggunakan dataset Mozilla Common Voice 13 Indonesia dan model dasar
Whisper Large V2, dengan penerapan metode fine tuning, LoRA, dan QLoRA.
Evaluasi dilakukan dengan membandingkan Word Error Rate (WER), durasi
pelatihan, biaya pelatihan, dan penggunaan memori GPU pada skenario pelatihan
menggunakan GPU Nvidia T4 dan Nvidia A100. Hasil menunjukkan bahwa
metode QLoRA memberikan efisiensi memori yang signifikan dengan sedikit
kompromi pada akurasi dibandingkan metode full fine-tuning dan LoRA. Selain
itu, metode QLoRA menunjukkan penghematan biaya dan waktu pelatihan yang
substansial, membuatnya menjadi solusi yang efisien untuk pelatihan model ASR
Bahasa Indonesia.