digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Open In Flip Book Dessy Rondang Monaomi

Penelitian ini bertujuan untuk mengevaluasi efisiensi dan kinerja metode Quantized Low Rank Adaptation (QLoRA) dalam pelatihan model pengenalan suara otomatis (Automatic Speech Recognition/ASR) Bahasa Indonesia. Penelitian ini menggunakan dataset Mozilla Common Voice 13 Indonesia dan model dasar Whisper Large V2, dengan penerapan metode fine tuning, LoRA, dan QLoRA. Evaluasi dilakukan dengan membandingkan Word Error Rate (WER), durasi pelatihan, biaya pelatihan, dan penggunaan memori GPU pada skenario pelatihan menggunakan GPU Nvidia T4 dan Nvidia A100. Hasil menunjukkan bahwa metode QLoRA memberikan efisiensi memori yang signifikan dengan sedikit kompromi pada akurasi dibandingkan metode full fine-tuning dan LoRA. Selain itu, metode QLoRA menunjukkan penghematan biaya dan waktu pelatihan yang substansial, membuatnya menjadi solusi yang efisien untuk pelatihan model ASR Bahasa Indonesia.