digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Open In Flipbook Dessy Rondang Monaomi

Valuasi data adalah proses untuk menilai value dari suatu data ketika digunakan untuk melatih suatu model untuk mengerjakan suatu task atau benchmark tertentu. Semakin tinggi performa model dalam mengerjakan task tersebut, maka semakin tinggi pula value dari data yang digunakan untuk melatih model tersebut. Namun, proses valuasi data sendiri tidaklah murah, khususnya untuk metode valuasi data berbasis gradien. Metode tersebut menghitung dan menyimpan gradien data latih dan data uji, untuk kemudian dihitung kedekatannya. Semakin besar nilai kedekatan antar gradien tersebut, maka semakin besar pula value dari data latih tersebut. Dikarenakan besarnya gradien yang perlu dikomputasi dan disimpan berbanding lurus dengan jumlah parameter model dan jumlah data, maka metode ini sangat tidak efisien diterapkan pada model berukuran besar seperti Large Language Model (LLM). Dua pendekatan yang umum diterapkan untuk mengurangi ukuran model serta ukuran gradien adalah kompresi model dan kompresi gradien. Masing-masing metode tersebut bertugas untuk mengompresi ukuran model dan gradien. Berangkat dari penelitian valuasi data berbasis gradien skala LLM terkini yakni LESS (Low-rank gradiEnt Similarity Search) yang telah menerapkan metode kompresi model berupa LoRA (Low-Rank Adaptation), penelitian ini berupaya untuk menerapkan teknik kompresi model lainnya serta kompresi gradien untuk membuat proses valuasi data semakin efisien. Khususnya penelitian ini menerapkan metode kompresi berupa kuantisasi pada model LLM dan pada gradien. Eksperimen dilakukan dengan menilai value dari tiap data pada dataset latih Flan v2, COT, Dolly, dan OASST1 terhadap dataset uji TyDiQA, MMLU, dan BBH. Kemudian dilakukan pelatihan menggunakan data dengan value tertinggi. Hasil eksperimen menunjukkan penggunaan kuantisasi pada valuasi dan seleksi data meningkatkan kinerja model lebih dari model dengan data random. Seleksi data tetap efektif meskipun dengan kuantisasi gradien yang ekstrim seperti 1-bit yang iii memberikan peluang besar untuk valuasi data yang murah dan efisien untuk model berskala besar.