Perpustakaan Digital - Digilib ITB

ADAPTASI PENERAPAN LAYER-WISE ADAPTIVE RATE SCALING (LARS) PADA MODEL PEMBELAJARAN MESIN TERDISTRIBUSI

87 views

Penulis	:	Ilham Syahid Syamsudin [23522033]
Kontributor / Dosen Pembimbing	:	Achmad Imam Kistijantoro, S.T, M.Sc., Ph.D.
Jenis Koleksi	:	Tesis
Penerbit	:	Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	batch size, optimasi batch besar, LARS, pelatihan terdistribusi, cosine annealing, sync batch normalization, deteksi objek
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi
File	:	1 file
Tanggal Input	:	26 Jun 2023

23522033_Ilham Syahid Syamsudin.pdf

PUBLIC Dessy Rondang Monaomi

Pembelajaran mesin terdistribusi merupakan salah satu metode dalam mempercepat proses pelatihan dengan memperbesar batch size. Akan tetapi, penggunaan batch size yang besar cenderung menurunkan akurasi dikarenakan jumlah iterasi yang berkurang berdasarkan penelitian sebelumnya. Salah satu metode menangani pengurangan akurasi akibat peningkatan batch size adalah menggunakan LARS. LARS memperkenalkan adanya local adaptive learning rate (LR lokal) yang berbeda tiap layer model. Akan tetapi penelitian LARS masih menggunakan model ResNet-50 dan AlexNet yang relatif sederhana dengan parameter yang sedikit. Penelitian ini melakukan pelatihan menggunakan model Mask-RCNN dengan tugas deteksi dan segmentasi objek pada dataset COCO. Model tersebut memiliki layer dan parameter yang lebih banyak daripada model yang digunakan pada LARS. Adapun metrik yang digunakan adalah mAP. Penelitian ini melakukan tiga eksperimen, yaitu (1) melakukan eksperimen baseline dengan pengaturan yang sama seperti penelitian sebelumnya, (2) melakukan eksperimen menggunakan LARS pada model deteksi objek dengan warm-up dan beberapa LR scheduler, dan (3) melakukan eksperimen menggunakan multi-host dengan batch size besar dan SyncBN. Dari pengujian penelitian ini, menemukan bahwa LR lokal pada model tersebut cenderung meningkat. Oleh karena itu, penelitian ini mengadaptasi LARS pada model yang lebih kompleks dengan mengusulkan framework baru dalam melakukan pelatihan deteksi objek menggunakan warm-up, SyncBN, dan cosine annealing. Cosine annealing digunakan untuk menurunkan LR global pada LARS. Dengan menggabungkannya dengan warm-up dan SyncBN, penelitian ini mendapatkan mAP 38.68 yang melebihi penelitian sebelumnya dengan pengaturan model yang sama.

Perpustakaan Digital ITB

ADAPTASI PENERAPAN LAYER-WISE ADAPTIVE RATE SCALING (LARS) PADA MODEL PEMBELAJARAN MESIN TERDISTRIBUSI

Artikel Terkait