digilib@itb.ac.id +62 812 2508 8800

Abstrak
Terbatas  Dewi Supryati
» Gedung UPT Perpustakaan

PT MAS adalah perusahaan yang memproduksi dan mendistribusikan vaksin. Perusahaan menghadapi kesulitan dalam operasionalnya dalam menentukan alokasi vaksin yang tepat untuk berbagai segmen konsumen, terutama ketika ada permintaan mendadak atau perubahan prioritas. Ketidakpastian ini dapat menyebabkan distribusi yang tidak efisien dan pemenuhan kebutuhan vaksin di setiap segmen. Peneliti mengusulkan penggunaan sistem pendukung keputusan dengan menggunakan algoritma reinforcement learning, yaitu A2C (Advantage Actor–Critic) untuk meningkatkan pembelajaran menggunakan simulasi harian. Ini memastikan FEFO (First Expired First Out), eligibility, dan pemisahan stok per produk. Data operasional dalam rentang dua tahun digunakan untuk melatih dan menguji kebijakan dengan fungsi reward yang menyeimbangkan layanan, risiko kedaluwarsa, sisa stok, dan prioritas pemerintah. Peneliti juga melakukan uji skenario untuk melihat dampak perubahan permintaan, rilis, dan bobot reward. Sementara framework CRISP-DM (Cross Industry Standard Process for Data Mining) digunakan dalam perancangan data mining. Hasil menunjukkan bahwa A2C mencapai tingkat fill-rate 100% untuk Pemerintah, PEI, dan PEB dengan jumlah expired adalah nol, sementara swasta menurun pada hari-hari ketika stok dengan RSL 6 hingga 17 bulan tidak mencukupi. Hasil akhir sistem berupa prototipe yang dapat digunakan oleh perusahaan untuk melakukan simulasi permintaan, sehingga keputusan dapat dijalankan secara cepat dan hasilnya dapat terevaluasi menggunakan tiga indikator, yaitu fill rate, expired, dan jumlah vaksin tidak teralokasikan.