Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Kemajuan teknologi komputasi awan menuntut metode pengelolaan sumber daya
komputasi yang optimal. Kubernetes sebagai platform orkestrasi kontainer dapat
digunakan untuk mengelola deployment dari aplikasi microservice. Namun, fitur
autoscaling pada Kubernetes masih terbatas pada metrik tingkat rendah seperti
penggunaan CPU dan memori. Padahal, metrik tingkat tinggi seperti SLOs lebih
krusial karena dapat mencerminkan kebutuhan kinerja aplikasi secara keseluruhan.
Fitur autoscaling pada Kubernetes juga masih belum memanfaatkan informasi dari
aplikasi seperti traffic aplikasi di masa lalu. Hal ini membuat autoscaling masih
bersifat reaktif yang dapat menurunkan availability dari aplikasi.
Untuk mengatasi permasalahan tersebut, dikembangkan sistem autoscaling proaktif
yang memanfaatkan informasi aplikasi, yaitu pola traffic aplikasi, dan
menggunakan metrik tingkat tinggi, yaitu SLO latensi ekor. Sistem ini
dikembangkan dengan memanfaatkan model deret waktu PatchTST untuk
meramalkan traffic dan model regresi neural network untuk memprediksi latensi
ekor dari masing-masing service. Penentuan jumlah replika ditentukan berdasarkan
rasio latensi ekor dengan ambang batas SLO.
Hasil pengujian menunjukkan bahwa sistem autoscaling yang dikembangkan dapat
meningkatkan availability aplikasi jika dibandingkan dengan HPA sebesar
0,0411%, yaitu dari 99,7402% menjadi 99,7813%. Sistem autoscaling juga dapat
menurunkan rata-rata latensi ekor dari 302,05 ms menjadi 277,62 ms, walaupun
belum dapat menurunkannya hingga di bawah ambang batas. Rasio latensi ekor
dengan ambang batas SLO menunjukkan osilasi jumlah replika sehingga dinilai
tidak efektif sebagai penentu jumlah replika.