digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Kemajuan teknologi komputasi awan menuntut metode pengelolaan sumber daya komputasi yang optimal. Kubernetes sebagai platform orkestrasi kontainer dapat digunakan untuk mengelola deployment dari aplikasi microservice. Namun, fitur autoscaling pada Kubernetes masih terbatas pada metrik tingkat rendah seperti penggunaan CPU dan memori. Padahal, metrik tingkat tinggi seperti SLOs lebih krusial karena dapat mencerminkan kebutuhan kinerja aplikasi secara keseluruhan. Fitur autoscaling pada Kubernetes juga masih belum memanfaatkan informasi dari aplikasi seperti traffic aplikasi di masa lalu. Hal ini membuat autoscaling masih bersifat reaktif yang dapat menurunkan availability dari aplikasi. Untuk mengatasi permasalahan tersebut, dikembangkan sistem autoscaling proaktif yang memanfaatkan informasi aplikasi, yaitu pola traffic aplikasi, dan menggunakan metrik tingkat tinggi, yaitu SLO latensi ekor. Sistem ini dikembangkan dengan memanfaatkan model deret waktu PatchTST untuk meramalkan traffic dan model regresi neural network untuk memprediksi latensi ekor dari masing-masing service. Penentuan jumlah replika ditentukan berdasarkan rasio latensi ekor dengan ambang batas SLO. Hasil pengujian menunjukkan bahwa sistem autoscaling yang dikembangkan dapat meningkatkan availability aplikasi jika dibandingkan dengan HPA sebesar 0,0411%, yaitu dari 99,7402% menjadi 99,7813%. Sistem autoscaling juga dapat menurunkan rata-rata latensi ekor dari 302,05 ms menjadi 277,62 ms, walaupun belum dapat menurunkannya hingga di bawah ambang batas. Rasio latensi ekor dengan ambang batas SLO menunjukkan osilasi jumlah replika sehingga dinilai tidak efektif sebagai penentu jumlah replika.