digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Peningkatan kompleksitas dan skala layanan cloud mendorong kebutuhan akan sistem monitoring performa virtual machine (VM) yang adaptif dan cerdas. Salah satu pendekatan yang berkembang pesat adalah pemanfaatan metode machine learning (ML) untuk memprediksi dan mengidentifikasi anomali pada performa VM secara otomatis. Namun, sebagian besar solusi yang ada berfokus pada implementasi skala besar di cloud publik, sehingga belum banyak kajian yang mengeksplorasi alternatif model prediksi performa pada lingkungan cloud dengan sumber daya terbatas. Oleh karena itu, penelitian ini bertujuan mengeksplorasi dan mengevaluasi model prediksi performa VM berbasis machine learning dalam konteks infrastruktur cloud, khususnya untuk prediksi metrik CPU dan RAM. Penelitian ini mengembangkan pipeline observabilitas performa VM yang terdiri atas tiga lapisan, yaitu layer 1 untuk training model dan prediksi metrik time-series, layer 2 untuk analisis residual dan deteksi anomali, serta layer 3 untuk klasifikasi performa dengan Gaussian Mixture Model (GMM). Empat model prediksi utama yang dievaluasi adalah Gated Recurrent Unit (GRU), Temporal Convolutional Network (TCN), dan Extreme Gradient Boosting (XGBoost) dan Long Short-Term Memory (LSTM) sebagai baseline algoritma prediksi data time-series. Data yang digunakan bersumber dari dataset publik, dengan preprocessing meliputi konversi RAM menjadi persentase, normalisasi menggunakan MinMaxScaler (untuk metrik CPU), pembentukan sliding window, serta pembagian data ke dalam set training, validation, dan testing. Evaluasi performa model dilakukan menggunakan metrik MAE, serta analisis residual dengan pendekatan z-score dan health score. Pendekatan klasifikasi menggunakan GMM terbukti efektif dalam memetakan pola residual dan mengelompokkan performa VM secara kuantitatif ke dalam beberapa status. Selain klasifikasi, confidence index yang dikembangkan dalam penelitian ini berfungsi sebagai metrik tambahan untuk mengevaluasi keandalan model secara lebih menyeluruh. Dengan mempertimbangkan akurasi dan kestabilan prediksi, confidence index mampu memberikan gambaran yang lebih utuh terhadap performa tiap model. Berdasarkan hasil tersebut, model TCN dapat disimpulkan sebagai pilihan paling optimal dalam konteks sistem monitoring berbasis prediksi ini. Hasil penelitian menunjukkan bahwa masing-masing model memiliki karakteristik yang berbeda. Model TCN menunjukkan performa paling seimbang antara ketepatan prediksi dan kestabilan klasifikasi, yang tercermin dari perolehan nilai confidence index tertinggi dibandingkan model lainnya. Hal ini menunjukkan bahwa TCN tidak hanya mampu mendeteksi kondisi kritis secara efektif, tetapi juga menjaga konsistensi keputusan dari waktu ke waktu, menjadikannya model yang paling andal untuk digunakan dalam sistem monitoring ini. Sementara itu, model GRU dan XGBoost cenderung bersifat lebih konservatif dengan respons yang lebih lambat terhadap perubahan performa sistem, sedangkan model LSTM menunjukkan ketidakpastian dalam membedakan kondisi normal dan anomali. Temuan ini memperkuat bahwa tidak ada satu model yang unggul dalam semua aspek, dan pemilihan model terbaik sangat bergantung pada kebutuhan sistem. Seluruh pipeline sistem diimplementasikan dalam bentuk dashboard berbasis Streamlit, yang menyajikan visualisasi real-time untuk hasil inferensi model, nilai health score, serta status klasifikasi VM. Antarmuka ini juga dievaluasi menggunakan kerangka System Usability Scale (SUS) untuk mengukur tingkat kemudahan penggunaan dari sisi pengguna akhir. Berdasarkan hasil evaluasi, sistem memperoleh skor 85 yang mengindikasikan kualitas antarmuka yang sangat baik dan mudah digunakan. Penelitian ini memberikan kontribusi dalam bentuk perancangan pipeline monitoring performa VM berbasis AI yang modular dan fleksibel, dengan pendekatan integratif mulai dari prediksi metrik, analisis anomali, hingga klasifikasi performa. Tidak hanya mengevaluasi model prediksi dari sisi akurasi, penelitian ini juga menekankan bagaimana karakteristik masing-masing model mempengaruhi keputusan sistem monitoring secara menyeluruh. Dengan pendekatan tersebut, sistem yang dikembangkan telah menunjukkan kemampuan monitoring performa VM secara efisien dan informatif, dengan desain yang ringan, modular, dan mudah diimplementasikan. Hasil penelitian ini menjadi dasar potensial bagi pengembangan sistem monitoring adaptif berbasis prediksi performa di infrastruktur cloud computing lokal, serta memperluas cakupan riset tentang observabilitas sistem berbasis ML.