STACKING MODEL DAN OPTIMASI HYPERPARAMETER MENGGUNAKAN ALGORITMA GENETIK UNTUK SALES FORECASTING TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh Dian Swastiani NIM: 23521088 (Program Studi Magister Informatika) INSTITUT TEKNOLOGI BANDUNG Februari 2024 ABSTRAK STACKING MODEL DAN OPTIMASI HYPERPARAMETER MENGGUNAKAN ALGORITMA GENETIK UNTUK SALES FORECASTING Oleh Dian Swastiani NIM: 23521088 (Program Studi Magister Informatika) Pada penelitian ini dibahas bahas bagaimana cara memprediksi penjualan (sales forecasting) menggunakan stacking model dan mengoptimasi hyperparameter. Penjualan yang dibahas merupakan penjualan dari salah satu toko buku di Surabaya yaitu Sbybookshop. Dengan banyaknya pesaing penjual buku, maka dilakukan salah satu strategi bisnis yaitu sales forecasting. Sales Forecasting dapat menggunakan beberapa teknik prediksi sperti machine learning. Menggunakan satu algoritma saja tidak cukup dalam menyelesaikan masalah sales forecasting karena data penjualan yang kompleks, fluktuatif, dan pola data yang tidak teratur. Karena itu Sales forecasting dilakukan dengan stacking model yang menggabungkan beberapa algoritma yaitu, Random Forest, XGBoost, dan LightGBM pada base learner dan Regresi linear pada meta learner. Karena ketiga algoritma base leaner tersebut memiliki hyperparameter yang banyak, digunakan algoritma genetik untuk mendapatkan hyperparameter yang optimal dan efisien. Hal ini dibuktikan dengan hasil eksperimen optimasi hyperparameter menggunakan algoritma genetik pada ketiga base learner menghasilkan 30 kali lebih cepat dibandingkan menggunakan grid search. Eksperimen pada penelitian dilakukan menggunakan dua dataset yang berbeda yaitu data sbybookshop dan online retail dengan langkah-langkah eksperimen yang sama. Eksperimen pada dataset sbybookshop menggunakan LightGBM menghasilkan rata-rata error metrics sebesar 0.17 dan menggunakan Stacking dengan meta learner regresi linear menghasilkan rata-rata error 0.18. Sementara Random Forest dan XGBoost menghasilkan rata-rata error lebih dari 0.19. Kinerja optimasi hyperparameter berpengaruh dalam menurunkan error sehingga kinerja lebih baik dibandingkan menggunakan parameter default. Rata-rata penurunan error sebesar 13% sampai 21%. Eksperimen menggunakan dataset online retail menghasilkan rata-rata terkecil pada penggunaan LightGBM dan Stacking, serta waktu komputasi yang lebih cepat saat optimasi hyperparameter menggunakan algoritma genetik. Hal ini membuktikan metode pada penelitian ini dapat diimplementasikan di data yang berbeda. Kata kunci: sales forecasting, stacking, random forest, xgboost, lightgbm, hyperparameter, genetic algorithm i ABSTRACT SALES FORECASTING USING STACKING MODEL AND HYPERPARAMETER OPTIMIZATION USING GENETIC ALGORITHM By Dian Swastiani NIM: 23521088 (Master’s Program in Informatics) This study discusses how to predict sales (sales forecasting) using a stacking model and hyperparameter optimization. The sales data analyzed comes from a bookstore in Surabaya, Sbybookshop. Due to the high competition among book retailers, one of the business strategies applied is sales forecasting. Sales forecasting can be performed using various predictive techniques, such as machine learning. Using a single algorithm is not sufficient to solve sales forecasting problems because sales data is complex, fluctuating, and has irregular patterns.