digilib@itb.ac.id +62 812 2508 8800

Tantangan dalam pengukuran efisiensi energi merupakan hal yang tidak mudah karena terdapat banyak faktor yang dapat mempengaruhinya. Masalah ini dapat diatasi dengan membangun model prediktif untuk memperkirakan kebutuhan bangunan di masa akan datang. Hasil prediksi tersebut akan dibandingkan dengan konsumsi energi bangunan yang sudah diperbaiki untuk menghitung penghematan. Namun dengan cukup masifnya data maka muncul beberapa permasalahan yang menyebabkan kualitas data menurun sehingga berdampak buruknya ketepatan model dalam memprediksi dan kurangnya scalability dari segi penggunaan memori jika data semakin besar. Permasalahan tersebut dapat diatasi dengan penerapan teknik reduksi data dan ensemble learning Pada tugas akhir ini telah melakukan penelitian pada reduksi data dan ensemble learning untuk mengatasi permasalahanan kurangnya kualitas data dan besarnya ukuran data. Reduksi data adalah teknik mengurangi ukuran data baik dari jumlah sampel maupun jumlah fitur tanpa mengurangi ketepatan model. Teknik reduksi data yang akan dilakukan adalah numerosity reduction dan dimensionality reduction. Teknik ensemble learning menggabungkan beberapa model prediktif untuk menjadi sebuah model gabungan. Untuk ensemble learning yang akan dilakukan adalah dengan menggunakan model LightGBM yang berbasis boosting dan juga akan menambahkan teknik bagging yang akan dibandingkan dengan incremental learning. Data yang ada akan dilakukan tahapan preprocessing dan feature engineering agar dapat meningkatkan ketepatan model.Teknik terbaik akan dipilih berdasarkan suatu metrik RMSE. Model yang terbaik dioptimasi dengan parameter tuning untuk mendapatkan ketepatan prediksi lebih optimal. Setelah dilakukan eksperimen didapat reduksi data yaitu numerosity reduction dengan teknik stratified sampling dapat meningkatkan kecepatan menjadi 2,67 kali lebih cepat dengan menjaga ketepatan prediksi. Untuk dimensionality reduction yaitu dengan PCA dan ICA dapat meningkatkan kecepatan menjadi 1,15 kali lebih cepat tanpa menyebabkan penurunan ketepatan prediksi yang signifikan. Selain itu didapat model dengan ensemble learning yaitu bagging memiliki kinerja dari segi RMSE dan kecepatan yang paling baik dengan RMSE 262,304 dan 1,67 kali lebih cepat dari model dengan incremental learning.