Tantangan dalam pengukuran efisiensi energi merupakan hal yang tidak mudah
karena terdapat banyak faktor yang dapat mempengaruhinya. Masalah ini dapat
diatasi dengan membangun model prediktif untuk memperkirakan kebutuhan
bangunan di masa akan datang. Hasil prediksi tersebut akan dibandingkan dengan
konsumsi energi bangunan yang sudah diperbaiki untuk menghitung penghematan.
Namun dengan cukup masifnya data maka muncul beberapa permasalahan yang
menyebabkan kualitas data menurun sehingga berdampak buruknya ketepatan
model dalam memprediksi dan kurangnya scalability dari segi penggunaan memori
jika data semakin besar. Permasalahan tersebut dapat diatasi dengan penerapan
teknik reduksi data dan ensemble learning
Pada tugas akhir ini telah melakukan penelitian pada reduksi data dan ensemble
learning untuk mengatasi permasalahanan kurangnya kualitas data dan besarnya
ukuran data. Reduksi data adalah teknik mengurangi ukuran data baik dari jumlah
sampel maupun jumlah fitur tanpa mengurangi ketepatan model. Teknik reduksi
data yang akan dilakukan adalah numerosity reduction dan dimensionality
reduction. Teknik ensemble learning menggabungkan beberapa model prediktif
untuk menjadi sebuah model gabungan. Untuk ensemble learning yang akan
dilakukan adalah dengan menggunakan model LightGBM yang berbasis boosting
dan juga akan menambahkan teknik bagging yang akan dibandingkan dengan
incremental learning. Data yang ada akan dilakukan tahapan preprocessing dan
feature engineering agar dapat meningkatkan ketepatan model.Teknik terbaik akan
dipilih berdasarkan suatu metrik RMSE. Model yang terbaik dioptimasi dengan
parameter tuning untuk mendapatkan ketepatan prediksi lebih optimal.
Setelah dilakukan eksperimen didapat reduksi data yaitu numerosity reduction
dengan teknik stratified sampling dapat meningkatkan kecepatan menjadi 2,67 kali
lebih cepat dengan menjaga ketepatan prediksi. Untuk dimensionality reduction
yaitu dengan PCA dan ICA dapat meningkatkan kecepatan menjadi 1,15 kali lebih
cepat tanpa menyebabkan penurunan ketepatan prediksi yang signifikan. Selain itu
didapat model dengan ensemble learning yaitu bagging memiliki kinerja dari segi
RMSE dan kecepatan yang paling baik dengan RMSE 262,304 dan 1,67 kali lebih
cepat dari model dengan incremental learning.