Hasil Ringkasan
PREDIKSI KUALITAS UDARA PADA DATA TIME SERIES DENGAN ANOMALI MENGGUNAKAN PENDEKATAN LSTM-XGBOOST TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh AURELL LAYALIA SAFARA AZ -ZAHRA GUNAWAN NIM: 23521091 (Program Studi Magister Informatika) INSTITUT TEKNOLOGI BANDUNG Januari 2025 i ABSTRAK PREDIKSI KUALITAS UDARA PADA DATA TIME SERIES DENGAN ANOMALI MENGGUNAKAN PENDEKATAN LSTM-XGBOOST Oleh Aurell Layalia Safara Az-Zahra Gunawan NIM: 23521091 (Program Studi Magister Informatika) Pencemaran udara merupakan permasalahan global yang berdampak signifikan terhadap kesehatan manusia dan lingkungan. Pandemi COVID-19 menyebabkan perubahan tidak terduga pada pola kualitas udara, sehingga diperlukan pendekatan yang dapat menangani perubahan pola data dan keberadaan anomali dalam data. Penelitian ini bertujuan untuk membuktikan LSTM-XGBoost dapat menghasilkan kinerja terbaik dalam prediksi kualitas udara pada data time series yang mengandung anomali akibat selama pandemi COVID-19 dibandingkan XGBoost dan LSTM secara individu. LSTM-XGBoost mengintegrasikan LSTM untuk menangkap pola temporal dan XGBoost untuk memodelkan hubungan non-linear. Data yang digunakan mencakup konsentrasi polutan udara dan faktor meteorologi dari tahun 2020 hingga 2024 dengan studi kasus di kota Jakarta dan kota Bandung. Pendekatan ini mencakup penambahan temporal event indicator untuk menandai periode pandemi COVID-19, PSBB, dan PPKM, serta penerapan anomaly detection menggunakan Isolation Forest dan LSTM Autoencoder untuk mendeteksi dan menangani anomali dalam data. Hasil penelitian menunjukkan bahwa LSTM-XGBoost menghasilkan MAPE terbaik sebesar 8.56% untuk dataset Jakarta dan 8.74% untuk dataset Bandung, dengan kinerja yang lebih unggul dibandingkan XGBoost dan LSTM secara individu. Penambahan temporal event indicator membantu model mengenali perubahan pola data, serta penerapan anomaly detection memungkinkan model mengidentifikasi dan mengurangi dampak anomali. LSTM-XGBoost terbukti menjadi pendekatan terbaik dalam prediksi kualitas udara pada data time series yang mengandung anomali. Hasil penelitian ini diharapkan dapat berkontribusi terhadap pengelolaan kualitas udara dan mendukung pengembangan model prediksi yang responsif terhadap perubahan lingkungan. Kata Kunci: Deteksi Anomali, LSTM, LSTM-XGBoost, Pandemi COVID-19, Prediksi Kualitas Udara, PM10, XGBoost. ii ABSTRACT AIR QUALITY FORECASTING ON TIME SERIES DATA WITH ANOMALIES USING THE LSTM-XGBOOST APPROACH By Aurell Layalia Safara Az-Zahra Gunawan NIM: 23521091 (Master’s Program in Informatics) Air pollution is a global issue that significantly impacts human health and the environment. The COVID-19 pandemic introduced unexpected changes in air quality patterns, necessitating an approach capable of handling data pattern shifts and anomalies. This study aims to demonstrate that LSTM-XGBoost can achieve the best performance in air quality prediction for time series data containing anomalies during the COVID-19 pandemic, compared to XGBoost and LSTM individually. LSTM-XGBoost integrates LSTM to capture temporal patterns and XGBoost to model non-linear relationships. The dataset used in this study includes air pollutant concentrations and meteorological factors from 2020 to 2024, focusing on case studies in Jakarta and Bandung. This approach incorporates temporal event indicators to mark the COVID-19 pandemic, PSBB, and PPKM periods, as well as anomaly detection using Isolation Forest and LSTM Autoencoder to identify and mitigate anomalies in the data. The results show that LSTM-XGBoost achieves the best MAPE performance, with 8.56% for Jakarta and 8.74% for Bandung, outperforming both XGBoost and LSTM individually. The addition of temporal event indicators enhances the model’s ability to recognize changes in data patterns, while anomaly detection allows the model to identify and reduce the impact of anomalies. LSTM-XGBoost proves to be the most effective approach for predicting air quality in time series data containing anomalies.