Pencemaran udara merupakan permasalahan global yang berdampak signifikan
terhadap kesehatan manusia dan lingkungan. Pandemi COVID-19 menyebabkan
perubahan tidak terduga pada pola kualitas udara, sehingga diperlukan pendekatan
yang dapat menangani perubahan pola data dan keberadaan anomali dalam data.
Penelitian ini bertujuan untuk membuktikan LSTM-XGBoost dapat menghasilkan
kinerja terbaik dalam prediksi kualitas udara pada data time series yang
mengandung anomali akibat selama pandemi COVID-19 dibandingkan XGBoost
dan LSTM secara individu.
LSTM-XGBoost mengintegrasikan LSTM untuk menangkap pola temporal dan
XGBoost untuk memodelkan hubungan non-linear. Data yang digunakan
mencakup konsentrasi polutan udara dan faktor meteorologi dari tahun 2020 hingga
2024 dengan studi kasus di kota Jakarta dan kota Bandung. Pendekatan ini
mencakup penambahan temporal event indicator untuk menandai periode pandemi
COVID-19, PSBB, dan PPKM, serta penerapan anomaly detection menggunakan
Isolation Forest dan LSTM Autoencoder untuk mendeteksi dan menangani anomali
dalam data.
Hasil penelitian menunjukkan bahwa LSTM-XGBoost menghasilkan MAPE
terbaik sebesar 8.56% untuk dataset Jakarta dan 8.74% untuk dataset Bandung,
dengan kinerja yang lebih unggul dibandingkan XGBoost dan LSTM secara
individu. Penambahan temporal event indicator membantu model mengenali
perubahan pola data, serta penerapan anomaly detection memungkinkan model
mengidentifikasi dan mengurangi dampak anomali. LSTM-XGBoost terbukti
menjadi pendekatan terbaik dalam prediksi kualitas udara pada data time series
yang mengandung anomali. Hasil penelitian ini diharapkan dapat berkontribusi
terhadap pengelolaan kualitas udara dan mendukung pengembangan model prediksi
yang responsif terhadap perubahan lingkungan.