Jakarta dan Bandung sebagai wilayah urban dengan variabilitas curah hujan tinggi rentan
terhadap bencana hidrometeorologi seperti banjir dan kekeringan, dipengaruhi fenomena
iklim seperti ENSO, IOD, dan MJO. Prediksi curah hujan S2S mengisi celah antara
prakiraan cuaca dan musiman, namun model numerik global seperti CanCM3, CanCM4,
FLORB, dan CCSM4 memiliki keterbatasan dalam menangkap variabilitas lokal.
Penelitian ini bertujuan menyusun dan mengevaluasi model prediksi menggunakan
algoritma gradient boosting untuk meningkatkan performa S2S.
Penelitian menggunakan data observasi MSWEP sebagai referensi dan data model iklim
periode 1982-2011. Data diproses melalui preprocessing, pembagian temporal training
(1982-2002) dan testing (2003-2011), serta implementasi tiga varian gradient boosting
(CatBoost, LightGBM, XGBoost) dengan konfigurasi baseline. Evaluasi dilakukan
menggunakan metrik bias, MAE, RMSE, dan korelasi, dengan analisis keseluruhan, per
lead time, per musim, serta time series.
Hasil menunjukkan model global memiliki bias signifikan, dengan CanCM3 terbaik di
Jakarta dan error lebih tinggi di Bandung. Algoritma gradient boosting memberikan
perbaikan beragam, di mana CatBoost unggul dalam mengurangi bias sistematis. Namun,
korelasi tetap rendah hingga sedang, dengan degradasi performa seiring lead time (terbaik
di Lead 0) dan kesulitan menangkap ekstrem, menghasilkan prediksi lebih halus. Analisis
time series menunjukkan kemampuan mengikuti tren musiman, meskipun dengan deviasi
pada puncak hujan.
Gradient boosting memberikan perbaikan incremental, tetapi masih terbatas untuk
akurasi operasional. Saran mencakup hyperparameter tuning mendalam menggunakan
Grid Search atau Bayesian Optimization, serta perpanjangan periode evaluasi dengan
temporal cross-validation.
Perpustakaan Digital ITB