Informasi curah hujan ekstrem sangat penting untuk kehidupan manusia khususnya
di bidang desain rekayasa infrastruktur. Namun, data informasi curah hujan ekstrem
di Indonesia terbatas akibat persebaran stasiun observasi yang hanya berada pada
daerah-daerah tertentu di Indonesia, tidak di setiap titik wilayah. Disisi lain, seiring
perkembangan teknologi terdapat pengembangan data satelit yang memiliki data
curah hujan di setiap titik wilayah dengan perioda data yang panjang salah satu nya
adalah satelit Global Precipitation Measurement (GPM). Akan tetapi, informasi
curah hujan ekstrem dari satelit terbatas khususnya untuk urusan akurasi data.
Padahal data curah hujan yang akurat diperlukan untuk kebutuhan rekayasa
infrastruktur di Indonesia. Pada penelitian ini akan dilakukan koreksi data curah
hujan ekstrem dari satelit GPM menggunakan machine learning.
Penelitian ini menggunakan data curah hujan GPM dan data curah hujan stasiun
observasi dari BMKG untuk mengoreksi data curah hujan ekstrem dengan
menggunakan 3 model machine learning yang berbeda yaitu regresi linear, random
forest, and deep learning. Perhitungan curah hujan ekstrem dilakukan
menggunakan distribusi Gumbel dan periode ulang yang dipasang pada data annual
maxima. Curah hujan ekstrem yang telah terkoreksi melalui proses machine
learning dicari nilai Normalized Root Mean Square Eror (NRMSE) sehingga akan
dihasilkan nilai curah hujan ekstrem dengan periode ulang yang telah dikoreksi.
Hasil penelitian menunjukkan bahwa curah hujan ekstrem dengan periode ulang 5
tahun di Indonesia yang telah dikoreksi melalui proses machine learning dari 3
model machine learning, yaitu regresi linear, random forest, dan deep learning
memiliki nilai eror yang lebih besar daripada sebelum koreksi menggunakan
machine learning. Nilai eror dari curah hujan ekstrem dengan periode ulang 5 tahun
yang telah dikoreksi menggunakan machine learning mengalami kenaikan di
rentang nilai dari 0 hingga 0,25 daripada curah hujan ekstrem sebelum dikoreksi.
Namun, diantara ketiga model tersebut yang menunjukan performa model terbaik
dengan nilai Normalized Root Mean Square Eror (NRMSE) lebih kecil adalah
model machine learning regresi linear.