Indonesia, sebagai negara beriklim tropis, sangat rentan terhadap penyebaran virus
DBD karena kondisi iklim yang mendukung perkembangan nyamuk Aedes aegypti
sebagai vektor utama. Hal tersebut juga didukung oleh jumlah kasus DBD yang tinggi
di Indonesia menunjukkan bahwa pencegahan DBD sangat penting. Karena itu, penulis
ingin membuat peta risiko kasus DBD yang dapat menunjukkan wilayah yang rawan
DBD. Dalam pembuatan peta risiko, data yang digunakan penulis mencakup data
iklim dan jumlah kasus DBD. Dari data iklim, penulis membangun sebuah model
matematika yang dapat mengestimasi jumlah nyamuk Aedes aegypti. Selanjutnya,
penulis menggunakan model klasifikasi machine learning, seperti random forest, extra
trees, gradient boosting, dan xgboost, untuk memprediksi kemungkinan terjadi KLB
di wilayah tertentu. Status KLB didefinisikan berdasarkan data jumlah kasus DBD
dengan kriteria yang bervariasi di setiap wilayah. Wilayah yang berpotensi mengalami
KLB akan diberi status KLB 1 (label positif), sedangkan wilayah yang tidak berpotensi
akan diberi status KLB 0 (label negatif). Selanjutnya, karena distribusi data untuk
masing-masing label tidak seimbang, penulis menggunakan teknik resampling data
seperti random over sampling, smote, k-means smote, svmsmote, dan borderline smote.
Terakhir, penulis menggunakan beberapa metriks evaluasi untuk mengukur kinerja
model dan memilih model dengan metriks evaluasi terbaik. Hasil akhir dari model
klasifikasi tesebut adalah estimasi probabilitas terjadi KLB yang kemudian dengan
menggunakan threshold 0.5 ditetapkan menjadi status KLB yaitu 0 atau 1. Dari hasil
estimasi probabilitas KLB, penulis membuat peta risiko kasus DBD untuk DKI Jakarta
dan Bali untuk memberikan pemahaman terkait mitigasi DBD di Indonesia.