Penelitian ini membahas model prediksi beberapa fenomena cuaca menggunakan
model data mining. Algoritma yang akan digunakan adalah algoritma klasifikasi
kNN, Naïve Bayes, ANN dan SVM. Penelitian sebelumnya telah membuktikan
model data mining menggunakan algoritma tesebut sangat baik memprediksi
fenomena cuaca hujan atau tidak hujan. Penelitian ini mencoba memprediksi lebih
dari beberapa cuaca menggunakan satu model.
ekstraksi pengetahuan dari data historis cuaca yang dikumpulkan dari situs rp5.ru.
Ada dua jenis format laporan cuaca, dataset pertama adalah Stasiun Weather
Synoptic dengan 29 atribut, dataset kedua adalah METAR dengan 13 atribut.
Kondisi masing-masing dataset yang inconsistent, maka penelitian ini
menggunakan reduksi fitur dan seleksi fitur menggunakan metode information
gain. Selain itu, dilakukan penyederhanaan kelas untuk menangani distribusi kelas
weather event yang tidak berimbang. Pada dataset sinoptik terdapat 47 fenomena
cuaca dan pada dataset METAR terdapat 25 fenomena cuaca, disederhanakan
menjadi 8 fenomena cuaca pada dataset sinoptik dan 5 fenomena cuaca pada dataset
metar berdasarkan kemiripan fenomena cuaca.
Penelitian ini menggunakan Fscore sebagai variabel pengukuran. Berdasarkan hasil
eksperimen dari model data mining menggunakan algoritma kNN menghasilkan
Fscore lebih baik dibanding algoritma lain. Hasil Fscore eksperimen dataset
METAR yaitu 76.9% menggunakan empat fitur yaitu, kelembaban relatif (U),
tutupan awan (c), tekanan atmosfer pada stasiun pengamatan (Po), dan jarak
pandang horizontal (VV). Hasil Fscore eksperimen dataset stasiun cuaca
pengamatan sinoptik yaitu 75.4% menggunakan fitur sepuluh fitur, yaitu :
kecepatan angin rata-rata (ff) , tutupan awan (N), kelembaban relatif (U), tekanan
atmosfer pada stasiun pengamatan (Po), tekanan atmosfer pada permukaan laut (P),
arah angin (DD), kondisi cuaca sebelum pengamatan 1 dan 2 ( W1 dan W2 ),
kondisi awan cumulonimbus , cumulus, stratus, stratocumulus ( Cl ).
Perpustakaan Digital ITB