digilib@itb.ac.id +62 812 2508 8800

Penelitian ini membahas model prediksi beberapa fenomena cuaca menggunakan model data mining. Algoritma yang akan digunakan adalah algoritma klasifikasi kNN, Naïve Bayes, ANN dan SVM. Penelitian sebelumnya telah membuktikan model data mining menggunakan algoritma tesebut sangat baik memprediksi fenomena cuaca hujan atau tidak hujan. Penelitian ini mencoba memprediksi lebih dari beberapa cuaca menggunakan satu model. ekstraksi pengetahuan dari data historis cuaca yang dikumpulkan dari situs rp5.ru. Ada dua jenis format laporan cuaca, dataset pertama adalah Stasiun Weather Synoptic dengan 29 atribut, dataset kedua adalah METAR dengan 13 atribut. Kondisi masing-masing dataset yang inconsistent, maka penelitian ini menggunakan reduksi fitur dan seleksi fitur menggunakan metode information gain. Selain itu, dilakukan penyederhanaan kelas untuk menangani distribusi kelas weather event yang tidak berimbang. Pada dataset sinoptik terdapat 47 fenomena cuaca dan pada dataset METAR terdapat 25 fenomena cuaca, disederhanakan menjadi 8 fenomena cuaca pada dataset sinoptik dan 5 fenomena cuaca pada dataset metar berdasarkan kemiripan fenomena cuaca. Penelitian ini menggunakan Fscore sebagai variabel pengukuran. Berdasarkan hasil eksperimen dari model data mining menggunakan algoritma kNN menghasilkan Fscore lebih baik dibanding algoritma lain. Hasil Fscore eksperimen dataset METAR yaitu 76.9% menggunakan empat fitur yaitu, kelembaban relatif (U), tutupan awan (c), tekanan atmosfer pada stasiun pengamatan (Po), dan jarak pandang horizontal (VV). Hasil Fscore eksperimen dataset stasiun cuaca pengamatan sinoptik yaitu 75.4% menggunakan fitur sepuluh fitur, yaitu : kecepatan angin rata-rata (ff) , tutupan awan (N), kelembaban relatif (U), tekanan atmosfer pada stasiun pengamatan (Po), tekanan atmosfer pada permukaan laut (P), arah angin (DD), kondisi cuaca sebelum pengamatan 1 dan 2 ( W1 dan W2 ), kondisi awan cumulonimbus , cumulus, stratus, stratocumulus ( Cl ).