digilib@itb.ac.id +62 812 2508 8800

Pada awalnya data mining belum dapat menangani data yang bersifat stream (data yang terus-menerus bertambah dan semakin cepat laju pertambahannya), namun sekarang muncul kebutuhan untuk dapat menyelesaikan permasalahan data stream. Banyak peneliti melakukan penelitian sehingga data mining dapat menangani permasalahan data streams. Hal ini dikenal sebagai mining data stream. Dalam data streams juga terdapat permasalahan yang lain yaitu concept drift (perubahan konsep pada model yang telah dibangun). Pada tahun 2001, sebuah algoritma yang diberi nama Streaming Ensemble Algorithm (SEA), dibuat oleh W. Nick Street dan YongSeog Kim dikembangkan untuk menangani permasalahan data streams dan concept drift pada data mining dengan tugas klasifikasi. SEA merupakan perkembangan dari metode ensemble. SEA dalam menangani data streams adalah dengan cara selalu melakukan pembelajaran pada blok-blok data yang terkini. Untuk menangani concept drift, SEA melakukannya dengan cara menggantikan base classifier yang sudah tidak sesuai konsepnya dengan classifier yang lebih tepat. Perangkat lunak SEA yang dibangun menggunakan paradigma pengembangan unified process. Perangkat lunak ini diuji melalui metode black-box. Eksperimen dilakukan untuk mengetahui pengaruh parameter-parameter pada SEA terhadap akurasi, banyaknya terjadi concept drift, lamanya waktu pelatihan, dan kebutuhan memory. Data yang digunakan untuk melakukan eksperimen ini adalah mengenai apakah pendapatan melebihi $50K/yr berdasarkan data census. Dari hasil eksperimen diperoleh tingkat akurasi 83,09% untuk data pelatihan, dan akurasi data test 82,46%.