Penelitian tentang data mining dalam domain spatio-temporal merupakan bidang kajian yang relatif baru. Beberapa teknik data mining telah dikembangkan, diantaranya adalah spatio-temporal association rule mining. Sebagai salah satu teknik dalam spatio-temporal data mining, spatio-temporal association rule merupakan perluasan dari spatial association rule yang mana obyek pencarian pola adalah data spatio-temporal. Data spatio-temporal menyimpan obyek spasial dan perubahannya terhadap batasan waktu. Spatio-temporal association rule terjadi jika terdapat relasi spatio-temporal pada bagian antecedent atau consequent dari sebuah rule.
Fokus utama penelitian ini adalah pengembangan algoritma association rule pada data spasial dengan menambahkan batasan waktu. Dua aspek penting dalam pencarian spatio-temporal association rule adalah prapemrosesan data dan algoritma pembangkitan frequent predicates. Kedua aspek inilah yang menjadi kajian utama dalam penelitian ini. Metode prapemrosesan data berfungsi untuk memproses data sumber yang berupa data spasial dan non-spasial dengan batasan waktu dan menghasilkan data yang siap untuk di-mining. Pembangkitan frequent predicates dilakukan dengan cara membangun sebuah struktur data yang kompak dan algoritma yang efisien untuk mengakses data di dalamnya. Struktur data yang dikembangkan adalah struktur data berbasis FP-Tree untuk data spatio-temporal, dan disebut dengan FP-Tree*. Struktur ini dipilih karena struktur tree mempunyai efisiensi memori yang lebih tinggi dibandingkan dengan bentuk lain karena adanya proses reduksi ukuran data secara signifikan. Setelah FP-Tree* terbangun, kemudian dilakukan pengembangan algoritma untuk mendapatkan spatio-temporal frequent predicates pada tree tersebut. Algoritma yang digunakan adalah pengembangan algoritma berbasis FP-Growth, dan disebut dengan FP-Growth*.
Algoritma ini dipilih karena adanya penghindaran proses pembangkitan kandidat frequent predicates dan penggunaan metode divide and conquer untuk mendekomposisi proses mining yang dapat mengurangi ruang pencarian.
Algoritma-algoritma yang dikembangkan telah dimanfaatkan untuk mendukung proses pengambilan keputusan dengan cara mengintegrasikannya kedalam sebuah perangkat lunak SIG. Sistem ini mampu melakukan analisis data kesehatan dan demografi yang berbasis spatio-temporal dan menghasilkan knowledge dalam bentuk spatio-temporal association rule. Untuk menguji algoritma dan struktur data yang telah ditemukan, dilakukan pengujian waktu komputasi dan kebutuhan memori secara empiris. Uji terhadap association rule yang dihasilkan menggunakan objective interesting measure dan subjective interesting measure.
Berdasarkan hasil keseluruhan penelitian, didapatkan kesimpulan bahwa algoritma yang dikembangkan mampu melakukan pencarian association rule yang melibatkan data spasial dan temporal. Dari kasus uji yang digunakan, algoritma ini mampu menemukan spatio-temporal association rule antara data demografi dan data kesehatan. Association rule yang dihasilkan dapat digunakan untuk proses pengambilan keputusan. Untuk uji waktu komputasi, diperoleh hasil bahwa waktu komputasi dipengaruhi oleh besar kecilnya nilai threshold support, confidence, dan panjang pattern. Semakin tinggi nilai support maka semakin cepat waktu komputasi algoritma. Demikian juga untuk nilai confidence dan panjang pattern. Penambahan waktu eksekusi yang disebabkan oleh penambahan jumlah pattern ini berpola linier sehingga dapat disimpulkan bahwa algoritma FP-Growth* ini skalable. Dibandingkan dengan algoritma yang berbasis Apriori, yaitu Apriori*, waktu komputasi algoritma FP-Growth* jauh lebih cepat daripada algoritma Apriori* untuk panjang pattern (jumlah field) banyak (lebih dari 6). Untuk panjang pattern kurang dari 6, waktu eksekusi algoritma Apriori* lebih cepat dibandingkan algoritma FP-Growth*.
Sebagai tindak lanjut penelitian, algoritma pencarian frequent predicates perlu dikembangkan untuk mendukung task data mining yang lain, yaitu spatio-temporal co-location pattern mining yang berisi pencarian kemiripan sifat-sifat objek pada lokasi dan waktu yang berdekatan (spatial neighborhood dan temporal neighborhood).
Perpustakaan Digital ITB