Rule mining adalah teknik data mining yang digunakan untuk menemukan
hubungan antara dua atau lebih variabel acak. Telah banyak penelitian dilakukan
oleh para ahli untuk meningkatkan kualitas data dengan mengidentifikasi aturan
kualitas data dari sekumpulan data. Metode yang digunakan adalah dengan
menggunakan association rule mining dan pencarian conditional functional
dependencies. Tetapi, adanya kekurangan pada masing-masing teknik yang telah
dilakukan sehingga aturan yang dihasilkan belum memenuhi aturan kualitas data
pada data numerik yang memiliki sebaran data yang besar.
Penelitian ini menggunakan metode clustering dalam tahap preprocess data untuk
mengelompokkan data numerik. Hasil dari pengelompokkan clustering akan
digunakan pada tahap association rule mining dan pencarian conditional functional
dependencies. Association rule mining digunakan untuk mendapatkan aturan
asosiasi antara setiap atribut. Sementara, pencarian conditional functional
dependencies digunakan untuk mendapatkan dependency antar tiap atribut.
Implementasi dilakukan menggunakan data yang berisi data numerik dengan
sebaran data yang besar. Kinerja teknik yang diusulkan diukur dengan
menggunakan accuracy, precision, dan recall. Hasil evaluasi menunjukkan bahwa
metode yang diajukan dapat meningkatkan akurasi hasil aturan pada kondisi data
dengan tipe data numerik.
Perpustakaan Digital ITB