digilib@itb.ac.id +62 812 2508 8800

33219001 Erna Hikmawati.pdf
PUBLIC Dessy Rondang Monaomi

Perkembangan teknologi saat ini mengakibatkan pertumbuhan data yang semakin besar serta memunculkan tantangan baru yaitu menggali informasi dari data tersebut. Salah satu cara menggali informasi adalah dengan teknik data mining. Association rule merupakan salah satu teknik dalam data mining yang dapat menghasilkan aturan asosiasi berdasarkan frekuensi kemunculan item dari basis data transaksional. Salah satu hal yang kritikal pada Association rule adalah penentuan nilai minimum support yang digunakan untuk menentukan item mana yang akan diikutsertakan dalam pembentukan rule. Jika nilai minimum support yang ditetapkan terlalu kecil menyebabkan terlalu banyak item yang dilibatkan dalam pembentukan rule. Sebaliknya, jika nilai minimum support yang ditetapkan terlalu besar menyebabkan jumlah item yang dilibatkan dalam pembentukan rule terlalu sedikit. Masalah dalam penentuan nilai minimum support ini sangat berpengaruh terhadap jumlah rule yang dihasilkan. Tantangan selanjutnya adalah heterogenitas, kompleksitas dan ukuran data yang ada saat ini membutuhkan solusi inovatif dari ilmu komputer. Sehingga perlu adanya metode Association rule yang dapat menghasilkan rule dari basis data yang heterogen baik dari sumbernya maupun karakteristiknya. Selain itu, dalam banyak kasus Association rule menghasilkan jumlah rule yang sangat besar, yang tidak mungkin bagi penggunanya untuk dipahami atau divalidasi sehingga akan membuat kebingungan dalam pengambilan keputusan. Untuk menangani hal itu setiap rule yang dihasilkan harus dinilai dan diurutkan berdasarkan kriteria-kriteria tertentu sehingga dapat menentukan rule mana yang paling relevan dan menarik. Tujuan dari penelitian ini adalah mengusulkan metode yang dapat menghasilkan adaptive rule yang berasal dari beberapa basis data yang berbeda baik dari internal maupun eksternal, ambang batas yang otomatis dan melibatkan berbagai kriteria untuk menilai prioritas rule. Metode adaptive rule yang dihasilkan dapat diterapkan pada sistem pemberi rekomendasi di berbagai bidang. Input pada metode ini adalah berupa basis data. Salah satu yang berbeda pada metode ini dapat memiliki dua jenis input yaitu basis data internal dan basis data eksternal. Basis data internal yaitu basis data transaksional yang berhubungan langsung dengan proses pembentukan rule. Basis data eksternal yaitu basis data lain yang nyatanya dapat menjadi faktor untuk pengambilan keputusan. Input lain pada metode ini yaitu kriteria yang dipilih untuk menentukan ranking rule dan pemilihan item. Pada metode ini para pengambil keputusan dapat menentukan kriteria mana yang akan dijadikan patokan dalam penyusunan rule dan perankingannya, sehingga setiap orang yang memiliki kriteria yang berbeda akan mendapat rule yang berbeda nantinya walaupun berasal dari basis data transaksi yang sama. Proses utama pada metode ini yaitu pembentukan rule dengan menggunakan metode dasar Association rule tetapi telah dilakukan improvement pada beberapa titik yaitu pada proses penentuan nilai minimum support dan perankingan rule. Nilai minimum support pada metode ini digeneralkan sebagai threshold. Hal ini dilakukan karena pemilihan item dalam pembentukan rule bukan hanya berasal dari support atau frekuensi item tersebut, tetapi berdasarkan kriteria lain yang telah ditentukan oleh pengguna pada tahap sebelumnya. Setelah ditentukan threshold untuk proses pembentukan rule, maka proses selanjutnya pembentukan rule dengan mempertimbangkan kriteria yang sudah ditentukan dan diurutkan berdasarkan threshold tadi sehingga nantinya rule yang dibentuk tidak perlu dilakukan perankingan lagi. Output dari metode ini adalah adaptive rule yaitu rule yang menyesuaikan dengan beberapa keadaaan yang terdiri dari basis data inputnya dan kriteria yang ditentukan oleh pengguna. Rule yang dihasilkan berupa pernyataan kalimat IF x then y yang dapat dituliskan sebagai berikut: X????Y. Metode adaptive rule akan menghasilkan rule yang paling relevan dan menarik bagi pengguna sehingga dapat menjadikan pertimbangan dalam pengambilan keputusan tanpa harus menentukan nilai minimum support dan berasal dari berbagai basis data yang berbeda sumber maupun karakteristiknya. Metode Adaptive Rule memiliki sub modul yang dapat mengurutkan Rule yang dihasilkan berdasarkan lift ratio, tetapi karena jumlah rulenya yang sangat banyak maka proses pembentukan rule nya membutuhkan runtime dan memory usage yang tinggi. Untuk menyempurnakan metode Adaptive Rule, maka disusun strategi pemangkasan dalam proses pembentukan Rule yang dapat menurunkan runtime dan memory usage yaitu metode Adaptive Rule with Average Utility (ADR-AU) dan metode Adaptive Rule with Sorting Utility (ADRSU). Metode ADR-AU mengubah nilai minimum threshold dengan menggunakan nilai rata-rata utilitas item. Metode ADR-SU mengusulkan penambahan langkah pada proses penentuan frequent itemset yaitu dengan mengurutkan nilai utilitas item secara descending sebelum dilakukan proses pengulangan untuk membandingkan apakah nilai utilitas lebih besar dari minimum threshold atau tidak. Tujuannya proses pengulangan dapat langsung dihentikan setelah menemukan item yang nilai utilitasnya tidak lebih besar dari minimum threshold. Hasil dari eksperimen yang dilakukan terhadap 8 dataset, jumlah frequent itemset metode ADR-AU dan ADRSU jauh lebih sedikit jika dibandungkan dengan metode adaptive rule. Selain itu, jika dilihat dari runtime, enam dataset mengalami penurunan runtime antara metode adaptive rule dengan ADR-AU. Dalam hal memory usage, terdapat lima dataset yang mengalami penurunan dari metode adaptive rule ke metode ADR-AU.