Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Dengan meningkatnya popularitas data mining pada era ini, terdapat juga
kekhawatiran tentang privasi data, terutama tentang re-identification. Salah satu
solusi untuk masalah privasi berikut merupakan data anonymization, dimana data
dilakukan modifikasi agar tidak bisa dilakukan re-identification dan menjaga
privasi individu. Sebuah masalah utama adalah dari data anonymization adalah
modifikasi yang dilakukan akan menurunkan kinerja dari data mining. Tugas Akhir
ini bertujuan melakukan studi atas teknik data anonymization yang menjaga privasi
data tanpa menghambat kegiatan data mining secara berlebihan.
Penelitian ini dilakukan dengan mengimplementasi 3 teknik data anonymization
yaitu data generalization, data perturbation, dan data masking kepada tiga dataset
berbeda yaitu Bank Marketing, Adult Income, dan Customer Segmentation. Lalu
dilakukan perbandingan dan analisis atas hasil data mining yang dilakukan kepada
dataset setelah dilakukan anonimisasi dengan 3 model berbeda serta mengevaluasi
efektivitas teknik data anonymization dalam menyelesaikan masalah privasi.
Hasil analisis menunjukkan bahwa data generalization memiliki kinerja yang baik
untuk privasi namun menghambat data mining secara signifikan, contohnya dengan
penurunan sebesar 34% pada salah satu dataset, sementara data perturbation dan
data masking tidak memiliki garansi privasi sekuat data generalization tetapi tidak
menghambat data mining terlalu signifikan dengan penurunan 15% dan 6%
masing-masing untuk dataset yang sama.