digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Dengan meningkatnya popularitas data mining pada era ini, terdapat juga kekhawatiran tentang privasi data, terutama tentang re-identification. Salah satu solusi untuk masalah privasi berikut merupakan data anonymization, dimana data dilakukan modifikasi agar tidak bisa dilakukan re-identification dan menjaga privasi individu. Sebuah masalah utama adalah dari data anonymization adalah modifikasi yang dilakukan akan menurunkan kinerja dari data mining. Tugas Akhir ini bertujuan melakukan studi atas teknik data anonymization yang menjaga privasi data tanpa menghambat kegiatan data mining secara berlebihan. Penelitian ini dilakukan dengan mengimplementasi 3 teknik data anonymization yaitu data generalization, data perturbation, dan data masking kepada tiga dataset berbeda yaitu Bank Marketing, Adult Income, dan Customer Segmentation. Lalu dilakukan perbandingan dan analisis atas hasil data mining yang dilakukan kepada dataset setelah dilakukan anonimisasi dengan 3 model berbeda serta mengevaluasi efektivitas teknik data anonymization dalam menyelesaikan masalah privasi. Hasil analisis menunjukkan bahwa data generalization memiliki kinerja yang baik untuk privasi namun menghambat data mining secara signifikan, contohnya dengan penurunan sebesar 34% pada salah satu dataset, sementara data perturbation dan data masking tidak memiliki garansi privasi sekuat data generalization tetapi tidak menghambat data mining terlalu signifikan dengan penurunan 15% dan 6% masing-masing untuk dataset yang sama.