Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Dalam lingkungan organisasi modern yang sangat bergantung pada komunikasi elektronik, email telah menjadi sarana utama dalam pertukaran informasi antarindividu. Namun, tingginya volume komunikasi ini berbanding lurus dengan meningkatnya risiko penyalahgunaan, kebocoran data, ataupun potensi tindakan tidak etis yang muncul dari internal organisasi sendiri. Permasalahan yang sering dihadapi adalah tidak adanya sistem deteksi dini yang mampu menyoroti pola komunikasi mencurigakan secara objektif dan sistematis, terutama yang dilakukan secara terselubung dan tersembunyi dalam jaringan komunikasi yang luas dan kompleks.
Tugas akhir ini bertujuan untuk merancang dan mengimplementasikan sebuah sistem intelijen sumber daya manusia yang mampu mendeteksi anomali dalam komunikasi email internal suatu organisasi. Sistem ini memanfaatkan pendekatan berbasis pembelajaran mesin atau machine learning untuk mengevaluasi perilaku komunikasi setiap individu berdasarkan berbagai fitur, seperti panjang pesan, jumlah kata, jumlah penerima, waktu pengiriman, dan sentimen isi pesan. Dengan pendekatan ini, sistem diharapkan dapat mengidentifikasi entitas atau interaksi yang menyimpang dari pola normal, yang berpotensi merepresentasikan aktivitas tidak wajar atau berisiko tinggi.
Sebagai basis data, digunakan Enron Email Dataset, sebuah dataset publik yang berisi lebih dari 500.000 email korporat yang terdokumentasi secara historis. Dataset ini kemudian diproses melalui serangkaian tahapan, mulai dari ekstraksi informasi, pembersihan isi pesan, hingga pembentukan fitur numerik untuk pelatihan model. Tiga algoritma deteksi anomali digunakan secara bersamaan, yaitu Isolation Forest, Local Outlier Factor (LOF), dan One-Class Support Vector Machine (SVM). Pemilihan ketiga algoritma ini didasarkan pada kemampuannya dalam mengidentifikasi outlier dalam data berdimensi tinggi dengan supervised anomaly detection.
Hasil eksperimen menunjukkan bahwa ketiga model berhasil mendeteksi sejumlah besar anomali secara independen: masing-masing model menandai sekitar 2.691 hingga 2.702 email sebagai anomali. Sebanyak 1.279 email terdeteksi oleh dua model sekaligus, sementara 4 email berhasil diidentifikasi sebagai anomali oleh ketiga model secara bersamaan yang dapat diinterpretasikan sebagai true positive candidates berdasarkan konsensus model. Model juga menunjukkan pola distribusi skor yang konsisten dan saling melengkapi, sehingga kombinasi ketiganya memberikan hasil yang lebih komprehensif dibanding penggunaan model tunggal.
Seluruh proses analisis ini diintegrasikan ke dalam sebuah dashboard interaktif berbasis Streamlit. Dashboard ini menyediakan fitur-fitur seperti visualisasi distribusi skor anomali, grafik jaringan komunikasi antar pengguna dengan penandaan tingkat risiko, serta fungsi pencarian email berdasarkan kata kunci atau alamat pengirim. Visualisasi dibuat menggunakan kombinasi NetworkX dan PyVis, memungkinkan pengguna untuk secara intuitif mengeksplorasi hubungan antar entitas serta perilaku penyimpangan yang teridentifikasi dalam komunikasi internal. Sistem ini tidak hanya memberikan alat bantu analisis yang kuat, tetapi juga bersifat fleksibel dan dapat disesuaikan dengan kebutuhan pengawasan organisasi lainnya.
Kebaruan dari penelitian ini terletak pada kombinasi penggunaan model deteksi anomali dalam konteks komunikasi organisasi berbasis data nyata, serta penyajiannya dalam bentuk sistem visualisasi yang informatif dan mudah digunakan. Tidak banyak studi terdahulu yang menggabungkan ketiga algoritma anomali ini dalam satu kerangka sistem terintegrasi untuk komunikasi email korporat. Oleh karena itu, sistem ini memberikan kontribusi nyata terhadap pengembangan teknologi intelijen sumber daya manusia yang berbasis data, terutama dalam konteks pengawasan komunikasi internal secara non-invasif.
Dengan demikian, sistem ini diharapkan dapat digunakan sebagai fondasi awal bagi organisasi dalam membangun alat bantu pengambilan keputusan yang adaptif, transparan, dan data-driven, terutama untuk mendeteksi potensi ancaman dari dalam atau insider threat sebelum berkembang menjadi masalah yang lebih besar.
Perpustakaan Digital ITB