Peristiwa adalah kejadian-kejadian yang benar terjadi, menarik perhatian,
mempunyai lokasi dan waktu, dan menimbulkan konsekuensi seperti munculnya
berita-berita yang melaporkan peristiwa tersebut. Oleh karena itu, para ilmuwan
mengembangkan berbagai macam metode untuk mendeteksi peristiwa dari
kumpulan dokumen berita dengan harapan bahwa peristiwa tersebut dapat
dimanfaatkan lebih jauh, seperti pemrosesan lokasi dan waktu. Salah satu metode
tersebut dinamakan Hot Event Detection yang dikembangkan oleh Qi dkk. Metode
ini dipilih karena mudah dipahami, diimplementasi, dan di-enhanced. Akan tetapi
sama seperti metode-metode pendeteksian peristiwa lainnya, metode tersebut tidak
mendukung pemrosesan lokasi dan waktu peristiwa. Oleh karena itu, tugas akhir ini
menambahkan enhancements tersebut beserta enhancements lainnya seperti event
merging dan pemrosesan kata kunci. Enhancement untuk pemrosesan kata kunci
terbagai menjadi analisa ekstraksi kata kunci dan semantic similarity.
Dalam tugas akhir ini, enhancements terhadap metode Hot Event Detection
diimplementasikan melalui gabungan berbagai teknik. Atribut lokasi didapatkan
secara akurat melalui teks berita, atribut waktu diperoleh dari waktu publikasi
berita. Event merging diimplementasi memanfaatkan algoritma klusterisasi
DBSCAN. Analisa ekstraksi kata kunci menggunakan kamus TF-IDF untuk
mengecek relevansi kata kunci tersebut dan ontologi WordNet digunakan untuk
Semantic Similarity.
Enhancements seperti event merging dan pemrosesan kata kunci berhasil
meningkatkan kinerja Hot Event Detection melalui kualitas kluster yang lebih baik.
Enhancement penambahan atribut lokasi dan waktu peristiwa berhasil memperoleh
hasil yang baik dengan konfigurasi threshold dan attenuation yang tepat (71%
precision atau 74% recall), tapi kekurangan-kekurangan masih ditemukan yang
menyebabkan precision atau recall tidak lebih tinggi, misalnya kesalahan
klusterisasi.
Perpustakaan Digital ITB