digilib@itb.ac.id +62 812 2508 8800

Peristiwa adalah kejadian-kejadian yang benar terjadi, menarik perhatian, mempunyai lokasi dan waktu, dan menimbulkan konsekuensi seperti munculnya berita-berita yang melaporkan peristiwa tersebut. Oleh karena itu, para ilmuwan mengembangkan berbagai macam metode untuk mendeteksi peristiwa dari kumpulan dokumen berita dengan harapan bahwa peristiwa tersebut dapat dimanfaatkan lebih jauh, seperti pemrosesan lokasi dan waktu. Salah satu metode tersebut dinamakan Hot Event Detection yang dikembangkan oleh Qi dkk. Metode ini dipilih karena mudah dipahami, diimplementasi, dan di-enhanced. Akan tetapi sama seperti metode-metode pendeteksian peristiwa lainnya, metode tersebut tidak mendukung pemrosesan lokasi dan waktu peristiwa. Oleh karena itu, tugas akhir ini menambahkan enhancements tersebut beserta enhancements lainnya seperti event merging dan pemrosesan kata kunci. Enhancement untuk pemrosesan kata kunci terbagai menjadi analisa ekstraksi kata kunci dan semantic similarity. Dalam tugas akhir ini, enhancements terhadap metode Hot Event Detection diimplementasikan melalui gabungan berbagai teknik. Atribut lokasi didapatkan secara akurat melalui teks berita, atribut waktu diperoleh dari waktu publikasi berita. Event merging diimplementasi memanfaatkan algoritma klusterisasi DBSCAN. Analisa ekstraksi kata kunci menggunakan kamus TF-IDF untuk mengecek relevansi kata kunci tersebut dan ontologi WordNet digunakan untuk Semantic Similarity. Enhancements seperti event merging dan pemrosesan kata kunci berhasil meningkatkan kinerja Hot Event Detection melalui kualitas kluster yang lebih baik. Enhancement penambahan atribut lokasi dan waktu peristiwa berhasil memperoleh hasil yang baik dengan konfigurasi threshold dan attenuation yang tepat (71% precision atau 74% recall), tapi kekurangan-kekurangan masih ditemukan yang menyebabkan precision atau recall tidak lebih tinggi, misalnya kesalahan klusterisasi.