digilib@itb.ac.id +62 812 2508 8800

23522025 William Fu.pdf
PUBLIC Open In Flip Book Dessy Rondang Monaomi

Expert profiling merupakan task untuk mendeskripsikan keahlian seorang penulis. Secara umum, expert profiling terdiri atas dua tahap, yakni identifikasi topik keahlian serta penilaian relevansi penulis individual dengan topik keahlian. Metode topic modeling berbasis Latent Dirichlet Allocation (LDA) membutuhkan jumlah topik untuk didefinisikan terlebih dahulu serta memiliki limitasi dalam menentukan struktur hierarki pada topik. Untuk mengatasi kekurangan ini, penelitian ini memanfaatkan expert profiling dengan graf heterogen author-publication-keyword untuk mengidentifikasi topik keahlian dalam dataset. Pendekatan dengan graf heterogen ini membutuhkan informasi penulis dan kata kunci publikasi sebagai vertex pada graf. Sehingga, metode ekstraksi kata kunci dimanfaatkan untuk melengkapi missing values pada kata kunci dari judul dan abstrak publikasi. Eksperimen dilakukan untuk menentukan pemilihan metode ekstraksi, kombinasi kata kunci, bobot transformasi graf, serta penggunaan disambiguasi kata kunci yang menghasilkan topik dengan kualitas terbaik. Hasil eksperimen menunjukkan bahwa graf dengan kombinasi kata kunci default dengan hasil ekstraksi SIFRank dan bobot transformasi ?=0.5, ?=1.0 menghasilkan topik dengan HPMI terbaik. Evaluasi terhadap profil menunjukkan bahwa model berbasis graf (CDT) memiliki profil lebih relevan dibandingkan dengan model baseline Author Topic Model (ATM). Pengamatan terhadap profil keahlian menunjukkan bahwa kualitas profil yang dihasilkan juga bergantung pada tingkat granularitas kata kunci serta koherensi kata kunci dalam sebuah topik. Selain itu, algoritma Louvain pada penelitian ini hanya mengelompokkan setiap publikasi ke dalam satu topik saja, sehingga masih memiliki limitasi dalam menangani publikasi multidisiplin. Dengan demikian, pengembangan lebih lanjut dapat dilakukan untuk meningkatkan kualitas kata kunci serta dalam penanganan publikasi multidisiplin pada dataset.