Expert profiling merupakan task untuk mendeskripsikan keahlian seorang penulis.
Secara umum, expert profiling terdiri atas dua tahap, yakni identifikasi topik
keahlian serta penilaian relevansi penulis individual dengan topik keahlian. Metode
topic modeling berbasis Latent Dirichlet Allocation (LDA) membutuhkan jumlah
topik untuk didefinisikan terlebih dahulu serta memiliki limitasi dalam menentukan
struktur hierarki pada topik. Untuk mengatasi kekurangan ini, penelitian ini
memanfaatkan expert profiling dengan graf heterogen author-publication-keyword
untuk mengidentifikasi topik keahlian dalam dataset. Pendekatan dengan graf
heterogen ini membutuhkan informasi penulis dan kata kunci publikasi sebagai
vertex pada graf. Sehingga, metode ekstraksi kata kunci dimanfaatkan untuk
melengkapi missing values pada kata kunci dari judul dan abstrak publikasi.
Eksperimen dilakukan untuk menentukan pemilihan metode ekstraksi, kombinasi
kata kunci, bobot transformasi graf, serta penggunaan disambiguasi kata kunci yang
menghasilkan topik dengan kualitas terbaik. Hasil eksperimen menunjukkan bahwa
graf dengan kombinasi kata kunci default dengan hasil ekstraksi SIFRank dan bobot
transformasi ?=0.5, ?=1.0 menghasilkan topik dengan HPMI terbaik. Evaluasi
terhadap profil menunjukkan bahwa model berbasis graf (CDT) memiliki profil
lebih relevan dibandingkan dengan model baseline Author Topic Model (ATM).
Pengamatan terhadap profil keahlian menunjukkan bahwa kualitas profil yang
dihasilkan juga bergantung pada tingkat granularitas kata kunci serta koherensi kata
kunci dalam sebuah topik. Selain itu, algoritma Louvain pada penelitian ini hanya
mengelompokkan setiap publikasi ke dalam satu topik saja, sehingga masih
memiliki limitasi dalam menangani publikasi multidisiplin. Dengan demikian,
pengembangan lebih lanjut dapat dilakukan untuk meningkatkan kualitas kata
kunci serta dalam penanganan publikasi multidisiplin pada dataset.