digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Dessy Rondang Monaomi

Knowledge graph merupakan sebuah representasi pengetahuan dengan memetakan konsep-konsep yang ada pada dunia nyata menjadi simpul-simpul yang saling terhubung. Terdapat beberapa knowledge graph populer seperti Wikidata, DBPedia, YAGO, dan knowledge graph lainnya. Perlu diketahui, knowledge graph yang ada sekarang masih dikatakan belum lengkap. Salah satu upaya untuk melakukan konstruksi pengetahuan pada knowledge graph yaitu dengan melalui ekstraksi pengetahuan yang berasal dari sumber-sumber data seperti dokumen teks, gambar, audio, video, serta berbagai sumber data lainnya. Diketahui bahwa selain sumber data konvensional, model bahasa sebagai bagian dari teknologi kecerdasan buatan dapat menyimpan pengetahuan di dalam parameternya. Internation Semantic Web Conference (ISWC) secara inisiatif membuka perlombaan sekaligus bidang riset untuk melakukan ekstraksi pengetahuan dari model bahasa sebagai upaya pelengkapan informasi pada knowledge graph yang dinamakan sebagai Language Models for Knowledge Base Construction (LM-KBC). Kompetisi tersebut melahirkan beberapa pendekatan dalam melakukan ekstraksi pengetahuan dari model bahasa. Secara umum, pendekatan yang dilakukan berpusat pada variasi penerapan hard prompting, khususnya few-shot prompting. Hal tersebut membuka peluang bagi pendekatan prompting lain, yaitu soft prompting, yang sifatnya lebih ekspresif dibandingkan hard prompt, untuk dieksplorasi lebih lanjut pada konteks persoalan LM-KBC. Penelitian ini mengajukan sebuah pendekatan baru yang berfokus pada pendekatan soft prompting untuk penyelesaian persoalan LM-KBC. Dengan memadukan paradigma few-shot yang ada pada pendekatan-pendekatan sebelumnya, penelitian ini mengubah cara pemberian konteks pada model bahasa yang semula menggunakan format teks menjadi menggunakan konteks dalam bentuk knowledge graph. Knowledge graph akan ditransformasi menjadi soft prompt dengan memprosesnya terlebih dahulu menggunakan graph neural network. Pendekatan yang diajukan terbukti lebih unggul pada dua dari tiga dataset dibandingkan dengan metode baseline yang disediakan oleh ISWC. Dilakukan pengujian statistik terhadap metrik perolehan dari metode yang diajukan. Diperoleh bahwa peningkatan kinerja dari pendekatan yang diajukan belum bisa dikatakan sebagai peningkatan yang signifikan. Walau begitu, masih ada ruang untuk pengembangan lebih lanjut terkait metode yang diajukan, khususnya di dalam ruang lingkup LM-KBC.