Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Retrieval-Augmented Generation (RAG) merupakan salah satu pengembangan
sistem yang menggabungkan kemampuan information retrieval dengan generative
language model. Namun, penerapan RAG pada domain medis masih menghadapi
beberapa permasalahan, di antaranya kesulitan dalam memperoleh informasi yang
akurat dan terstruktur, serta keterbatasan pemahaman model terhadap hubungan
semantik antar entitas medis.
Salah satu solusi untuk meningkatkan pemahaman tersebut adalah dengan
memanfaatkan Knowledge Graph (KG) yang menyimpan informasi medis dalam
bentuk struktur hubungan antar entitas, seperti penyakit, obat, gejala, dan efek
samping. Sistem dirancang untuk mampu mengekstraksi informasi dari pertanyaan
yang diajukan, melakukan penelusuran jalur yang relevan di dalam KG, serta
menghasilkan jawaban yang sesuai dengan bantuan Large Language Model (LLM).
Dalam tugas akhir ini, Hetionet digunakan sebagai sumber KG karena kaya akan
informasi medis. Selanjutnya, metode Knowledge Graph Embedding (KGE)
dengan algoritma RotatE digunakan untuk merepresentasikan KG ke dalam bentuk
vektor. Selain itu, proses ekstraksi informasi dari pertanyaan dilakukan
menggunakan LLM untuk menentukan strategi penelusuran pada KG.
Tugas akhir ini merupakan bagian dari proyek capstone yang terdiri atas dua
subtopik besar, yaitu: (1) pembangunan knowledge graph dari karya ilmiah, dan (2)
v
pemanfaatan KG pada RAG untuk meningkatkan relevansi hasil pencarian
informasi. Tugas akhir ini berfokus pada subtopik kedua, yaitu integrasi KG dalam
RAG.
Hasil pengujian menunjukkan bahwa algoritma RotatE mampu merepresentasikan
struktur dan hubungan dalam KG dengan baik, LLM dapat memberikan jalur
penelusuran KG yang relevan terhadap pertanyaan, serta integrasi RAG + KG
menghasilkan akurasi yang lebih tinggi dibandingkan RAG konvensional. Dengan
demikian, dapat disimpulkan bahwa integrasi RAG dengan KG berbasis embedding
mampu meningkatkan akurasi jawaban dalam domain medis.
Perpustakaan Digital ITB