digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Hubungan kausalitas memegang peranan penting dalam domain medis karena memungkinkan pemahaman yang lebih mendalam mengenai interaksi antara penyakit, efek pengobatan, dan faktor biologis. Namun, penyusunan hubungan kausal secara manual memerlukan waktu dan sumber daya yang besar sehingga sulit mengikuti laju pertumbuhan publikasi medis. Large Language Models (LLM) menawarkan peluang otomasi ekstraksi causal graph dari teks medis tidak terstruktur, meskipun masih menghadapi tantangan berupa halusinasi. Tugas akhir ini mengusulkan kerangka kerja ekstraksi causal graph dari jurnal medis yang dilengkapi strategi mitigasi halusinasi melalui prompt engineering menggunakan teknik COSTAR dengan tambahan few-shot example dan ontologi dari knowledge graph Hetionet. Causal graph yang dihasilkan selanjutnya diintegrasikan ke dalam Hetionet untuk memperkaya basis pengetahuan medis. Pengujian dilakukan pada tiga topik medis (Covid-19, Cardiovascular Disease, dan Breast Cancer) menggunakan dua model LLM pre-trained, yaitu GPT-4.1 dan Gemini-2.0. Validasi pakar menunjukkan bahwa tingkat precision hasil ekstraksi berada pada kisaran 0,64–0,94, yang menandakan rendahnya tingkat halusinasi. Namun, nilai recall relatif rendah (0–0,76), yang mengindikasikan adanya sejumlah relasi kausal relevan yang tidak berhasil ditangkap oleh model. Proses integrasi causal graph ke dalam Hetionet menghasilkan insertion rate entitas sebesar 47– 68% dan insertion rate relasi sebesar 80–93%, yang menunjukkan kontribusi signifikan terhadap penambahan informasi kausal baru pada knowledge graph. Berdasarkan hasil tersebut, knowledge graph yang telah diperkaya dengan informasi kausal menjadi luaran utama dari tugas akhir ini sekaligus mendukung pengembangan aplikasi information retrieval system dalam domain medis (IRS- Medis) pada proyek capstone. Knowledge graph hasil integrasi ini berfungsi sebagai basis data untuk sistem pencarian informasi yang transparan dan explainable, sehingga mendukung akses informasi medis yang akurat dan dapat ditelusuri sumbernya.