PENGEMBANGAN KNOWLEDGE GRAPH UNTUK PENCARIAN ATURAN HUKUM DI PERATURAN PERUNDANG-UNDANGAN INDONESIA BERBASIS TEXT SIMILARITY DAN TRAVERSAL SEMATCH TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh DAFFA ANANDA PRATAMA RESYALY NIM: 23523040 (Program Studi Magister Informatika) INSTITUT TEKNOLOGI BANDUNG Februari 2025 iii PENGEMBANGAN KNOWLEDGE GRAPH UNTUK PENCARIAN ATURAN HUKUM DI PERATURAN PERUNDANG-UNDANGAN INDONESIA BERBASIS TEXT SIMILARITY DAN TRAVERSAL SEMATCH HALAMAN PENGESAHAN Oleh Daffa Ananda Pratama Resyaly NIM: 23523040 (Program Studi Magister Informatika) Institut Teknologi Bandung Menyetujui Tim Pembimbing Tanggal 1 Februari 2025 Pembimbing 1 ______________________ (Dr. Ir. Gusti Ayu Putri Saptawati Soekidjo, M.Comm.) Pembimbing 2 ______________________ (I Wayan Gunada, S.H., M.H.) i ABSTRAK PENGEMBANGAN KNOWLEDGE GRAPH UNTUK PENCARIAN ATURAN HUKUM DI PERATURAN PERUNDANG-UNDANGAN INDONESIA BERBASIS TEXT SIMILARITY DAN TRAVERSAL SEMATCH Oleh Daffa Ananda Pratama Resyaly NIM: 23523040 (Program Studi Magister Informatika) Framework hukum di Indonesia menghadapi tantangan berupa regulasi yang kadang tumpang tindih dan tidak konsisten, yang menyulitkan aksesibilitas dan analisis dokumen hukum. Penelitian ini bertujuan untuk mengembangkan sistem pencarian berbasis query dengan memanfaatkan knowledge graph (KG) untuk menganalisis hubungan antar-pasal dalam dokumen hukum, khususnya di sektor kesehatan. Sistem ini diharapkan dapat mendukung aksesibilitas informasi hukum secara lebih efisien. Proses pembangunan knowledge graph melibatkan konversi teks hukum menjadi node dan edge, serta penerapan salah satu metode text similarity di antara TF-IDF, IndoBERT, Indo-LegalBERT, dan SentenceBERT. Eksperimen dilakukan untuk membandingkan performa metode text similarity untuk mendapatkan metode terbaik, termasuk analisis threshold skor similarity untuk menentukan nilai optimal. Selain itu, evaluasi sistem pencarian dilakukan menggunakan teknik User Acceptance Testing (UAT) oleh pakar hukum untuk menilai relevansi hasil pencarian terhadap kebutuhan pengguna. Hasil pembangunan knowledge graph menunjukkan bahwa program yang dikembangkan berhasil mengonversi teks hukum menjadi node dan edge yang merepresentasikan hubungan antar-pasal dan antar-bagian dokumen hukum. Hasil eksperimen menunjukkan bahwa metode TF-IDF memberikan performa terbaik dibandingkan metode semantic similarity. Threshold similarity sebesar 0.5 dipilih sebagai nilai optimal untuk menghasilkan hasil pencarian yang relevan secara terminologi dan kontekstual. Berdasarkan evaluasi oleh pakar hukum, sistem ini mampu menghasilkan hasil pencarian yang akurat dan terfokus pada tingkat pasal. Penelitian ini menyimpulkan bahwa sistem pencarian berbasis query menggunakan knowledge graph dapat membantu meningkatkan kemudahan akses dokumen hukum di Indonesia. Sistem ini bermanfaat bagi analis hukum dalam mendukung analisis dan interpretasi dokumen hukum secara lebih efisien. Kata kunci: Knowledge Graph, sistem pencarian dokumen hukum, sistem pencarian berbasis query, traversal graf, kemiripan teks. ii ABSTRACT DEVELOPMENT OF KNOWLEDGE GRAPH FOR LEGAL RULE SEARCH IN INDONESIAN LAWS AND REGULATIONS BASED ON TEXT SIMILARITY AND SEMATCH TRAVERSAL By Daffa Ananda Pratama Resyaly NIM: 23523040 (Master’s Program in Informatics) The legal framework in Indonesia faces challenges in the form of several overlapping and inconsistent regulations, which hinder the ease of access and analysis of legal documents. This study aims to develop a query-based search system utilizing a Knowledge Graph (KG) to analyze inter-article relationships within legal documents, particularly in the health sector. The system is expected to support more efficient access to legal information. The Knowledge Graph construction process involves converting legal texts into nodes and edges, as well as applying one of several text similarity methods, including TF-IDF, IndoBERT, Indo-LegalBERT, and SentenceBERT. Experiments were conducted to compare the performance of these text similarity methods to identify the best one, including analyzing similarity score thresholds to determine the optimal value.