digilib@itb.ac.id +62 812 2508 8800

33216018 RA. Paramita Mayadewi.pdf
PUBLIC Dessy Rondang Monaomi

Penggunaan ontologi dalam komputasi semantik telah menyebabkan munculnya penelitian untuk mengeksplorasi metode pengembangan model ontologi baru. Membangun ontologi adalah kegiatan rekayasa, dan terdapat dua pendekatan utama untuk membangunnya: membangun dari awal (manual) atau menggunakan pendekatan pembelajaran ontologi. Secara formal, dengan menggunakan pendekatan pembelajaran, ontologi dapat dibangun dari berbagai sumber informasi, termasuk sumber terstruktur, seperti basis data relasional; sumber semi-terstruktur, seperti kamus, file HTML atau XML atau sumber tidak terstruktur, seperti halaman web—sebagian besar topik penelitian dalam pembelajaran ontologi fokus pada ekstraksi pengetahuan yang disimpan dalam basis data relasional. Banyak penelitian telah mengusulkan konversi basis data relasional menjadi ontologi untuk mengeksplorasi pengetahuan dari basis data relasional. Terlepas dari kemajuan signifikan yang dibuat selama beberapa tahun terakhir dan banyak pendekatan yang diusulkan, banyak masalah yang belum ditangani secara memadai, terutama yang melibatkan instance basis data untuk menemukan pengetahuan implisit dari basis data sumber. Penelitian yang dilakukan adalah mengenai pembelajaran ontologi dari basis data relasional dan ditujukan untuk menemukan pengetahuan tersembunyi dalam basis data relasional. Fokus penelitian yang dilakukan adalah: Pertama, identifikasi hubungan symmetry dan transitive dalam basis data relasional. Kedua, identifikasi entitas berdasarkan kesesuaian atribut. Ketiga, identifikasi pola property chain dalam basis data relasional. Mengidentifikasi hubungan symmetry dan transitive dapat membantu dalam menyimpulkan fakta untuk dinyatakan dalam basis pengetahuan dan memperkaya ontologi yang dihasilkan. Penelitian yang telah dilakukan mengusulkan metode baru untuk mengidentifikasi pola symmetry dan transitive. Pendekatan yang diusulkan untuk mengidentifikasi pola spesifik hubungan symmetry dan transitive didasarkan pada pola yang terbentuk antara primary key dan foreign key. Ini terbatas pada unary relationship dan tabel relationship. Pendekatan yang diusulkan dapat mengidentifikasi pola hubungan symmetry dan transitive dalam unary relationship dan tabel relationship. Proses mengidentifikasi entitas melalui pencocokan atribut adalah bagian dari proses transformasi basis data relasional menjadi ontologi. Hal ini bertujuan untuk mengurangi duplikasi nilai data pada ontologi dan memperkaya ontologi yang dihasilkan. Pendekatan yang diusulkan berorientasi pada data dalam database dan tidak memeriksa solusi yang bergantung pada pengetahuan data eksternal. Metode yang diusulkan menggunakan Jaccard Similarity untuk mengidentifikasi atribut yang dianggap memiliki kesamaan makna sehingga dapat digunakan sebagai class dalam ontologi. Studi eksperimental dilakukan dengan menghitung nilai presisi, recall dan F1-score. Hasil penelitian eksperimen dengan menggunakan tiga threshold yang berbeda (3%, 5% dan 7%) menunjukkan nilai rata-rata presisi, recall dan F1-score di atas 75%. Tujuan mengidentifikasi ObjectPropertyChain adalah untuk menemukan fakta atau pengetahuan baru yang tersembunyi di database relasional. Pendekatan identifikasi ObjectPropertyChain fokus pada ObjectPropertyChain dengan panjang dua. Pendekatan yang dilakukan menggunakan representasi graf yang diimplementasikan menggunakan hashmap. Proses pencocokan dilakukan dengan cara mencocokkan nilai kedua dari pasangan atribut yang muncul sebagai nilai pertama dari pasangan atribut pada tabel yang berbeda. Pasangan atribut yang dihasilkan dari proses identifikasi chain property akan dibandingkan dengan data yang ada di database. Setiap tabel atau relasi yang memenuhi pola yang teridentifikasi akan diusulkan sebagai aksioma yang dapat ditambahkan ke properti objek yang sudah ada atau bahkan menambahkan properti objek baru dalam ontologi. Eksperimen pada beberapa database menghasilkan nilai presisi sebesar 88,9%. Hasil dari proses transformasi secara keseluruhan diuji menggunakan information dan query preservation. Pembuktian dilakukan dengan eksperimen query menggunakan SQL dan SPARQL. Hasil query keduanya dibandingkan untuk melihat apakah pendekatan yang diusulkan adalah information preservation dan query preservation.