digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC karya

Abstrak
PUBLIC karya

Abstract
PUBLIC karya

Lembar Pengesahan
PUBLIC karya

Tugas Akhir
PUBLIC karya

Knowledge graph merupakan salah satu teknologi semantic web yang dapat dimanfaatkan untuk memahami entitas pada teks, visualisasi graf, dan meningkatkan proses bisnis seperti pencarian informasi pada e-commerce. Salah satu sumber informasi yang digunakan membangun knowledge graph adalah data teks yang terdapat pada platform e-commerce. Ecommerce tidak memiliki informasi terstruktur dari produk yang dijual dan bergantung pada informasi yang disediakan toko yang berjualan di platform e-commerce. Oleh karena itu, perlu dilakukan penelitian pembangunan knowledge graph dari teks produk pada e-commerce. Untuk memperoleh struktur entitas pada knowledge graph, dilakukan ekstraksi informasi dari teks produk menggunakan pendekatan transfer learning dengan tipe full-fine tuning dari model multilingual-BERT-base-cased dan XLM-RoBERTa-base. Kemudian, dilakukan pembangunan knowledge graph mengadopsi framework T2KG yang terdiri dari komponen entity mapping dan triple integration. Pada komponen entity mapping dilakukan pemetaan hasil ekstraksi informasi dari teks menjadi entitas unik. Hasil pemetaan entitas dikaitkan dengan entitas lain pada komponen triple integration. Dengan keterbatasan teks, relasi antar entitas diperoleh dari skema ontologi Product yang diadopsi dari Schema.org. Eksperimen ekstraksi informasi dilakukan untuk memperoleh model yang robust pada merek yang tidak terdapat pada data latih maupun pada e-commerce yang berbeda. Dengan menggunakan 1.500 data latih, dan 216 data uji, diperoleh F1-score rata-rata terbaik 0,895 untuk 4 skenario uji. Hasil terbaik ini diperoleh dengan menggunakan arsitektur XLMRoBERTa. Untuk evaluasi pemetaan hasil ekstraksi informasi ke knoweldge graph dari 1.445 teks produk dari dua e-commerce yang berbeda, 338 entitas produk dibentuk pada knowledge graph dengan presisi pemetaan sebesar 0,94.