Dokumen Asli
Terbatas Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Persaingan e-commerce yang semakin ketat menuntut platform e-commerce
merespons dengan strategi yang tepat, salah satunya melalui perbandingan harga
pada kompetitor. Akan tetapi, tidak adanya standardisasi format penyajian
informasi, terutama pada data teks seperti nama dan deskripsi produk, menyulitkan
usaha pencocokan produk antar platform. Salah satu teknik yang dapat digunakan
untuk mengatasi permasalahan ini adalah entity resolution, yaitu proses untuk
menentukan apakah dua atau lebih objek merujuk ke entitas yang sama di dunia
nyata. Proses ini terdiri dari dua tahap utama, yakni blocking untuk menyaring
kandidat pasangan agar jumlahnya menjadi seminimal mungkin, dan matching
untuk mengklasifikasikan apakah pasangan tersebut serupa atau tidak. Penelitian
ini bertujuan untuk menerapkan entity resolution menggunakan large Language
Model (LLM) untuk mengidentifikasi produk serupa pada e-commerce, serta
membandingkan performa dua jenis arsitektur model, yakni encoder dan decoder.
Selain itu, penelitian ini juga membandingkan dua pendekatan pelatihan model,
yakni fine-tuning dan soft prompt learning. Metodologi yang digunakan adalah
CRISP-DM. Dataset yang dipakai berasal dari produk Amazon dan produk Google.
Evaluasi pada tahap blocking menggunakan metrik recall@k, sedangkan evaluasi
pada tahap matching dan sistem keseluruhan adalah F1-score. Hasil evaluasi
menunjukkan bahwa model all-RoBERTa-large-v1 memiliki kinerja terbaik
dengan nilai recall@k mencapai 98,62%, sedangkan model llama-3.1-8B dengan
pendekatan soft prompt learning menghasilkan F1-score tertinggi yaitu 91,91%
untuk matching. Secara keseluruhan, sistem entity resolution menghasilkan F1-
score mencapai 87,64%. Pendekatan soft prompt learning menghasilkan kinerja
yang lebih baik daripada fine-tuning pada setiap model.
Perpustakaan Digital ITB