digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Persaingan e-commerce yang semakin ketat menuntut platform e-commerce merespons dengan strategi yang tepat, salah satunya melalui perbandingan harga pada kompetitor. Akan tetapi, tidak adanya standardisasi format penyajian informasi, terutama pada data teks seperti nama dan deskripsi produk, menyulitkan usaha pencocokan produk antar platform. Salah satu teknik yang dapat digunakan untuk mengatasi permasalahan ini adalah entity resolution, yaitu proses untuk menentukan apakah dua atau lebih objek merujuk ke entitas yang sama di dunia nyata. Proses ini terdiri dari dua tahap utama, yakni blocking untuk menyaring kandidat pasangan agar jumlahnya menjadi seminimal mungkin, dan matching untuk mengklasifikasikan apakah pasangan tersebut serupa atau tidak. Penelitian ini bertujuan untuk menerapkan entity resolution menggunakan large Language Model (LLM) untuk mengidentifikasi produk serupa pada e-commerce, serta membandingkan performa dua jenis arsitektur model, yakni encoder dan decoder. Selain itu, penelitian ini juga membandingkan dua pendekatan pelatihan model, yakni fine-tuning dan soft prompt learning. Metodologi yang digunakan adalah CRISP-DM. Dataset yang dipakai berasal dari produk Amazon dan produk Google. Evaluasi pada tahap blocking menggunakan metrik recall@k, sedangkan evaluasi pada tahap matching dan sistem keseluruhan adalah F1-score. Hasil evaluasi menunjukkan bahwa model all-RoBERTa-large-v1 memiliki kinerja terbaik dengan nilai recall@k mencapai 98,62%, sedangkan model llama-3.1-8B dengan pendekatan soft prompt learning menghasilkan F1-score tertinggi yaitu 91,91% untuk matching. Secara keseluruhan, sistem entity resolution menghasilkan F1- score mencapai 87,64%. Pendekatan soft prompt learning menghasilkan kinerja yang lebih baik daripada fine-tuning pada setiap model.