Information overload menyebabkan kesulitan dalam memperoleh paper yang
tepat dan sesuai dengan expertise dan interest dari peneliti. Dalam hal ini,
recommender system juga dituntut untuk mampu merekomendasikan paper yang
sesuai dengan preferensi peneliti. Sistem rekomendasi yang banyak digunakan
dan terkenal hingga saat ini adalah Collaborative Filtering (CF). CF dikenal
dengan kesuksesannya dalam menggunakan metode Matrix Factorization (MF)
pada sistem rekomendasi. Permasalahan utama yang hingga saat ini dihadapi oleh
CF yaitu data sparsity. Masalah ini terjadi karena kurangnya feedback user
(rating) terhadap sebuah item.
Penelitian ini bertujuan untuk mengembangkan sistem rekomendasi yang
memiliki akurasi lebih baik dan robust terhadap data sparsity. Penelitian ini
menggunakan pendekatan Hybrid dengan basis MF, pendekatan ini
mempertimbangkan konten dari paper dan feedback dari user. Integrasi informasi
kontekstual dari konten paper diperoleh dari arsitektur jaringan berbasis
Convolutional Neural Network (CNN) untuk membantu MF dalam membangun
matriks user-item. Sentence-BERT (SBERT) digunakan sebagai metode
embedding konten. Data yang digunakan adalah CiteUlike dataset. Terdapat dua
skenario pengujian, sparse setting untuk melihat performansi model disaat sedikit
data latih dan dense setting sebaliknya.
ii
Sistem yang dikembangkan secara keseluruhan menunjukkan hasil evaluasi recall
dan Discounted Cumulative Gain (DCG) lebih baik dari baseline. Peningkatan
performansi yang signifikan terjadi ketika jumlah data latih yang ada sedikit atau
dalam sparse setting. Hal ini menunjukkan bahwa sistem yang dikembangkan
lebih baik dan lebih robust terhadap data sparsity daripada baseline penelitian.
Penggunaan sentence transformer dan CNN sebagai autoencoder berperan
penting dalam mengambil latent item feature vector dari konten. Untuk penelitian
selanjutnya dapat menerapkan hasil perkembangan metode embedding dan model
autoencoder yang lain untuk menggantikan SBERT dan CNN. Penggunaan fitur
lain seperti tag dan sitasi dapat dipertimbangkan untuk perkembangan penelitian
kedepan.