digilib@itb.ac.id +62 812 2508 8800

Information overload menyebabkan kesulitan dalam memperoleh paper yang tepat dan sesuai dengan expertise dan interest dari peneliti. Dalam hal ini, recommender system juga dituntut untuk mampu merekomendasikan paper yang sesuai dengan preferensi peneliti. Sistem rekomendasi yang banyak digunakan dan terkenal hingga saat ini adalah Collaborative Filtering (CF). CF dikenal dengan kesuksesannya dalam menggunakan metode Matrix Factorization (MF) pada sistem rekomendasi. Permasalahan utama yang hingga saat ini dihadapi oleh CF yaitu data sparsity. Masalah ini terjadi karena kurangnya feedback user (rating) terhadap sebuah item. Penelitian ini bertujuan untuk mengembangkan sistem rekomendasi yang memiliki akurasi lebih baik dan robust terhadap data sparsity. Penelitian ini menggunakan pendekatan Hybrid dengan basis MF, pendekatan ini mempertimbangkan konten dari paper dan feedback dari user. Integrasi informasi kontekstual dari konten paper diperoleh dari arsitektur jaringan berbasis Convolutional Neural Network (CNN) untuk membantu MF dalam membangun matriks user-item. Sentence-BERT (SBERT) digunakan sebagai metode embedding konten. Data yang digunakan adalah CiteUlike dataset. Terdapat dua skenario pengujian, sparse setting untuk melihat performansi model disaat sedikit data latih dan dense setting sebaliknya. ii Sistem yang dikembangkan secara keseluruhan menunjukkan hasil evaluasi recall dan Discounted Cumulative Gain (DCG) lebih baik dari baseline. Peningkatan performansi yang signifikan terjadi ketika jumlah data latih yang ada sedikit atau dalam sparse setting. Hal ini menunjukkan bahwa sistem yang dikembangkan lebih baik dan lebih robust terhadap data sparsity daripada baseline penelitian. Penggunaan sentence transformer dan CNN sebagai autoencoder berperan penting dalam mengambil latent item feature vector dari konten. Untuk penelitian selanjutnya dapat menerapkan hasil perkembangan metode embedding dan model autoencoder yang lain untuk menggantikan SBERT dan CNN. Penggunaan fitur lain seperti tag dan sitasi dapat dipertimbangkan untuk perkembangan penelitian kedepan.