digilib@itb.ac.id +62 812 2508 8800

DBPedia, Freebase, dan basis pengetahuan lainnya memiliki konektivitas yang jarang, di mana hal tersebut menjadi tantangan utama dalam melakukan prediksi tautan pada entitas yang ada. Beberapa sistem rekomendasi menggunakan model yang kompleks untuk melakukan prediksi tautan. Di tengah perkembangan internet di dunia begitu cepat diiringi dengan perpindahan data yang semakin besar, basis pengetahuan yang ada juga bertambah besar. Sehingga, diperlukan juga pembangunan model yang dilakukan secara paralel dan terdistribusi agar pembangunan bisa dilakukan dengan lebih cepat dan efisien. Oleh karena itu, tugas akhir mengenai pembangunan sistem prediksi tautan basis pengetahuan ini dilakukan. Pada penelitian ini ditentukan bagaimana cara melakukan encode pada entitas dan juga melakukan penilaian relasi secara paralel dan terdistribusi dengan memanfaatkan berbagai macam library pada Spark seperti Word2Vec, TF-IDF, perkalian vektor, dan beberapa pemrosesan lain yang dilakukan menggunakan map pada Spark. Penelitian ini menggunakan xLearn sebagai factorization machine. Berdasarkan penelitian yang dilakukan, didapat bahwa sistem yang dibangun berhasil melakukan semua proses pembangunan model pada sistem terdistribusi Spark. Sistem dapat membangun model dengan lebih efisien dan menghasilkan prediksi tautan dengan nilai FMR 27 dan FMRR 0.56.