13516090_Timothy Thamrin Andrew H S_Cover.pdf?_
PUBLIC karya 13516090_Timothy Thamrin Andrew H S_AbstrakIndonesia.pdf)u
PUBLIC karya 13516090_Timothy Thamrin Andrew H S_AbstrakEnglish.pdf?
PUBLIC karya 13516090_Timothy Thamrin Andrew H S_Lembar Pengesahan.pdf?
PUBLIC karya 13516090_Timothy Thamrin Andrew H S_BukuTA.pdf
]
PUBLIC karya
DBPedia, Freebase, dan basis pengetahuan lainnya memiliki konektivitas yang jarang, di mana
hal tersebut menjadi tantangan utama dalam melakukan prediksi tautan pada entitas yang ada.
Beberapa sistem rekomendasi menggunakan model yang kompleks untuk melakukan prediksi
tautan.
Di tengah perkembangan internet di dunia begitu cepat diiringi dengan perpindahan data yang
semakin besar, basis pengetahuan yang ada juga bertambah besar. Sehingga, diperlukan juga
pembangunan model yang dilakukan secara paralel dan terdistribusi agar pembangunan bisa
dilakukan dengan lebih cepat dan efisien. Oleh karena itu, tugas akhir mengenai pembangunan
sistem prediksi tautan basis pengetahuan ini dilakukan.
Pada penelitian ini ditentukan bagaimana cara melakukan encode pada entitas dan juga
melakukan penilaian relasi secara paralel dan terdistribusi dengan memanfaatkan berbagai
macam library pada Spark seperti Word2Vec, TF-IDF, perkalian vektor, dan beberapa
pemrosesan lain yang dilakukan menggunakan map pada Spark. Penelitian ini menggunakan
xLearn sebagai factorization machine.
Berdasarkan penelitian yang dilakukan, didapat bahwa sistem yang dibangun berhasil
melakukan semua proses pembangunan model pada sistem terdistribusi Spark. Sistem dapat
membangun model dengan lebih efisien dan menghasilkan prediksi tautan dengan nilai FMR
27 dan FMRR 0.56.