




Jejaring sosial online (JSO), misalkan, Facebook dan Twitter, telah mendapat
perhatian luar biasa dalam dekade terakhir dan berkembang menjadi media
informasi atau berbagi pendapat untuk menyebarluaskan informasi tentang
peristiwa terkini. Namun, beberapa konten yang di-posting di JSO tidak dapat
dipercaya, karena informasi umumnya tidak melalui proses editorial dan
pengecekan fakta. Informasi yang tidak akurat yang menarik perhatian berulang
kali ditampilkan dan disebar dengan cepat akan mengarah pada pertimbangan
menjadi informasi yang benar. Masalah ini dapat membuat dampak negatif yang
serius bagi pengguna yang menggunakan JSO sebagai sumber informasi dan
pengambilan keputusan. Ada banyak cara untuk mengatasi masalah ini, misalnya,
dengan memeriksa keandalan sumber. Keandalan sumber membantu pengguna
untuk memutuskan sumber mana yang dapat diandalkan untuk informasi yang
akurat. Disertasi ini mengusulkan integrasi faktor dan penggunaan data lintas
kelompok untuk keandalan sumber di JSO, yaitu, Twitter dan Facebook.
Model keandalan sumber dibangun berdasarkan lima faktor utama, yaitu faktor
topic-based, faktor sentiment-based, faktor spam-based, faktor HCC (faktor hoaxbased, competence-based, dan curator-based), dan faktor UCR (faktor user-based,
content-based, dan retweet-based). Disertasi ini mengembangkan 4 model untuk
membangun model keandalan sumber, yaitu, model kelas topik untuk faktor topicbased, model sentimen untuk faktor sentiment-based, model spammer untuk faktor
spam-based dan model kredibilitas informasi. Model kredibilitas informasi
dikembangkan sebelumnya untuk menyaring informasi dan juga sebagai dasar
untuk mengidentifikasi faktor-faktor utama tersebut. Pada tahap selanjutnya, tiga
model juga dikembangkan, yaitu, model kelas topik, model sentimen, dan model
spammer. Model kelas topik dikembangkan untuk mengurangi ketidakcocokan
kosakata dengan word embeddings pada kelas topik tweet di Twitter. Tahap ini
memperluas fitur menggunakan Word2Vec. Lebih lanjut, model sentimen berfokus
pada pengembangan metode hybrid, yang merupakan kombinasi fitur dasar dengan
ekspansi fitur berdasarkan Term Frequency - Inverse Document Frequency (TFIDF) dan ekspansi fitur berdasarkan fitur berbasis tweet. Model spammer adalah
model yang diperoleh dengan menambahkan 4 fitur baru, yaitu, spam_words_indo,
total_spam, #like, dan URL_rasio. Akhirnya, disertasi ini berfokus pada
pengembangan model keandalan sumber di Twitter dan Facebook. Untuk
mengamati keakuratan keandalan sumber, lima pengklasifikasi digunakan, yaitu,
ii
Naïve Bayes (NB), Support Vector Machine (SVM), Logistic Regression (Logit),
J48, dan Random Forest (RF).
Model keandalan sumber dibangun secara bertahap, yang pertama untuk
membangun model keandalan sumber di Twitter, yang kedua, untuk membangun
model keandalan sumber di Facebook dan yang terakhir, untuk membangun model
keandalan sumber gabungan (Twitter dan Facebook). Hasil keandalan sumber yang
diusulkan di Twitter lebih baik daripada penelitian sebelumnya dengan peningkatan
akurasi sebesar 11,31% dan F-Measure sebesar 16,68%. Berdasarkan 5
pengklasifikasi, akurasi dan hasil F-Measure tertinggi dicapai oleh pengklasifikasi
RF dengan seleksi fitur, yaitu sebesar 90,46% dan 0,9040. Untuk hasil keandalan
sumber di Facebook, sejauh pengetahuan belum dilakukan, dari 5 pengklasifikasi
yang digunakan, akurasi dan F-Measure terbaik dicapai oleh pengklasifikasi SVM
dengan seleksi fitur 73,18% dan 0,7205. Hasil dari model keandalan sumber
gabungan, Twitter dan Facebook, menghasilkan akurasi dan F-Measure terbaik,
yaitu sebesar 80,00% dan 0,7974 dicapai oleh klasifier RF.