digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC karya

Abstrak
PUBLIC karya

Abstract
PUBLIC karya

Lembar Pengesahan
PUBLIC karya

Disertasi
PUBLIC karya

Jejaring sosial online (JSO), misalkan, Facebook dan Twitter, telah mendapat perhatian luar biasa dalam dekade terakhir dan berkembang menjadi media informasi atau berbagi pendapat untuk menyebarluaskan informasi tentang peristiwa terkini. Namun, beberapa konten yang di-posting di JSO tidak dapat dipercaya, karena informasi umumnya tidak melalui proses editorial dan pengecekan fakta. Informasi yang tidak akurat yang menarik perhatian berulang kali ditampilkan dan disebar dengan cepat akan mengarah pada pertimbangan menjadi informasi yang benar. Masalah ini dapat membuat dampak negatif yang serius bagi pengguna yang menggunakan JSO sebagai sumber informasi dan pengambilan keputusan. Ada banyak cara untuk mengatasi masalah ini, misalnya, dengan memeriksa keandalan sumber. Keandalan sumber membantu pengguna untuk memutuskan sumber mana yang dapat diandalkan untuk informasi yang akurat. Disertasi ini mengusulkan integrasi faktor dan penggunaan data lintas kelompok untuk keandalan sumber di JSO, yaitu, Twitter dan Facebook. Model keandalan sumber dibangun berdasarkan lima faktor utama, yaitu faktor topic-based, faktor sentiment-based, faktor spam-based, faktor HCC (faktor hoaxbased, competence-based, dan curator-based), dan faktor UCR (faktor user-based, content-based, dan retweet-based). Disertasi ini mengembangkan 4 model untuk membangun model keandalan sumber, yaitu, model kelas topik untuk faktor topicbased, model sentimen untuk faktor sentiment-based, model spammer untuk faktor spam-based dan model kredibilitas informasi. Model kredibilitas informasi dikembangkan sebelumnya untuk menyaring informasi dan juga sebagai dasar untuk mengidentifikasi faktor-faktor utama tersebut. Pada tahap selanjutnya, tiga model juga dikembangkan, yaitu, model kelas topik, model sentimen, dan model spammer. Model kelas topik dikembangkan untuk mengurangi ketidakcocokan kosakata dengan word embeddings pada kelas topik tweet di Twitter. Tahap ini memperluas fitur menggunakan Word2Vec. Lebih lanjut, model sentimen berfokus pada pengembangan metode hybrid, yang merupakan kombinasi fitur dasar dengan ekspansi fitur berdasarkan Term Frequency - Inverse Document Frequency (TFIDF) dan ekspansi fitur berdasarkan fitur berbasis tweet. Model spammer adalah model yang diperoleh dengan menambahkan 4 fitur baru, yaitu, spam_words_indo, total_spam, #like, dan URL_rasio. Akhirnya, disertasi ini berfokus pada pengembangan model keandalan sumber di Twitter dan Facebook. Untuk mengamati keakuratan keandalan sumber, lima pengklasifikasi digunakan, yaitu, ii Naïve Bayes (NB), Support Vector Machine (SVM), Logistic Regression (Logit), J48, dan Random Forest (RF). Model keandalan sumber dibangun secara bertahap, yang pertama untuk membangun model keandalan sumber di Twitter, yang kedua, untuk membangun model keandalan sumber di Facebook dan yang terakhir, untuk membangun model keandalan sumber gabungan (Twitter dan Facebook). Hasil keandalan sumber yang diusulkan di Twitter lebih baik daripada penelitian sebelumnya dengan peningkatan akurasi sebesar 11,31% dan F-Measure sebesar 16,68%. Berdasarkan 5 pengklasifikasi, akurasi dan hasil F-Measure tertinggi dicapai oleh pengklasifikasi RF dengan seleksi fitur, yaitu sebesar 90,46% dan 0,9040. Untuk hasil keandalan sumber di Facebook, sejauh pengetahuan belum dilakukan, dari 5 pengklasifikasi yang digunakan, akurasi dan F-Measure terbaik dicapai oleh pengklasifikasi SVM dengan seleksi fitur 73,18% dan 0,7205. Hasil dari model keandalan sumber gabungan, Twitter dan Facebook, menghasilkan akurasi dan F-Measure terbaik, yaitu sebesar 80,00% dan 0,7974 dicapai oleh klasifier RF.