Article Details

KEANDALAN SUMBER OPINI BERBASIS MULTIFAKTOR DI JEJARING SOSIAL ONLINE

Oleh   Erwin Budi Setiawan [33214008]
Kontributor / Dosen Pembimbing : Ir. Kridanto Surendro, M.Sc., Ph.D.;Prof. Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D.;
Jenis Koleksi : S3-Disertasi
Penerbit : STEI - Teknik Elektro dan Informatika
Fakultas : Sekolah Teknik Elektro dan Informatika (STEI)
Subjek :
Kata Kunci : keandalan sumber, Twitter, Facebook, jejaring sosial online
Sumber :
Staf Input/Edit : karya  
File : 5 file
Tanggal Input : 2020-09-14 11:39:31

Generic placeholder image

Cover

PUBLIC

Generic placeholder image

Abstrak

PUBLIC

Generic placeholder image

Abstract

PUBLIC

Generic placeholder image

Disertasi

PUBLIC


Jejaring sosial online (JSO), misalkan, Facebook dan Twitter, telah mendapat perhatian luar biasa dalam dekade terakhir dan berkembang menjadi media informasi atau berbagi pendapat untuk menyebarluaskan informasi tentang peristiwa terkini. Namun, beberapa konten yang di-posting di JSO tidak dapat dipercaya, karena informasi umumnya tidak melalui proses editorial dan pengecekan fakta. Informasi yang tidak akurat yang menarik perhatian berulang kali ditampilkan dan disebar dengan cepat akan mengarah pada pertimbangan menjadi informasi yang benar. Masalah ini dapat membuat dampak negatif yang serius bagi pengguna yang menggunakan JSO sebagai sumber informasi dan pengambilan keputusan. Ada banyak cara untuk mengatasi masalah ini, misalnya, dengan memeriksa keandalan sumber. Keandalan sumber membantu pengguna untuk memutuskan sumber mana yang dapat diandalkan untuk informasi yang akurat. Disertasi ini mengusulkan integrasi faktor dan penggunaan data lintas kelompok untuk keandalan sumber di JSO, yaitu, Twitter dan Facebook. Model keandalan sumber dibangun berdasarkan lima faktor utama, yaitu faktor topic-based, faktor sentiment-based, faktor spam-based, faktor HCC (faktor hoaxbased, competence-based, dan curator-based), dan faktor UCR (faktor user-based, content-based, dan retweet-based). Disertasi ini mengembangkan 4 model untuk membangun model keandalan sumber, yaitu, model kelas topik untuk faktor topicbased, model sentimen untuk faktor sentiment-based, model spammer untuk faktor spam-based dan model kredibilitas informasi. Model kredibilitas informasi dikembangkan sebelumnya untuk menyaring informasi dan juga sebagai dasar untuk mengidentifikasi faktor-faktor utama tersebut. Pada tahap selanjutnya, tiga model juga dikembangkan, yaitu, model kelas topik, model sentimen, dan model spammer. Model kelas topik dikembangkan untuk mengurangi ketidakcocokan kosakata dengan word embeddings pada kelas topik tweet di Twitter. Tahap ini memperluas fitur menggunakan Word2Vec. Lebih lanjut, model sentimen berfokus pada pengembangan metode hybrid, yang merupakan kombinasi fitur dasar dengan ekspansi fitur berdasarkan Term Frequency - Inverse Document Frequency (TFIDF) dan ekspansi fitur berdasarkan fitur berbasis tweet. Model spammer adalah model yang diperoleh dengan menambahkan 4 fitur baru, yaitu, spam_words_indo, total_spam, #like, dan URL_rasio. Akhirnya, disertasi ini berfokus pada pengembangan model keandalan sumber di Twitter dan Facebook. Untuk mengamati keakuratan keandalan sumber, lima pengklasifikasi digunakan, yaitu, ii Naïve Bayes (NB), Support Vector Machine (SVM), Logistic Regression (Logit), J48, dan Random Forest (RF). Model keandalan sumber dibangun secara bertahap, yang pertama untuk membangun model keandalan sumber di Twitter, yang kedua, untuk membangun model keandalan sumber di Facebook dan yang terakhir, untuk membangun model keandalan sumber gabungan (Twitter dan Facebook). Hasil keandalan sumber yang diusulkan di Twitter lebih baik daripada penelitian sebelumnya dengan peningkatan akurasi sebesar 11,31% dan F-Measure sebesar 16,68%. Berdasarkan 5 pengklasifikasi, akurasi dan hasil F-Measure tertinggi dicapai oleh pengklasifikasi RF dengan seleksi fitur, yaitu sebesar 90,46% dan 0,9040. Untuk hasil keandalan sumber di Facebook, sejauh pengetahuan belum dilakukan, dari 5 pengklasifikasi yang digunakan, akurasi dan F-Measure terbaik dicapai oleh pengklasifikasi SVM dengan seleksi fitur 73,18% dan 0,7205. Hasil dari model keandalan sumber gabungan, Twitter dan Facebook, menghasilkan akurasi dan F-Measure terbaik, yaitu sebesar 80,00% dan 0,7974 dicapai oleh klasifier RF.