COVID-19 belakangan ini menjadi perhatian khusus sebagai masalah kesehatan
masyarakat global karena penyebarannya yang sangat cepat dengan angka kematian
yang tinggi. Pengendalian yang efektif terhadap penyakit ini di tingkat masyarakat
sangat bergantung terhadap ketersediaan informasi yang akurat. Akan tetapi,
penyebaran masif misinformasi melalui internet membuat masyarakat rentan
terpapar informasi yang tidak benar. Sistem pengecekan fakta otomatis dapat
berperan dalam membantu memvalidasi kebenaran suatu informasi dalam kasus
tersebut. Sistem seperti itu umumnya menggunakan pendekatan Natural Language
Inference (NLI) untuk menemukan hubungan semantik antara kalimat premis yang
telah terbukti kebenarannya dengan kalimat hipotesis sebagai klaim yang hendak
diperiksa kebenarannya. Hubungan semantik tersebut dapat berupa entailment,
contradiction, atau neutral. Suatu informasi dianggap benar apabila terbentuk
hubungan semantik berupa entailment di antara kalimat tersebut.
Penelitian ini memperkenalkan penggunaan Knowledge Graph (KG) untuk
meningkatkan kinerja NLI dalam memvalidasi kebenaran suatu informasi. KG
berperan dalam menambahkan informasi faktual sehingga model dapat mengambil
simpulan terhadap kebenaran suatu informasi berdasarkan bukti faktual. Dalam
pendekatan arsitektur model yang diperkenalkan dalam penelitian ini, informasi
dari KG diproses dalam modul terpisah dan digabungkan dengan informasi
hubungan semantik antara kalimat premis dan hipotesis yang diproses oleh modul
NLI. Setelah itu, informasi diproses oleh modul terakhir untuk mengambil
simpulan.
Pada implementasi arsitektur model yang diperkenalkan tersebut, input NLI dan
KG diproses secara terpisah kemudian menggunakan penggabungan dari masingmasing
vektor representatif dari input tersebut untuk membentuk vektor akhir.
Vektor akhir kemudian digunakan sebagai input pada classifier untuk
mengeluarkan hasil akhir. Model yang dihasilkan kemudian dilatih dengan
menggunakan dataset NLI COVID-19 Bahasa Indonesia dan KG COVID-19
Bahasa Indonesia.
Hasil penelitian menunjukkan bahwa penggunaan KG dalam arsitektur model yang
diperkenalkan dapat meningkatkan kinerja NLI dalam memvalidasi kebenaran
ii
informasi. Akurasi tertinggi yang dapat dicapai hingga mencapai 0,8616 dalam
memvalidasi informasi COVID-19 dalam Bahasa Indonesia. KG memberikan
informasi tambahan yang dapat memperkuat validasi kebenaran suatu informasi,
daripada hanya mengandalkan hubungan semantik yang terbentuk. Oleh karena itu,
KG dapat menjadi komponen penting dalam sebuah sistem pengecekan fakta
otomatis untuk memvalidasi kebenaran suatu informasi berdasarkan bukti faktual.