Cover
PUBLIC karya Abstrak dan Abstract
PUBLIC karya Lembar Pengesahan
PUBLIC karya Tesis
PUBLIC karya
Produk Domestik Bruto (PDB) merupakan suatu indikator makro untuk mengetahui
perkembangan ekonomi suatu wilayah. PDB disusun oleh Badan Pusat Statistik
(BPS) dengan menggunakan metodologi SNN (Sistem Neraca Nasional). Dalam
proses perhitungannya, BPS menggunakan analisis berita fenomena ekonomi untuk
mengontrol dan meningkatkan kualitas angka PDB. Untuk mendapatkan data
fenomena ekonomi tersebut, beberapa sumber yang digunakan anatara lain berita
daring dan media cetak. Saat ini proses analisis fenomena ekonomi masih dilakukan
secara manual oleh tim BPS sehingga memerlukan banyak waktu untuk proses
kompilasi. Permasalahan lain yang muncul ketika sebuah artikel fenomena
ekonomi memiliki lebih dari satu kategori lapangan usaha. Beberapa data fenomena
ekonomi yang dapat dikategorikan lebih dari satu sektor mengindikasikan bahwa
permasalahan klasifikasi artikel berita fenomena ekonomi memerlukan pendekatan
klasifikasi multilabel.
Penelitian ini menggunakan transformasi masalah untuk melakukan klasifikasi
multilabel berita fenomena ekonomi secara otomatis untuk jenis PDB menurut
Lapangan Usaha yang terdiri dari 17 kategori dan 13 subkategori. Metode yang
yang digunakan dalam proses pengembangan model klasifikasi multilabel adalah
Binary Relevance (BR), Classifier Chain (CC), dan Label Powerset (LP).
Pengukuran evaluasi model digunakan metode Example Based Metrics. Korpus
data yang dipersiapkan untuk training sebanyak 1000 artikel dan 100 artikel untuk
data uji. Penelitian ini juga melibatkan empat teknik vektorisasi fitur yaitu TF-IDF,
word2vec, fastText, dan doc2vec. Model terbaik diperoleh melalui kombinasi
metode TF-IDF, LP, dan Linear SVC dengan f1-score micro validasi 75% dan
meningkat menjadi 82% pada saat pengujian. Luaran dari penelitian ini dapat
menjadi alat bantu untuk mempercepat proses klasifikasi berita fenomena ekonomi
sehingga proses analisisnya menjadi lebih efisien.