digilib@itb.ac.id +62 812 2508 8800

Cover
PUBLIC karya

Abstrak dan Abstract
PUBLIC karya

Lembar Pengesahan
PUBLIC karya

Tesis
PUBLIC karya

Produk Domestik Bruto (PDB) merupakan suatu indikator makro untuk mengetahui perkembangan ekonomi suatu wilayah. PDB disusun oleh Badan Pusat Statistik (BPS) dengan menggunakan metodologi SNN (Sistem Neraca Nasional). Dalam proses perhitungannya, BPS menggunakan analisis berita fenomena ekonomi untuk mengontrol dan meningkatkan kualitas angka PDB. Untuk mendapatkan data fenomena ekonomi tersebut, beberapa sumber yang digunakan anatara lain berita daring dan media cetak. Saat ini proses analisis fenomena ekonomi masih dilakukan secara manual oleh tim BPS sehingga memerlukan banyak waktu untuk proses kompilasi. Permasalahan lain yang muncul ketika sebuah artikel fenomena ekonomi memiliki lebih dari satu kategori lapangan usaha. Beberapa data fenomena ekonomi yang dapat dikategorikan lebih dari satu sektor mengindikasikan bahwa permasalahan klasifikasi artikel berita fenomena ekonomi memerlukan pendekatan klasifikasi multilabel. Penelitian ini menggunakan transformasi masalah untuk melakukan klasifikasi multilabel berita fenomena ekonomi secara otomatis untuk jenis PDB menurut Lapangan Usaha yang terdiri dari 17 kategori dan 13 subkategori. Metode yang yang digunakan dalam proses pengembangan model klasifikasi multilabel adalah Binary Relevance (BR), Classifier Chain (CC), dan Label Powerset (LP). Pengukuran evaluasi model digunakan metode Example Based Metrics. Korpus data yang dipersiapkan untuk training sebanyak 1000 artikel dan 100 artikel untuk data uji. Penelitian ini juga melibatkan empat teknik vektorisasi fitur yaitu TF-IDF, word2vec, fastText, dan doc2vec. Model terbaik diperoleh melalui kombinasi metode TF-IDF, LP, dan Linear SVC dengan f1-score micro validasi 75% dan meningkat menjadi 82% pada saat pengujian. Luaran dari penelitian ini dapat menjadi alat bantu untuk mempercepat proses klasifikasi berita fenomena ekonomi sehingga proses analisisnya menjadi lebih efisien.