digilib@itb.ac.id +62 812 2508 8800

Abstrak
PUBLIC karya

Abstract
PUBLIC karya

Tesis
PUBLIC karya

Klasifikasi relasi (relation classificaton / RC) dalam domain musik digunakan untuk mengidentifikasi hubungan antara dua entitas bernama secara otomatis. Relasi tersebut digunakan untuk melengkapi basis data pengetahuan musik yang kemudian digunakan di beragam penerapan seperti informasi penjualan musik, mesin pencari musik, perekomendasi musik, pembangkitan otomatis berita musik, ensiklopedia musik, dan sebagainya. Yang menjadi dasar penelitian ini adalah belum adanya riset khusus terkait, serta belum adanya korpus RC musik Bahasa Indonesia. Tujuan dari tesis ini menghasilkan model RC untuk berita musik berbahasa Indonesia. Selain itu tesis ini juga menghasilkan dataset RC bahasa Indonesia untuk domain musik. Hipotesis penelitian ini adalah, pembuatan model RC menggunakan CNN akan memiliki kinerja yang lebih baik dibandingkan metode baseline yaitu Support Vector Machine (SVM) dan shallow learning ketika diterapkan pada berita musik Indonesia. Metode Convolutional Neural Network digunakan untuk membuat model RC dengan input representasi vektor relasi. Metode oversampling seperti SMOTE dan word perturbation digunakan untuk mengatasi data tidak seimbang. Metode binary relevance digunakan untuk mengatasi permasalahan multilabel. Relasi yang ditinjau dalam penelitian ini adalah relasi antara dua entitas bernama dalam satu kalimat. Dua bentuk relasi yang ditangani adalah relasi single-label, dan multilabel. Pemodelan NER tidak menjadi bagian dalam penelitian ini.