Klasifikasi relasi (relation classificaton / RC) dalam domain musik digunakan
untuk mengidentifikasi hubungan antara dua entitas bernama secara otomatis.
Relasi tersebut digunakan untuk melengkapi basis data pengetahuan musik yang
kemudian digunakan di beragam penerapan seperti informasi penjualan musik,
mesin pencari musik, perekomendasi musik, pembangkitan otomatis berita musik,
ensiklopedia musik, dan sebagainya. Yang menjadi dasar penelitian ini adalah
belum adanya riset khusus terkait, serta belum adanya korpus RC musik Bahasa
Indonesia.
Tujuan dari tesis ini menghasilkan model RC untuk berita musik berbahasa
Indonesia. Selain itu tesis ini juga menghasilkan dataset RC bahasa Indonesia
untuk domain musik. Hipotesis penelitian ini adalah, pembuatan model RC
menggunakan CNN akan memiliki kinerja yang lebih baik dibandingkan metode
baseline yaitu Support Vector Machine (SVM) dan shallow learning ketika
diterapkan pada berita musik Indonesia.
Metode Convolutional Neural Network digunakan untuk membuat model RC
dengan input representasi vektor relasi. Metode oversampling seperti SMOTE dan
word perturbation digunakan untuk mengatasi data tidak seimbang. Metode
binary relevance digunakan untuk mengatasi permasalahan multilabel.
Relasi yang ditinjau dalam penelitian ini adalah relasi antara dua entitas bernama
dalam satu kalimat. Dua bentuk relasi yang ditangani adalah relasi single-label, dan
multilabel. Pemodelan NER tidak menjadi bagian dalam penelitian ini.