Dengan berkembang pesatnya internet, topik analisis sentimen berbasis aspek (ASBA) menjadi
topik riset yang juga berkembang pesat. Namun, topik ini yang sangat terkait dengan Natural
Language Processing (NLP), masih menyisakan beberapa tantangan yang belum terselesaikan.
Beberapa tantangan tersebut di antaranya adalah representasi aspek dalam berbagai kata dan frasa,
berbagai jenis kata baik kata benda atau bukan kata benda, kompleksitas kalimat yang bervariasi,
yang sangat sulit ditangani dengan aturan sintaksis biasa. Salah satu pendekatan untuk
menyelesaikan permasalahan di atas adalah menggunakan fitur kompleks. Fitur kompleks
merupakan fitur yang berisi sekumpulan fitur dasar yang digunakan dengan aturan tertentu secara
bertingkat. Penelitian ini bertujuan menghasilkan metode ekstraksi dengan fitur kompleks pada
ASBA, yang dibangkitkan dengan menggunakan pengetahuan eksternal, sebagai masukan untuk
proses analisis sentimen berbasis supervised learning. Ekstraksi dengan fitur kompleks diharapkan
dapat menangani semua pola kemunculan aspek, opini, dan hubungan keduanya. Sementara itu
pengetahuan eksternal diharapkan dapat memberikan pertimbangan dalam identifikasi aspek dan
opini. Penelitian ini dilakukan berdasarkan pada hipotesis bahwa (1) Penggunaan fitur kompleks
dalam bentuk interaksi antara berbagai fitur dasar pada kalimat ulasan lebih relevan untuk ASBA.
Kemudian, fitur kompleks beserta aturan ekstraksi aspek yang diperoleh dari hasil pembelajaran
dapat memberikan hasil ASBA yang lebih akurat dibandingkan dengan handcrafted rules; dan (2)
Optimasi fitur dependensi pada fitur kompleks secara dinamis yang digabungkan dengan classifier
dan pengetahuan eksternal dapat meningkatkan performansi hasil ekstraksi dibandingkan
pendekatan berbasis aturan.
Penelitian ini berkontribusi menghasilkan metode ekstraksi aspek pada ASBA yang
mengoptimalisasi penggunaan fitur dependensi dan proses pembelajaran secara otomatis pada data
kalimat ulasan lintas domain. Selain itu, metode yang diusulkan bersifat lebih fleksibel karena
tidak membatasi pada jenis kata dan hasilnya lebih akurat karena mampu menangani ekspresi
berbentuk frasa. Kontribusi spesifik dari penelitian ini adalah (1) Metode pembelajaran aturan
untuk ekstraksi aspek yaitu Dependency–Sequential Covering, dan (2) Metode ekstraksi aspek
yang mengoptimalisasi penggunaan fitur dependensi secara dinamis dan pairwise classification
agar dapat meningkatkan performansi hasil ekstraksi.
Metode pembelajaran aturan Dependency-Sequential Covering merupakan algoritma
pembelajaran yang digunakan untuk mengkonstruksi aturan ekstraksi secara otomatis, yang
utamanya menggunakan fitur sintaksis dependensi dalam kalimat ulasan. Kelebihan metode ini
adalah aturan ekstraksi aspek yang jelas, mudah dipahami, dan tidak memerlukan seed opinion
dan seed rule set. Rule set yang diperoleh dari hasil pembelajaran ini digunakan bersamaan dengan
pengetahuan eksternal untuk melakukan ekstraksi aspek berbasis aturan pada dataset ulasan lintas
domain. Hasil pengujian terhadap 4 dataset ulasan dari 4 domain produk, menunjukkan bahwa
metode Dependency-Sequential Covering ini mengungguli baseline (Double Propagation dan
Aspectator) untuk nilai f-measure dengan nilai f-measure tertinggi sebesar 0.633.
Metode ekstraksi aspek dengan optimasi fitur kompleks berbasis dependensi dan pairwise
classification adalah metode kedua yang diusulkan. Pada metode ini diperkenalkan tiga fitur
dependensi baru, yaitu: relation probability, focus node, dan sentence clause. Selain itu, juga
digunakan skor aspect confidence dan opinion confidence, yang menentukan kelayakan kata aspek
dan kata opini, dengan melibatkan jenis kata, pengetahuan eksternal dan nilai sentimen. Proses
klasifikasi aspek yang layak dilakukan dengan gabungan algoritma pairwise classification dan
classifier biner yang ada. Hasil pengujian pada 2988 kalimat ulasan dari 6 domain produk
menunjukan bahwa metode ini berhasil mengungguli baseline (Dependency-Sequential Covering)
sampai dengan 19.3% pada nilai f-measure.
Kedua metode yang dihasilkan penelitian disertasi ini juga telah berhasil membuktikan hipotesis
penelitian ini, yaitu: (1) Ekstraksi aspek pada ASBA dapat dilakukan dengan memanfaatkan
karakteristik sintaksis bahasa dalam kalimat ulasan. Hasil penelitian ini menunjukkan bahwa fitur
kompleks dalam bentuk fitur sintaksis dependensi yang dikombinasikan dengan fitur sintaksis
POS-tag dan constituent parse tree lebih relevan untuk berbagai domain kalimat ulasan. Hal ini
ditunjukkan dengan penggunaannya pada aturan ekstraksi yang diperoleh dari hasil pembelajaran
dan memberikan hasil yang lebih akurat. (2) Penggunaan fitur kompleks secara dinamis yang
ditambahkan dengan optimasi fitur dependensi, beserta pairwise classifier dan pengetahuan
eksternal dapat meningkatkan performansi hasil ekstraksi dibandingkan pendekatan berbasis
aturan.