digilib@itb.ac.id +62 812 2508 8800

Dengan berkembang pesatnya internet, topik analisis sentimen berbasis aspek (ASBA) menjadi topik riset yang juga berkembang pesat. Namun, topik ini yang sangat terkait dengan Natural Language Processing (NLP), masih menyisakan beberapa tantangan yang belum terselesaikan. Beberapa tantangan tersebut di antaranya adalah representasi aspek dalam berbagai kata dan frasa, berbagai jenis kata baik kata benda atau bukan kata benda, kompleksitas kalimat yang bervariasi, yang sangat sulit ditangani dengan aturan sintaksis biasa. Salah satu pendekatan untuk menyelesaikan permasalahan di atas adalah menggunakan fitur kompleks. Fitur kompleks merupakan fitur yang berisi sekumpulan fitur dasar yang digunakan dengan aturan tertentu secara bertingkat. Penelitian ini bertujuan menghasilkan metode ekstraksi dengan fitur kompleks pada ASBA, yang dibangkitkan dengan menggunakan pengetahuan eksternal, sebagai masukan untuk proses analisis sentimen berbasis supervised learning. Ekstraksi dengan fitur kompleks diharapkan dapat menangani semua pola kemunculan aspek, opini, dan hubungan keduanya. Sementara itu pengetahuan eksternal diharapkan dapat memberikan pertimbangan dalam identifikasi aspek dan opini. Penelitian ini dilakukan berdasarkan pada hipotesis bahwa (1) Penggunaan fitur kompleks dalam bentuk interaksi antara berbagai fitur dasar pada kalimat ulasan lebih relevan untuk ASBA. Kemudian, fitur kompleks beserta aturan ekstraksi aspek yang diperoleh dari hasil pembelajaran dapat memberikan hasil ASBA yang lebih akurat dibandingkan dengan handcrafted rules; dan (2) Optimasi fitur dependensi pada fitur kompleks secara dinamis yang digabungkan dengan classifier dan pengetahuan eksternal dapat meningkatkan performansi hasil ekstraksi dibandingkan pendekatan berbasis aturan. Penelitian ini berkontribusi menghasilkan metode ekstraksi aspek pada ASBA yang mengoptimalisasi penggunaan fitur dependensi dan proses pembelajaran secara otomatis pada data kalimat ulasan lintas domain. Selain itu, metode yang diusulkan bersifat lebih fleksibel karena tidak membatasi pada jenis kata dan hasilnya lebih akurat karena mampu menangani ekspresi berbentuk frasa. Kontribusi spesifik dari penelitian ini adalah (1) Metode pembelajaran aturan untuk ekstraksi aspek yaitu Dependency–Sequential Covering, dan (2) Metode ekstraksi aspek yang mengoptimalisasi penggunaan fitur dependensi secara dinamis dan pairwise classification agar dapat meningkatkan performansi hasil ekstraksi. Metode pembelajaran aturan Dependency-Sequential Covering merupakan algoritma pembelajaran yang digunakan untuk mengkonstruksi aturan ekstraksi secara otomatis, yang utamanya menggunakan fitur sintaksis dependensi dalam kalimat ulasan. Kelebihan metode ini adalah aturan ekstraksi aspek yang jelas, mudah dipahami, dan tidak memerlukan seed opinion dan seed rule set. Rule set yang diperoleh dari hasil pembelajaran ini digunakan bersamaan dengan pengetahuan eksternal untuk melakukan ekstraksi aspek berbasis aturan pada dataset ulasan lintas domain. Hasil pengujian terhadap 4 dataset ulasan dari 4 domain produk, menunjukkan bahwa metode Dependency-Sequential Covering ini mengungguli baseline (Double Propagation dan Aspectator) untuk nilai f-measure dengan nilai f-measure tertinggi sebesar 0.633. Metode ekstraksi aspek dengan optimasi fitur kompleks berbasis dependensi dan pairwise classification adalah metode kedua yang diusulkan. Pada metode ini diperkenalkan tiga fitur dependensi baru, yaitu: relation probability, focus node, dan sentence clause. Selain itu, juga digunakan skor aspect confidence dan opinion confidence, yang menentukan kelayakan kata aspek dan kata opini, dengan melibatkan jenis kata, pengetahuan eksternal dan nilai sentimen. Proses klasifikasi aspek yang layak dilakukan dengan gabungan algoritma pairwise classification dan classifier biner yang ada. Hasil pengujian pada 2988 kalimat ulasan dari 6 domain produk menunjukan bahwa metode ini berhasil mengungguli baseline (Dependency-Sequential Covering) sampai dengan 19.3% pada nilai f-measure. Kedua metode yang dihasilkan penelitian disertasi ini juga telah berhasil membuktikan hipotesis penelitian ini, yaitu: (1) Ekstraksi aspek pada ASBA dapat dilakukan dengan memanfaatkan karakteristik sintaksis bahasa dalam kalimat ulasan. Hasil penelitian ini menunjukkan bahwa fitur kompleks dalam bentuk fitur sintaksis dependensi yang dikombinasikan dengan fitur sintaksis POS-tag dan constituent parse tree lebih relevan untuk berbagai domain kalimat ulasan. Hal ini ditunjukkan dengan penggunaannya pada aturan ekstraksi yang diperoleh dari hasil pembelajaran dan memberikan hasil yang lebih akurat. (2) Penggunaan fitur kompleks secara dinamis yang ditambahkan dengan optimasi fitur dependensi, beserta pairwise classifier dan pengetahuan eksternal dapat meningkatkan performansi hasil ekstraksi dibandingkan pendekatan berbasis aturan.