digilib@itb.ac.id +62 812 2508 8800

Saat ini ulasan produk semakin berkembang dan menjadi sumber yang penting bagi beberapa pihak. Namun, hampir tidak mungkin bagi konsumen ataupun calon konsumen untuk membaca seluruh ulasan tersebut. Oleh karena itu, peringkasan opini berperan penting dalam menganalisis ulasan dan menghasilkan ringkasan opini. Tujuan penelitian disertasi ini adalah menghasilkan sistem peringkasan opini berbasis aspek yang dapat memenuhi kebutuhan informasi opini. Terdapat empat tahapan yang dilakukan, yaitu: 1) ekstraksi ekspresi aspek dan sentimen; 2) klasifikasi sentimen; (3) kategorisasi aspek; dan 4) peringkasan opini berbasis aspek. Terdapat tiga kontribusi utama pada penelitian disertasi ini. Kontribusi pertama adalah metode Clue Propagation untuk mengekstraksi pasangan aspek dan sentimen. Kontribusi kedua adalah pengembangan metode kategorisasi aspek berbasis kemiripan semantik dengan model semantik terdistribusi. Kontribusi ketiga adalah pengembangan metode peringkasan opini berbasis aspek, yang mencakup: a) metode perhitungan rating berbasis aspek; b) visualisasi rating berbasis aspek; dan c) kriteria sistem rating sebagai salah satu alternatif acuan untuk menilai suatu sistem rating. Clue Propagation merupakan modifikasi metode Double Propagation, yaitu metode ekstraksi berbasis propagasi untuk mengekstraksi aspek dan kata sentimen menggunakan aturan relasi dependensi. Meskipun metode Double Propagation efektif, namun hanya mengekstraksi relasi nomina – adjektiva, sehingga propagasi yang dimulai hanya dengan seed adjektiva dapat mengakibatkan adanya propagasi yang terputus dan terdapat ekspresi aspek yang tidak terekstraksi. Potensi ekspresi aspek yang tidak berhasil terekstraksi tersebut dapat dikurangi dengan menambahkan penggunaan multiple clues pada tahap propagasi, yaitu clue adjektiva, clue ekspresi verba, clue ekspresi entitas, dan clue adverbia. Relasi dependensi antara aspek dan kata sentimen memungkinkan aspek dapat diidentifikasi berdasarkan clue adjektiva, clue ekspresi verba, dan clue adverbia, sedangkan kata sentimen dapat diidentifikasi berdasarkan clue ekspresi entitas. Hasil pengujian menunjukkan bahwa penggunaan empat clue dan aturan relasi dependensi pada metode Clue Propagation dapat mengekstraksi tidak hanya relasi nomina– adjektiva, tetapi dapat pula mengekstraksi relasi nomina–verba, sehingga mengurangi potensi terputusnya propagasi pada metode Double Propagation. Pada kontribusi kedua, penelitian ini mengembangkan metode kategorisasi aspek berbasis kemiripan semantik. Perhitungan kemiripan semantik berbasis model semantik terdistribusi word2vec didasarkan pada informasi co-occurrence kata pada korpus, dimana korpus memiliki permasalahan OOV. Penelitian ini memanfaatkan kemiripan semantik dari WordNet untuk mengatasi permasalahan tersebut, dengan mengkombinasikan secara linear pendekatan model semantik terdistribusi dan pendekatan berbasis WordNet untuk kategorisasi aspek. Pada kontribusi ketiga, penelitian ini mengembangkan sistem peringkasan opini berbasis aspek. Ada kalanya pengguna ingin mengetahui opini tentang kombinasi beberapa aspek tertentu yang ada pada suatu produk. Penelitian disertasi ini mengembangkan metode perhitungan rating produk berbasis aspek, sehingga pengguna dapat memperoleh informasi opini sesuai kombinasi aspek yang diinginkan, disertai visualisasi rating yang informatif. Selain itu, juga diusulkan suatu kriteria evaluasi yang dapat digunakan untuk menilai suatu sistem rating. Hasil pengujian konsistensi dan reliabilitas menunjukkan bahwa metode perhitungan rating dan visualisasi rating memiliki nilai korelasi yang cukup tinggi dibandingkan dengan metode baseline. Hasil survei juga menunjukkan bahwa visualisasi rating yang diusulkan pada penelitian ini dapat dijadikan sebagai salah satu alternatif visualisasi rating berbasis aspek.