digilib@itb.ac.id +62 812 2508 8800

Analisis sentimen merupakan salah satu topik yang bertujuan untuk menentukan polaritas sentimen dari opini atau pendapat pada data teks. Penentuan representasi fitur dari data teks memiliki pengaruh pada kinerja sistem analisis sentimen. Selain representasi fitur leksikal bag of words dan TF-IDF, perkembangan word embedding sebagai representasi fitur semantik kata banyak digunakan pada penelitian analisis sentimen. Namun, word embedding umum hanya memodelkan kata secara semantik dan tidak mempertimbangkan informasi sentimen dari kata. Sentiment-specific word embedding (SSWE) merupakan representasi yang tidak hanya memodelkan kata secara semantik, tetapi juga mempertimbangkan informasi sentimen dari kata. SSWE menghasilkan model vektor fitur n-dimensi untuk setiap kata pada korpus latih. Model ini didapatkan dengan melatih embedding melalui jaringan saraf tiruan dan algoritma pelatihan backpropagation. Sampai saat ini, penelitian analisis sentimen berbahasa Indonesia menggunakan SSWE masih belum ditemukan. Pada tugas akhir ini, dilakukan observasi pengaruh SSWE terhadap klasifikasi sentimen berbahasa Indonesia. Korpus dan dataset yang digunakan adalah kumpulan ulasan bersentimen yang didapatkan dari situs TripAdvisor. Sebanyak 306.448 ulasan digunakan sebagai korpus SSWE dan 12.389 ulasan digunakan untuk data latih. Hasil eksperimen tugas akhir menyatakan bahwa penggunaan SSWE meningkatkan kinerja klasifikasi sentimen dibanding menggunakan Word2Vec. Dengan menggunakan model klasifikasi jaringan saraf tiruan, F1-score yang dihasilkan oleh SSWE mencapai 0,7602 untuk test set, dan 0,7687 untuk 10-fold cross-validation. Namun, F1-score dari penggunaan SSWE maupun Word2Vec biasa masih di bawah F1-score yang dihasilkan oleh eksperimen baseline fitur TF-IDF yang mencapai 0,8521 untuk test set dan 0,8492 untuk 10-fold cross-validation.