digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Dessy Rondang Monaomi

Review produk dari pembeli lain di e-commerce dapat mencakup apakah produk tersebut cocok untuk kulit sensitif, ideal untuk tipe tubuh tertentu, dan masih banyak lagi. Jumlah review pada satu produk bisa saja mencapai ribuan review dengan isi review yang beragam. Hal tersebut tentu saja dapat berdampak buruk bagi penjual dan pembeli produk karena tidak tersedianya waktu yang cukup untuk membaca dan menganalisa seluruh review produk tersebut. Oleh karena itu, perlu dibangun suatu sistem yang dapat menganalisis tinjauan tersebut. Karena data ulasan bisa mencapai ribuan, memilih fitur optimal untuk kinerja terbaik saat melakukan analisis sentimen sangatlah penting. Data juga cenderung memiliki dimensi yang tinggi sehingga sulit untuk diproses dan mengakibatkan overfitting. Reduksi dimensi dapat dilakukan untuk mengatasi hal tersebut, salah satunya dengan menggunakan metode pemilihan fitur. Salah satu metode pemilihan fitur adalah Recursive Feature Selection (RFE). RFE akan menghilangkan fitur-fitur yang nilai kepentingan fiturnya lemah dimana perhitungan kepentingan fitur pada RFE bergantung pada estimator yang digunakan. Hal ini menyebabkan RFE pemilihan fitur ketika menggunakan satu estimator akan menghasilkan nilai yang berbeda ketika menggunakan estimator lainnya. Terkadang RFE menghilangkan fitur yang, dengan estimator berbeda, memiliki nilai kepentingan fitur yang baik karena menggunakan estimator yang menghasilkan nilai kepentingan fitur yang tidak optimal. Penelitian ini mengusulkan untuk menerapkan metode hybrid RFE, dimana estimator akan digabungkan untuk menghasilkan gabungan kepentingan fitur, yang kemudian akan diproses oleh RFE untuk meningkatkan kinerja RFE ketika menghilangkan fitur-fitur lemah dan meningkatkan kinerja sistem analisis sentimen. Penelitian ini mengusulkan untuk menggabungkan estimator Support Vector Machine (SVM) dan Random Forest (RF). Penggunaan metode gabungan SVMRF-RFE yang diusulkan secara umum dapat meningkatkan hasil kinerja pada analisis sentimen dibandingkan dengan metode dasar lainnya.