Penelitian ini menyajikan wawasan kepuasan pelanggan Airbnb di Indonesia
dengan menggunakan model pembelajaran mesin pada data Airbnb. Untuk
mengembangkan model, penelitian ini memanfaatkan data Airbnb dari website
Airbnb sebagai data utama untuk proses pembelajaran mesin melalui web scraping
dan data analisis pendukung dari Badan Pusat Statistik Indonesia (BPS Indonesia).
Ulasan pelanggan, daftar atribut penilaian (komunikasi, kebersihan, akurasi, nilai
ekonomi, lokasi, check-in, ulasan total, area, dan harga.), dan kota ditetapkan
sebagai prediktor. Penulis menggunakan metode pembelajaran mesin yang
berbeda seperti regresi linier, analisis sentimen, LDA, dan BERT masing-masing
dengan variabel prediktornya masing-masing. Untuk metode regresi penulis
menggunakan 5 komposisi data yang berbeda berdasarkan kota dan untuk metode
pembelajaran mesin berbasis NLP penulis menggunakan 8 komposisi data yang
berbeda: 3 bagian berdasarkan periode waktu dari keseluruhan data dan 5 bagian
berdasarkan kota dari keseluruhan data. Untuk mengevaluasi model, penulis
menggunakan root mean square error (RMSE) dan mean absolute error (MAE)
untuk regresi linier. Untuk LDA, penulis menggunakan kemungkinan log dan skor
kebingungan. Untuk BERT, penulis menggunakan skor siluet.
Dalam regresi linier, dengan menggunakan korelasi bobot sebelum memasukkan
fitur-fitur penting ke dalam model, kami mendapatkan variasi yang berbeda dari
pentingnya daftar atribut penilaian untuk setiap kota. Setiap kota memiliki skor
RMSE dan MAE yang baik untuk memprediksi hasil. Dari analisis sentimen,
pengguna Airbnb di Indonesia merasa puas dengan listing di Indonesia. Dengan
perbandingan antara puas dan tidak puas sebesar 59:1. Dengan Lombok,
Surabaya, dan periode 2011-2015 memiliki selisih review positif dan negatif
tertinggi. Dari Topic Modelling, hal yang dapat meningkatkan kepuasan pelanggan
negatif adalah perbaikan tempat, fasilitas, kebersihan, dan akomodasi. Setiap kota
dan setiap periode waktu tidak memiliki perbedaan besar dalam topik yang
dibahas, topik yang dibahas kurang lebih tentang tempat, kebersihan, fasilitas,
lokasi, makanan, dan pelayanan. Tempat adalah kata kunci yang paling umum
ditemukan.