digilib@itb.ac.id +62 812 2508 8800

ABSTRAK M Sammy Ivan Kurniawan
Terbatas  Dewi Supryati
» Gedung UPT Perpustakaan

PT X merupakan suatu perusahaan startup dalam bidang education technology yang menawarkan berbagai macam jasa bimbingan termasuk bimbingan kuliah di luar negeri dan bimbingan bahasa asing. Salah satu kontributor utama dari pendapatan PT X adalah kegiatan cross-selling dan upselling yang terjadi dalam berbagai layanan PT X karena banyak layanan PT X bersifat komplementer dengan satu sama lain. Akan tetapi, kegiatan cross-selling dan upselling menurun sebesar 64.28% pada tahun 2021 awal. Akar masalah dari penurunan kegiatan ini adalah karena pihak sales dari PT X merasa bahwa proses cross-selling dan upselling memakan waktu yang cukup banyak karena sales harus menghubungi semua pelanggan yang sudah selesai melakukan bimbingan pada layanan tertentu. Padahal, tidak semua pelanggan yang dihubungi akan berpotensi untuk membeli produk kembali. Dengan adanya masalah ini, penelitian ini berfokus untuk melakukan pengembangan model data mining yang dapat memprediksi potensi dari leads yang akan melakukan cross-selling dan/atau upselling pada salah satu layanan bimbingan bahasa asing PT X yakni academy series yang ditujukan untuk menjadi sumber utama dilakukannya kegiatan ini. Setelah model dibangun, dibuat suatu sistem pemilihan leads berpotensi dalam bentuk prototipe aplikasi sederhana yang dapat digunakan sales untuk melakukan prediksi sehingga proses penawaran cross-selling dan upselling dapat berjalan dengan lebih efektif dan efisien. Penelitian ini mengacu kepada metodologi CRISP-DM yang merupakan salah satu standar alur data mining yang populer digunakan. Dilakukan beberapa proses di dalamnya yakni business understanding, data understanding, data preparation, modelling, evaluation, dan deployment. Dalam penelitian ini, digunakan 4 alternatif model yakni support vector machine (SVM), random forest (RF), extreme gradient boosting (XGBoost), light gradient boosting machine (LGBM), dan voting classifier. Kemudian, digunakan pula teknik penanganan ketidakseimbangan data SMOTENC, SVMSMOTE, BorderlineSMOTE (BLSMOTE), dan RandomOverSampler (ROS) sebagai alternatif. Diperoleh bahwa model terbaik adalah RF dengan teknik ROS yang menghasilkan F1-Score rata-rata sebesar 83.83% dan akurasi ratarata sebesar 80.13% yang dapat meningkatkan aktivitas upselling dan cross-selling untuk meningkatkan pendapatan 4 kali lipat dari keadaan yang dicatatkan pada penelitian ini.