Mempertahankan pelanggan agar tetap setia untuk membeli atau menggunakan jasa
merupakan hal yang menantang bagi perusahaan. Pelanggan yang berpindah dari suatu
perusahaan ke perusahaan lain disebut churn pelanggan. Churn pelanggan merupakan
salah satu perhatian utama bagi perusahaan perdagangan elektronik karena berdampak
negatif terhadap pertumbuhan bisnis. Churn pelanggan dapat diprediksi dengan data
pelanggan yang tercatat selama transaksi. Pada penelitian ini penulis akan memprediksi
churn menggunakan metode Gradient Boost (GBT) dan Extreme Gradient Boost
(XGBT) sekaligus membandingkan kedua metode tersebut. Kedua metode ini dipilih
karena kemampuannya dalam menangani masalah klasifikasi yang kompleks dan memberikan
akurasi prediksi yang tinggi. Pada penelitian tugas akhir ini penulis menggunakan
data pelanggan suatu perdagangan elektronik yang berasal dari sumber terbuka
(kaggle). Kedua metode tersebut menggunakan model ensemble yaitu menggabungkan
pohon untuk meningkatkan keakuratan dan performa prediksi. Untuk mengevaluasi kinerja
model, digunakan matriks konfusi dan validasi silang lipatan-k. Selain itu, kurva
ROC dan AUC juga digunakan untuk mengukur kemampuan model dalam memprediksi
churn pelanggan. Hasil dari penelitian ini menunjukkan akurasi yang dihasilkan
oleh metode GBT adalah 0.942 sedangkan akurasi yang dihasilkan oleh metode XGBT
adalah 0.964 . Hasil eksperimen menunjukkan bahwa kedua metode, GBT dan XGBT,
mampu memberikan hasil prediksi churn pelanggan yang baik dengan tingkat akurasi
yang tinggi. Namun, XGBT memperlihatkan performa yang sedikit lebih baik daripada
GBT dalam hal kinerja prediksi churn.