digilib@itb.ac.id +62 812 2508 8800

COVER Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 1 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 2 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 3 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 4 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 5 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 6 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

BAB 6 Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

PUSTAKA Iffatabiyan H A
Terbatas  Alice Diniarti
» Gedung UPT Perpustakaan

PT X merupakan perusahaan perbankan swasta di Indonesia yang telah beroperasi sejak tahun 1959. Dari periode Juli 2020 hingga Januari 2021, PT X memiliki 12,73% pelanggan yang berpotensi melakukan churn. Jumlah yang cukup besar ini didapatkan karena metode pendeteksian churn untuk pelanggan yang dilakukan saat ini masih dianggap kurang responsif, karena belum memanfaatkan data historis untuk melihat pola kebiasaan pelanggan sebelum meninggalkan perusahaan. Saat ini, PT X tidak memiliki sistem informasi untuk mempelajari pola kebiasaan pelanggan sebelum melakukan churn. Penelitian ini dilakukan untuk membuat model prediksi pelanggan yang berpotensi melakukan churn dengan memanfaatkan data historis yang dimiliki oleh PT X. Metodologi yang digunakan dalam pembangunan model yaitu Cross-Industry Standard Process for Data Mining (CRISP-DM). Pada penelitian ini, data yang digunakan adalah data nasabah yang dimiliki oleh Divisi Data Analytics PT X, dengan jumlah awal sebanyak tiga puluh lima variabel. Alternatif algoritma yang digunakan untuk pembangunan model adalah Random Forest dan Gradient Boosting. Pembangunan model akan memanfaatkan bahasa pemrograman Python. Berdasarkan penelitian yang dilakukan, diperoleh bahwa model Random Forest adalah model terbaik, dengan pengaturan hyperparameter max_depth=15, max_features=auto, min_sample_split=5, dan n_estimators=100. Lima variabel yang memiliki tingkat kepentingan tertinggi yaitu EOP_IDR, OTH_SAV, TAB_REG, VINTAGE, dan SPKIDS. Model tersebut memiliki nilai akurasi sebesar 72,81% dan recall sebesar 86,7%. Model kemudian diimplementasikan dalam bentuk aplikasi yang berbasis Graphical User Interface (GUI) menggunakan bahasa pemrograman Python.