Penelitian ini mengkaji penerapan machine learning untuk meningkatkan efektivitas credit scoring dengan menggunakan data pinjaman fintech yang disalurkan melalui bank bjb. Fokus penelitian terletak pada identifikasi fitur-fitur prediktif yang paling relevan serta model klasifikasi yang paling akurat dalam memprediksi risiko gagal bayar pada dataset yang sangat tidak seimbang. Pendekatan kuantitatif digunakan dengan menganalisis data historis pinjaman melalui algoritma klasifikasi seperti Logistic Regression, Decision Tree, Random Forest, dan XGBoost. Untuk mengatasi masalah ketidakseimbangan data, digunakan metode ROSE (Random Over Sampling Examples). Meskipun Random Forest dan XGBoost menunjukkan kinerja yang baik pada data pelatihan, Logistic Regression menunjukkan kemampuan generalisasi yang lebih stabil pada data pengujian. Fitur-fitur prediktif utama yang diidentifikasi mencakup skor kredit, jumlah tanggungan, dan jenis pekerjaan. Temuan ini memberikan wawasan praktis tentang bagaimana machine learning dapat mendukung pengambilan keputusan kredit yang lebih akurat dan inklusif, terutama bagi institusi keuangan yang tengah menjalani transformasi digital.
Perpustakaan Digital ITB