Article Details

STUDI KOMPARASI ALGORITME MACHINE LEARNING DECISION TREE DAN VARIANNYA UNTUK PENILAIAN RISIKO KREDIT PADA PEER TO PEER LENDING

Oleh   Teo Wijayarto [18215004]
Kontributor / Dosen Pembimbing : Dr. Ir. Dimitri Mahayana, M.Eng.;
Jenis Koleksi : S1-Tugas Akhir
Penerbit : STEI - Sistem dan Teknologi Informasi
Fakultas : Sekolah Teknik Elektro dan Informatika (STEI)
Subjek : Technology
Kata Kunci : machine learning, P2P Lending, decision tree, random forest, XGBoost
Sumber :
Staf Input/Edit : Alice Diniarti   Ena Sukmana
File : 7 file
Tanggal Input : 15 Jun 2022

Generic placeholder image
BAB 1 Teo Wijayarto

Terbatas
» Gedung UPT Perpustakaan

Generic placeholder image
BAB 2 Teo Wijayarto

Terbatas
» Gedung UPT Perpustakaan

Generic placeholder image
BAB 3 Teo Wijayarto

Terbatas
» Gedung UPT Perpustakaan

Generic placeholder image
BAB 4 Teo Wijayarto

Terbatas
» Gedung UPT Perpustakaan

Generic placeholder image
BAB 5 Teo Wijayarto

Terbatas
» Gedung UPT Perpustakaan


Kemudahan peminjaman melalui startup teknologi merupakan peluang yang sangat besar di Indonesia dikarenakan hanya 49% dari 264 juta penduduk Indonesia yang memiliki akun bank. Startup menggunakan skema P2P lending untuk bisa menyalurkan dana kepada kreditor. Hal ini menyebabkan dana yang disalurkan oleh P2P lending bukan merupakan dana perusahaan melainkan dana nasabah perorangan. Tidak seperti bank yang memliki standard kepatuhan yang tinggi dan data historis nasabah, startup P2P lending memiliki keterbatasan dalam memberikan pinjaman besar dikarenakan kurangnya data historis dari calon kreditor. Hadirnya teknologi seperti machine learning menjadi solusi untuk membuat assessment terhadap pengajuan kredit nasabah. Hal ini dikarenakan perusahaan dapat membuat model dengan lebih cepat dan akurat dengan menggunakan data historis. Dalam pengerjaan tugas ini, digunakan algoritme berbasis decision tree, yaitu CART, Random Forest dan XGBoost (Extreme Gradient Boosting) dengan data Lending Club perusahaan P2P Lending asal Amerika Serikat sebagai studi kasus. Penerapan algoritme dilakukan dalam lima tahap dengan menggunakan metode CRISP-DM, yaitu pemahaman kebutuhan bisnis, pemahaman data, praproses data, optimisasi parameter dan pemodelan, serta evaluasi. Dalam tahap praproses data, dilakukan feature selection dengan menggunakan Extratree Classifier. Dalam tahap optimisasi parameter dan pemodelan, digunakan metode grid search dengan k-fold cross-validation. Dalam tahap evaluasi, digunakan lima metrik berbeda, yakni Accuracy, F1 score, precision, recall, dan specificity, dan AUC dengan metrik AUC sebagai standar utama. Hasil dari penelitian ini menunjukkan bahwa ketika diterapkan pada data backtesting Lending Club, masing-masing algoritme memiliki kelebihan masing-masing. Algoritme decision tree merupakan algoritme dengan performa AUC paling baik yaitu 0.937893. Selain itu Random forest unggul di empat metrik yaitu accuracy dengan nilai 0.955366822, precision dengan nilai 0.922996255, F1-Measure dengan nilai 0.882626821 dan specifity dengan nilai 0.982533048. Sedangkan algoritme XGboost unggul di nilai recall 0.930603.