digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
PUBLIC Dessy Rondang Monaomi

Penyakit jantung koroner adalah salah satu penyebab utama kematian global, sehingga penting untuk mengembangkan model klasifikasi penyakit jantung koroner yang akurat. Namun, dataset penyakit ini seringkali berukuran kecil dan berdimensi rendah, yang dapat meningkatkan risiko overfitting pada model klasifikasi yang dibangun jika semua fitur digunakan. Oleh karena itu, diperlukan metode feature selection yang tepat untuk memilih fitur paling relevan. Beberapa penelitian menunjukkan bahwa Shapley Additive Explanations (SHAP) dianggap memiliki potensi sebagai metode penyelesaian untuk feature selection. Penelitian ini bertujuan untuk membuktikan SHAP dapat digunakan sebagai solusi untuk feature selection pada model klasifikasi untuk data penyakit jantung koroner yang memiliki karakteristik data yang relatif sedikit dan berdimensi kecil. Eksperimen dilakukan dengan menggunakan dataset penyakit jantung koroner yang memiliki karakteristik data berukuran kecil dan berdimensi rendah. Terdapat dua metode feature selection pembanding, yaitu Principal Component Analysis (PCA), dan validasi narasumber. Model klasifikasi dibangun dengan algoritma random forest, dan kinerja model dievaluasi menggunakan metrik ROC-AUC dan AU-PRC untuk mengukur performa dalam prediksi penyakit jantung koroner. Dataset dibagi menjadi data latih dan data uji, di mana masing-masing model diuji dalam beberapa skenario eksperimen untuk menilai konsistensi kinerja dari metode SHAP untuk feature selection. Hasil eksperimen yang dilakukan pada penelitian ini, terdapat peningkatan kinerja model klasifikasi penyakit jantung koroner dengan menggunakan SHAP untuk feature selection. model klasifikasi mengalami peningkatan ROC-AUC dari 0.91 menjadi 0.94 dan AU-PRC dari 0.81 menjadi 0.97 setelah menerapkan feature selection dibandingkan dengan model hasil dari PCA dan model hasil feature dari validasi dokter. Dari hasil eksperimen yang telah dilakukan membuktikan bahwa SHAP meningkatkan keakuratan dan efisiensi model klasifikasi penyakit jantung koroner dengan menggunakan random forest, membuatnya menjadi metode yang sangat berguna untuk feature selection untuk karakteristik dataset yang berdimensi kecil dalam konteks kasus penyakit jantung koroner.