Penyakit kardiovaskular merupakan kelompok gangguan yang memengaruhi fungsi
jantung dan pembuluh darah, salah satunya adalah penyakit jantung koroner (coronary
heart disease/CHD). CHD terjadi akibat penyempitan atau penyumbatan pada arteri
koroner yang bertugas menyuplai darah ke jantung dan dapat menyebabkan kondisi
seperti angina pectoris, myocardial infarction, coronary insufficiency (unstable
angina), hingga kematian. Banyak faktor risiko CHD yang sering kali tidak disadari
oleh individu sehingga deteksi dini melalui pemodelan risiko menjadi pendekatan
penting dalam mendukung upaya pencegahan dan penanganan medis yang lebih
efektif. Penelitian ini bertujuan untuk membangun dan membandingkan dua model
prediksi risiko CHD, yaitu regresi logistik dan Category Boosting (CatBoost), serta
mengidentifikasi variabel-variabel prediktor yang paling memengaruhi kemungkinan
terjadinya CHD. Data yang digunakan berasal dari Framingham Heart Study dan
mencakup informasi kesehatan 4,434 peserta dalam tiga periode pemeriksaan antara
tahun 1956 hingga 1968. Hasil penelitian menunjukkan bahwa CatBoost memiliki
performa prediktif yang lebih tinggi dalam hal accuracy dan recall, sedangkan regresi
logistik unggul dalam positive predictive value (PPV) dan area under the curve (AUC).
Perpustakaan Digital ITB