digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Raynard Tanadi
Terbatas  Esha Mustika Dewi
» Gedung UPT Perpustakaan

Diabetes melitus telah menjadi salah satu tantangan kesehatan utama di Indonesia, ditandai dengan prevalensi yang terus meningkat dan tingginya kasus yang tidak terdiagnosis. Pemanfaatan machine learning untuk pemodelan risiko sering kali menghadapi dua kendala utama: kurangnya transparansi atau sifat black box model, serta penggunaan data yang tidak sepenuhnya merepresentasikan karakteristik faktor risiko populasi lokal Indonesia. Oleh karena itu, tugas akhir ini bertujuan untuk menjawab tantangan tersebut dengan mengembangkan model estimasi risiko diabetes tipe 2 yang tidak hanya akurat dan relevan bagi masyarakat Indonesia, tetapi juga transparan dan dapat dipertanggungjawabkan secara medis Untuk mengatasi permasalahan tersebut, tugas akhir ini mengembangkan model estimasi risiko diabetes tipe 2 yang bersifat non-invasif menggunakan algoritma Extreme Gradient Boosting (XGBoost). Model ini dilatih menggunakan fitur-fitur non-laboratorium yang relevan dengan karakteristik populasi Indonesia, yang bersumber dari survei nasional Indonesia Family Life Survey 5 (IFLS5). Untuk memastikan transparansi dan rasionalitas model, diterapkan pendekatan Explainable Artificial Intelligence (XAI), khususnya menggunakan metode SHapley Additive exPlanations (SHAP). Metode ini memungkinkan analisis kontribusi setiap faktor risiko terhadap hasil estimasi sehingga keputusan yang dihasilkan model dapat dipahami dan divalidasi. Model XGBoost yang dikembangkan berhasil mencapai kinerja yang baik dengan nilai Receiver Operating Characteristic-Area Under Curve (ROC-AUC) sebesar 0,72 pada data uji. Analisis menggunakan SHAP lebih lanjut mengonfirmasi bahwa rasionalitas di balik keputusan model secara umum selaras dengan pengetahuan medis yang ada. Validasi yang dilakukan oleh domain expert juga menyatakan bahwa kontribusi faktor-faktor risiko yang diidentifikasi oleh model konsisten dengan pemahaman klinis. Hasil ini menunjukkan bahwa model yang dikembangkan tidak hanya memiliki kinerja yang memadai, tetapi juga dapat dipercaya karena penjelasannya yang logis dan relevan secara medis.