digilib@itb.ac.id +62 812 2508 8800

ABSTRAK Jason Hadinata Putra
PUBLIC Dwi Ary Fuziastuti

Bisnis asuransi adalah bisnis yang menjual janji pemberian kompensasi keuangan apabila suatu kejadian yang tidak diinginkan (risiko) terjadi. Sebagai gantinya, tertanggung atau pemegang polis perlu membayar premi kepada pihak penanggung atau perusahaan asuransi. Akan tetapi, karena banyak klaim (frekuensi) dan besar klaim (severitas) tidak dapat diketahui sebelum terjadi, besar premi hanya dapat ditentukan berdasarkan data klaim masa lalu. Pada Tugas Akhir ini, digunakan dua metodologi dalam memprediksi besar premi, yaitu Generalized Linear Model (GLM) dan Random Forest. GLM mengasumsikan distribusi peluang dari variabel respons termasuk ke dalam distribusi keluarga eksponensial. Sementara itu, Random Forest adalah metode machine learning yang tidak mengasumsikan distribusi apapun pada variabel respons. Data yang digunakan di Tugas Akhir ini adalah suatu data klaim historis di Amerika Serikat yang diambil dari situs Kaggle.com. Variabel respons yang digunakan adalah “charges” atau besar premi. Variabel respons “charges” ternyata mengikuti distribusi peluang Tweedie sehingga link function yang digunakan adalah logaritma natural. Dalam metode Random Forest, hyperparameter ???? dan cost-complexity parameter ditentukan. Untuk membandingkan kedua metodologi, digunakan metrik Root Mean Squared Error (RMSE). Berdasarkan hasil penelitian, RMSE yang dihasilkan apabila menggunakan metode Random Forest lebih kecil dari RMSE yang dihasilkan apabila menggunakan GLM. Hal ini menunjukkan bahwa metode Random Forest memiliki performa prediksi yang lebih baik dibandingkan GLM. Akan tetapi, Random Forest tidak dapat memberikan interpretasi atas model yang diperoleh seperti yang dapat diberikan oleh GLM. Akibatnya, GLM tetap dipertimbangkan dalam menentukan premi suatu bisnis asuransi.