BAB 1 Josephine Stella Sunaryo
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
BAB 2 Josephine Stella Sunaryo
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
BAB 3 Josephine Stella Sunaryo
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
BAB 4 Josephine Stella Sunaryo
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
BAB 5 Josephine Stella Sunaryo
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
Terbatas  Dwi Ary Fuziastuti
» Gedung UPT Perpustakaan
Data klaim suatu bisnis asuransi dapat memiliki karakteristik berikut: tidak
mengikuti distribusi normal dan pengamatan terhadap objek yang sama di-
lakukan selama beberapa periode. Data yang dianalisis dalam Tesis ini ada-
lah banyak klaim asuransi tenaga kerja pada tiap tahun selama tujuh tahun.
Distribusi peluang peubah acak banyak klaim tidak mengikuti distribusi nor-
mal, melainkan mengikuti suatu distribusi yang menceng kanan (skewed-tothe-
right). Banyak klaim yang diamati dicatat berdasarkan jenis pekerjaan
dan lokasi bekerja. Total besar gaji juga dicatat untuk setiap lokasi dan jenis
pekerjaan tertentu. Menggunakan data tersebut, akan diprediksi banyak kla-
im dari asuransi kecelakaan kerja dengan karakteristik lokasi bekerja dan jenis
pekerjaan tertentu.
Data tersebut memiliki tiga kandidat variabel penjelas (explanatory variable ),
yaitu: variabel tahun, variabel lokasi bekerja, dan variabel jenis pekerjaan.
Namun, variabel lokasi bekerja dan jenis pekerjaan merupakan variabel kate-
gorikal dengan masing-masing memiliki 10 level dan 25 level. Akibatnya, ter-
dapat total 33 kandidat variabel prediktor dalam memprediksi variabel respon
yang dalam data ini adalah banyak klaim. Untuk memodelkan data, yang di-
kenal sebagai data panel, digunakan Generalized Estimating Equation (GEE)
yang mengakomodasi korelasi antar data dalam satu panel melalui matriks
R() dengan merupakan parameter yang mengkarakterisasi matriks terse-
but. Struktur korelasi antar data dalam satu panel diasumsikan mengikuti
model AR(1) dengan = 0; 3518 dan data antar panel saling bebas. Dengan
33 kandidat variabel prediktor tersebut, banyak model regresi yang mungkin
adalah233 model, dengan asumsi parameter 0 (intercept ) selalu masuk dalam
model.
Pada Tugas Akhir penulis di tahap pendidikan Sarjana Matematika di FMIPA
ITB, penulis telah memodelkan data yang sama dengan metode GEE. Ke-
mudian, untuk pemilihan model terbaik, digunakan metode regresi stepwise.
Namun, metode regresi stepwise memiliki beberapa kekurangan, antara lain
sangat bergantung pada nilai signikansi yang digunakan dalam menentukan
masuk atau keluarnya variabel prediktor. Selain itu, metode regresi stepwise
hanya menghasilkan satu model akhir. Dengan kata lain, metode regresi
stepwise tidak membandingkan semua sub-model yang mungkin.
Untuk mengatasi hal ini, digunakan algoritma Gibbs Sampling yang mem-
bandingkan semua sub-model yang mungkin. Algoritma ini dapat melakuk-
an proses pemilihan model berdasarkan quasi likelihood information criterion
(QIC) dalam waktu yang relatif cepat. Algoritma ini dimodikasi sedemikian
sehingga dapat digunakan untuk mengambil sampel dari populasi sub-model.
Hasil analisis menunjukkan bahwa model yang diperoleh menggunakan algori-
tma Gibbs sampling lebih cocok untuk memodelkan data dibandingkan model
yang diperoleh menggunakan metode regresi stepwise. Misalkan exp adalah
variabel yang menyatakan total gaji (dalam satuan sepuluh juta US dolar); x1
sampai x9 berkaitan dengan variabel lokasi bekerja; x10 sampai x32 berkaitan
dengan variabel jenis pekerjaan. Untuk data yang digunakan pada Tesis ini,
model terbaik yang diperoleh adalah:
g () = ln exp ???? 2; 6810 + 0; 7703x1 + 1; 2704x2 + 0; 5358x3 ???? 0; 1025x4 + 0; 6314x5
+0; 9760x7 ???? 0; 1803x8 + 0; 7693x9 ???? 0; 6805x11 ???? 0; 9835x12 ???? 0; 1958x13
+0; 5321x14 ???? 1; 0336x17 ???? 0; 4470x18 ???? 0; 7274x19 ???? 0; 5322x20 ???? 0; 4780x21
????0; 1906x22 ???? 0; 5164x24 ???? 0; 8818x25 ???? 1; 1169x26 ???? 0; 7494x27 ???? 0; 9885x28
????0; 6448x29 ???? 1; 4706x30 ???? 0; 6036x31 ???? 1; 4217x32
dengan nilai QIC sebesar -44.475,906; lebih kecil dibandingkan nilai QIC dari
model yang diperoleh menggunakan metode regresi stepwise sebagai berikut:
g () = ln exp ???? 2; 7425 + 0; 8306x1 + 1; 3314x2 + 0; 5388x3 + 0; 6184x5 + 0; 9099x7
+0; 7765x9 ???? 0; 5835x11 ???? 0; 7891x12 + 0; 6133x14 ???? 1; 1759x17 ???? 0; 3617x18
????0; 6901x19 ???? 0; 5004x20 ???? 0; 3978x21 ???? 0; 4551x24 ???? 0; 9023x25 ???? 0; 9911x26
????0; 6926x27 ???? 0; 9335x28 ???? 0; 5894x29 ???? 1; 4873x30 ???? 0; 5429x31 ???? 1; 3623x32
yang memiliki QIC sebesar -37.330,3338 .
Perpustakaan Digital ITB