digilib@itb.ac.id +62 812 2508 8800

Regresi proses Gaussian merupakan regresi yang adaptif, yang dapat mempelajari pola data. Proses Gaussian (GP) sendiri merupakan suatu model non-parametrik yang bedistribusi multivariat normal. GP dapat melakukan prediksi serta mengukur ketidakpastian pada setiap titik prediksi. Pada regresi proses Gaussian, kompleksitas komputasi yang diperlukan adalah O(n3), dengan n adalah ukuran data yang digunakan. Jika data besar (n > 1000), diperlukan inversi matriks kovariansi berukuran n × n sehingga semakin besar ukuran data, semakin besar pula kompleksitas komputasi. Inferensi variasional dilakukan untuk menurunkan kompleksitas tersebut menjadi O(m3), dengan m merupakan ukuran titik induksi dengan m << n. Posisi titik induksi dicari menggunakan metode K-Means yang dapat memilih posisi titik induksi tersebut berdasarkan jarak titik. Ketika posisi titik induksi sudah diketahui, dilakukan optimisasi parameter-parameter pada model sehingga model memberikan hasil terbaik, menggunakan metode optimisasi Stochastic Gradient Descent. Set data yang digunakan untuk melakukan simulasi pada model kali ini adalah set data keterlambatan keberangkatan pesawat pada Tahun 2009 di Amerika Serikat. Dengan melihat karakteristik data, dipilih kernel yang dapat merepresentasikan data, yaitu kernel Matérn (? = 1, 5) dengan Automatic Relevance Determination (ARD). Hasil dari eksperimen ini menyatakan bahwa regresi proses Gaussian dengan inferensi variasional memberikan hasil yang cukup merepresentasikan hasil dari model klasik, dilihat dari RMSE GP Variasional yang hanya lebih tinggi 0,93% dari RMSE GP Klasik.