Regresi proses Gaussian merupakan regresi yang adaptif, yang dapat mempelajari pola
data. Proses Gaussian (GP) sendiri merupakan suatu model non-parametrik yang bedistribusi
multivariat normal. GP dapat melakukan prediksi serta mengukur ketidakpastian
pada setiap titik prediksi. Pada regresi proses Gaussian, kompleksitas komputasi yang
diperlukan adalah O(n3), dengan n adalah ukuran data yang digunakan. Jika data besar
(n > 1000), diperlukan inversi matriks kovariansi berukuran n × n sehingga semakin
besar ukuran data, semakin besar pula kompleksitas komputasi. Inferensi variasional
dilakukan untuk menurunkan kompleksitas tersebut menjadi O(m3), dengan m merupakan
ukuran titik induksi dengan m << n. Posisi titik induksi dicari menggunakan
metode K-Means yang dapat memilih posisi titik induksi tersebut berdasarkan jarak titik.
Ketika posisi titik induksi sudah diketahui, dilakukan optimisasi parameter-parameter
pada model sehingga model memberikan hasil terbaik, menggunakan metode optimisasi
Stochastic Gradient Descent. Set data yang digunakan untuk melakukan simulasi
pada model kali ini adalah set data keterlambatan keberangkatan pesawat pada Tahun
2009 di Amerika Serikat. Dengan melihat karakteristik data, dipilih kernel yang dapat
merepresentasikan data, yaitu kernel Matérn (? = 1, 5) dengan Automatic Relevance
Determination (ARD). Hasil dari eksperimen ini menyatakan bahwa regresi proses
Gaussian dengan inferensi variasional memberikan hasil yang cukup merepresentasikan
hasil dari model klasik, dilihat dari RMSE GP Variasional yang hanya lebih tinggi 0,93%
dari RMSE GP Klasik.
Perpustakaan Digital ITB