Sains dan teknik berbasis data dengan metode pembelajaran mesin saat
ini berkembang sebagai metode yang populer karena performa prediksinya
yang baik dalam tugas pemodelan fisika, model pembelajaran mesin banyak
digunakan untuk melakukan pemodelan prediktif, terutama di bidang teknik
kedirgantaraan dan ilmu fluida yang kebanyakan melibatkan masalah dengan
dimensi yang tinggi dan non-linearitas. Namun, model populer seperti
neural network biasanya membutuhkan sejumlah besar data pelatihan agar
dapat memiliki performa yang baik. Namun, sayangnya, data berlabel di
bidang teknik kedirgantaraan yang biasanya diperoleh dari simulasi komputasi
atau eksperimen, bisa sangat mahal untuk didapatkan. Oleh karena itu,
tesis ini mendemonstrasikan bagaimana model pembelajaran mesin tertentu
yang disebut dengan gene expression programming dapat memiliki performa
yang lebih baik daripada model pembelajaran mesin populer lainnya dalam
lingkungan data pelatihan yang lebih sedikit. Selain itu, tantangan lain
yang muncul dengan menggunakan model pembelajaran mesin adalah tingkat
interpretabilitasnya. Di bidang militer dan kedirgantaraan, menerapkan
model pembelajaran mesin untuk kasus kehidupan nyata membutuhkan alasan
prediksi yang dapat dibenarkan karena model berbasis data harus dapat
disertifikasi dan diverifikasi untuk alasan keamanan. Mengatasi tantangan
tersebut dalam pemodelan pembelajaran mesin berbasis data, penelitian ini
menunjukkan bagaimana metode interpretasi model-specific dapat dilakukan
untuk menjelaskan model pembelajaran mesin yang dapat ditafsirkan atau
sering disebut sebagai model white-box dan bahkan dapat menjelaskan yang
kurang dapat ditafsirkan yang biasa disebut dengan model black-box dengan
metode interpretasi model-agnostic terutama untuk studi kasus yang berkaitan
dengan bidang teknik dirgantara.