Secara umum, analisis regresi diartikan sebagai suatu analisis tentang ketergantungan suatu peubah kepada peubah lain yaitu peubah bebas (prediktor) dalam rangka membuat penaksiran atau prediksi nilai peubah terikat (respons) jika nilai peubah bebas (prediktor) diketahui. Pada mulanya, analisis ini banyak diaplikasikan dalam bidang medis, peternakan, dan pendidikan. Dalam perkembangannya, analisis regresi mulai digunakan dalam bidang-bidang lain, yaitu: perkebunan, genetika, hidrogeologi, dan kehutanan. Pada disertasi ini, analisis ini akan diterapkan pada genetika.
Model campuran linier (MCL) secara umum ditulis sebagai
y=X?+Z?+? dengan y adalah vektor observasi berukuran n×1, X adalah matriks desain berukuran n×p yang diketahui, ? adalah vektor parameter regresi (sering disebut vektor pengaruh tetap) berukuran p×1 yang tidak diketahui, Z adalah matriks desain berukuran n×q yang diketahui, ? adalah vektor vektor pengaruh acak berukuran q×1, dan ? adalah vektor galat berukuran n×1. Dibandingkan model regresi linier (MRL), jelas bahwa perbedaannya terletak pada penambahan Z?. Berdasarkan MCL tersebut dan mempertimbangkan sebaran parameter ? maka dibentuk MCL Gauss dengan metode Bayes.
Penjumlahan antara pengaruh acak Z? dan galat ? dinotasikan oleh ?. Oleh karena itu, MCL dapat dituliskan pula menjadi y=X?+?. Vektor ? diasumsikan bersebaran N_n(0, V=K+R). Matriks K adalah matriks fungsi peragam berukuran n×n. Sementara, matriks R adalah matriks peragam dari galat ?. Karakteristik matriks peragam V khususnya kesingularan dinyatakan dalam suatu lema.
MCL Bayes memiliki tiga parameter yang terdiri atas vektor vektor pengaruh tetap ?, ragam vektor pengaruh acak ?_?^2, dan ragam galat ?_?^2. Dalam penaksiran parameter, metode yang digunakan adalah likelihood maksimum (LM), likelihood maksimum terbatas (LMT), LM-Bayes A, LM-Bayes B, LMT-Bayes A, dan LMT-Bayes B. LM dan LMT menjadi metode untuk menaksir dua parameter ragam. LM-Bayes A dan LMT-Bayes A menggunakan hasil taksiran parameter ragam tersebut untuk menaksir vektor vektor pengaruh tetap. Sementara itu, LM-Bayes B dan LMT-Bayes B menaksir nilai observasi baru tanpa harus menaksir parameter vektor pengaruh tetap terlebih dahulu.
Sebagai penerapan, MCL diterapkan pada data bobot jagung dari the Drought Tolerance Maize for Africa Project of CIMMYT’s Global Maize Program. Sebagai kebaruan, matriks peragam eksponensial dan eksponensial kuadrat dibentuk sebagai alternatif dari matriks hubungan genomik yang merupakan matriks peragam linier. Matriks peragam eksponensial dan eksponensial kuadrat merupakan matriks yang komponennya terdiri atas fungsi peragam eksponensial dan eksponensial kuadrat dengan hiperparameter tertentu. Matriks peragam linier memberikan taksiran nilai vektor pengaruh tetap yang lebih tinggi dibandingkan matriks peragam eksponensial dan eksponensial kuadrat dengan perbedaan nilai rataan kuadrat galat (RKG) yang cukup signifikan. Kelebihan matriks peragam eksponensial dan eksponensial kuadrat adalah bisa melihat perbedaan karakteristik pengaruh acak pada setiap pasang individu dan menggunakan hiperparameter yang bisa diatur.
Lema menjadi kontribusi yang signifikan pada perkembangan aljabar dalam MCL. Algoritma pemprograman MCL Gauss dengan metode Bayes juga dihasilkan. Berdasarkan karakteristik data yang serupa maka algoritma tersebut dapat dipakai oleh para praktisi di berbagai bidang selain genetika.