Article Details

PENGAPLIKASIAN GENERALIZED LINEAR MODEL DAN GRADIENT BOOSTING MACHINE UNTUK MEMPREDIKSI HASIL PERTANDINGAN NCAA MEN’S BASKETBALL TOURNAMENT

Oleh   Marcello Susanto [10116017]
Kontributor / Dosen Pembimbing : Finny Oktariani, S.Si., M.Si., Ph.D.;
Jenis Koleksi : S1-Tugas Akhir
Penerbit : FMIPA - Matematika
Fakultas : Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA)
Subjek :
Kata Kunci : turnamen, lasso, feature importance, generalized linear model, gradient boosting machine, logloss, cross-validation
Sumber :
Staf Input/Edit : Dwi Ary Fuziastuti  
File : 1 file
Tanggal Input : 2020-09-21 08:29:54

NCAA Men’s Basketball Tournament merupakan sebuah kompetisi yang mempertemukan tim basket pria dari universitas terbaik di Amerika Serikat tiap tahunnya. Turnamen ini menggunakan sistem knockout dimana kekalahan sekali saja dapat menggugurkan mimpi dari sebuah tim untuk memenangkan turnamen, bahkan tim yang diunggulkan sekalipun. Hal ini membuat semua tim berjuang mati-matian pada tiap pertandingan sehingga apapun dapat terjadi pada turnamen ini. Tim unggul gugur di pertandingan pertama, tim underdog melangkah jauh bahkan sampai memenangkan turnamen, semua hal ini sangat lumrah terjadi sehingga turnamen ini memiliki julukan March Madness. Pada Tugas Akhir ini akan dilakukan pembuatan model prediktif dan penentuan variabel penting dengan menggunakan metode pemilihan variabel LASSO dan feature importance untuk menentukan variabel yang penting. Data yang digunakan pada Tugas Akhir ini adalah data Las Vegas odd, possession-based metrics Kenpom, statistik tim, dan kualitas tim yang dipopulerkan oleh user Kaggle bernama Darius Barusauskas (raddar). Model yang digunakan pada penelitian ini adalah generalized linear model dan gradient boosting machine. Berdasarkan nilai test logloss pada tiap dataset didapat kesimpulan bahwa model GBM memiliki performa yang lebih baik jika dibandingkan dengan model GLM. Model terbaik didapat dengan menggunakan model GBM yang dilatih menggunakan data pertandingan regular season Las Vegas odd yang mendapatkan nilai test logloss sebesar 0.52485