digilib@itb.ac.id +62 812 2508 8800

ABSTRAK MARCELLO SUSANTO.pdf ]
PUBLIC Dwi Ary Fuziastuti

NCAA Men’s Basketball Tournament merupakan sebuah kompetisi yang mempertemukan tim basket pria dari universitas terbaik di Amerika Serikat tiap tahunnya. Turnamen ini menggunakan sistem knockout dimana kekalahan sekali saja dapat menggugurkan mimpi dari sebuah tim untuk memenangkan turnamen, bahkan tim yang diunggulkan sekalipun. Hal ini membuat semua tim berjuang mati-matian pada tiap pertandingan sehingga apapun dapat terjadi pada turnamen ini. Tim unggul gugur di pertandingan pertama, tim underdog melangkah jauh bahkan sampai memenangkan turnamen, semua hal ini sangat lumrah terjadi sehingga turnamen ini memiliki julukan March Madness. Pada Tugas Akhir ini akan dilakukan pembuatan model prediktif dan penentuan variabel penting dengan menggunakan metode pemilihan variabel LASSO dan feature importance untuk menentukan variabel yang penting. Data yang digunakan pada Tugas Akhir ini adalah data Las Vegas odd, possession-based metrics Kenpom, statistik tim, dan kualitas tim yang dipopulerkan oleh user Kaggle bernama Darius Barusauskas (raddar). Model yang digunakan pada penelitian ini adalah generalized linear model dan gradient boosting machine. Berdasarkan nilai test logloss pada tiap dataset didapat kesimpulan bahwa model GBM memiliki performa yang lebih baik jika dibandingkan dengan model GLM. Model terbaik didapat dengan menggunakan model GBM yang dilatih menggunakan data pertandingan regular season Las Vegas odd yang mendapatkan nilai test logloss sebesar 0.52485