Estimasi usaha dalam pengembangan perangkat lunak berperan krusial dalam menentukan keberhasilan suatu proyek. Berbagai pendekatan, termasuk machine learning, telah digunakan untuk meningkatkan akurasi estimasi, dengan model ensemble seperti Gradient Boosting Regressor dikenal unggul dalam menghasilkan prediksi yang akurat. Namun, akurasi model tersebut dapat menurun apabila dataset mengandung fitur tidak relevan atau redundan. Penelitian ini bertujuan untuk meningkatkan akurasi estimasi usaha pengembangan perangkat lunak melalui penerapan teknik seleksi fitur Recursive Feature Elimination with Cross-Validation (RFECV) pada model Gradient Boosting Regressor. Selain itu, dilakukan evaluasi komparatif terhadap tiga teknik seleksi fitur lain, yaitu Correlation-based Feature Selection (CFS), Recursive Feature Elimination (RFE), dan Genetic Algorithm (GA), yang masing-masing diimplementasikan pada model yang sama. Eksperimen dilakukan pada tiga dataset publik yang umum digunakan dalam studi estimasi usaha perangkat lunak, yaitu China, COCOMO 81, dan Desharnais. Prosedur mencakup prapemrosesan data, penerapan teknik seleksi fitur, dan pelatihan model menggunakan validasi silang 10-fold. Evaluasi dilakukan menggunakan dua metrik, yaitu Mean Absolute Error (MAE) dan Standardised Accuracy (SA). Hasil menunjukkan bahwa penerapan RFECV mampu meningkatkan akurasi estimasi secara konsisten pada seluruh dataset. Rata-rata nilai MAE turun sebesar 16,28%, dan SA meningkat sebesar 7,83% dibandingkan model tanpa seleksi fitur. Dibandingkan dengan teknik lainnya, RFECV menghasilkan penurunan MAE relatif dan peningkatan SA relatif tertinggi, menjadikannya teknik seleksi fitur yang paling efektif dalam konteks penelitian ini.
Perpustakaan Digital ITB