digilib@itb.ac.id +62 812 2508 8800

Perusahaan dan institusi publik dituntut untuk terus meningkatkan efektivitas dan efisiensi operasional perusahaan. Salah satu aspek utama yang mempengaruhi efisiensi tersebut adalah bagaimana produktivitas pegawai dapat diukur dan dikelola. Semakin baik produktivitas pegawai suatu perusahaan maka semakin baik juga nilai perusahaan tersebut, termasuk di salah satu Perusahaan BUMN yang bergerak di ketenagalistrikan, PT PLN (Persero). Penelitian ini mengembangkan model prediksi nilai produktivitas pegawai menggunakan algoritma machine learning berdasarkan data kepegawaian seperti data identitas pegawai, trend kehadiran pegawai, sertifikasi atau pelatihan yang diikuti, riwayat jabatan, skala gaji dan Nilai Sasaran Kinerja. Metodologi yang digunakan melibatkan pengumpulan data dari 2020-2023, tahap preprocessing yang meliputi data cleansing, feature engineering (termasuk transformasi log untuk fitur-fitur yang highly skewed dan fitur rasio antar variabel), dan penanganan outlier dengan metode IQR. Selanjutnya pemilihan fitur oleh RFE kemudian tahap pelatihan dengan algoritma machine learning seperti Linear Regression, Random Forest, Decision Tree, XGBoost, MLP, SVR, Catboost, LightBM dan ExtraTree dengan proses penyeimbang fitur target dengan teknik SMOGN. Performa dari model masing-masing divealuasi menggunakan MAE, RMSE, R2 MAPE dan K-Fold Cross Validation. Hasil penelitian menunjukkan bahwa Model Stacking Ensemble dari kombinasi antara 3 model machine learning terbaik memiliki performa yang lebih baik dibandingkan dengan algoritma machine learning tunggal, dengan nilai nilai MAE sebesar 92%, nilai RMSE sebesar 3,49, nilai R2 sebesar 96% dan nilai SMAPE sebesar 0,30.