Hasil Ringkasan
30 Bab III Rancangan Sistem III.1 Analisis Masalah Berdasarkan latar belakang dan studi literatur yang sudah dijabarkan, berikut merupakan masalah yang akan ditangani pada penelitian ini. 1. Metrik Kinerja Terdapat variasi dalam data kinerja akibat metode pengukuran yang tidak konsisten dan celah dalam pengumpulan data. Hal ini dapat menghambat penilaian akurat terhadap potensi pengembangan karir pegawai. 2. Mobilitas Pegawai Tingginya mobilitas pegawai dapat mengganggu dinamika tim dan menyebabkan hilangnya pengetahuan institusional. Selain itu, seringnya perpindahan dapat mempengaruhi kontinuitas rencana pengembangan karir pegawai. 3. Integritas Data Data yang hilang dan tidak konsisten dapat menimbulkan tantangan signifikan dalam penerapan model machine learning. Memastikan integritas dan kelengkapan data sangat penting untuk prediksi yang andal. 4. Evaluasi Kinerja Model pada Dataset dengan Label Terdapat tantangan dalam mengukur kinerja model ketika sudah ada label yang sesungguhnya, karena hal ini bergantung pada kemampuan model untuk memprediksi label yang benar. Oleh karena itu, penelitian ini akan menggunakan metode Adaboost, ANN, SVM, dan Random Forest untuk membangun model klasifikasi terbaik dalam mengidentifikasi soft competency pegawai, yang kemudian dapat digunakan sebagai acuan dalam pengembangan karir. III.2 Rancangan Solusi Berikut merupakan diagram alur yang menggambarkan rancangan solusi dalam penelitian ini yang dapat dilihat pada Gambar III.1. 31 Gambar III 1 Rancangan Solusi Penelitian Data mentah yang diterima akan menjalani proses preprocessing yang meliputi iterasi pemurnian data, rekayasa fitur, dan penanganan data tidak seimbang. Data yang telah diproses ini kemudian dibagi menjadi 80% data latih dan 20% data uji secara acak. Pada penelitian ini, diterapkan metode sequential ensemble yang menggunakan kombinasi dari berbagai model pembelajaran mesin seperti Artificial Neural Networks (ANN), AdaBoost, Support Vector Machine (SVM), dan Random Forest. Data latih awal digunakan untuk menginisialisasi dan melatih masing-masing model. ANN, misalnya, melatih jaringan saraf untuk menangkap pola kompleks dalam data (Lecun et al., 2015), sementara AdaBoost meningkatkan prediksi dengan menggabungkan beberapa model lemah secara bertahap (Freund and Schapire, 1997). SVM mengklasifikasi data dengan mencari hyperplane yang optimal (Cortes et al., 1995), dan Random Forest menggunakan multiple decision trees untuk memperbaiki keandalan dan akurasi prediksi (Breiman, L., 2001).