Lowongan kerja merupakan informasi mengenai kebutuhan tenaga kerja dengan keahlian
dan syarat-syarat khusus. Saat ini, persebaran lowongan kerja khususnya di internet
meningkat signifikan. Sayangnya, lowongan kerja dapat menjadi salah satu kesempatan
untuk mengumpulkan data di luar kepentingan rekrutmen. Karena itu, perlu adanya
upaya preventif untuk mendeteksi lowongan kerja yang palsu, salah satunya dapat dilakukan
dengan membangun model pembelajaran mesin yang mampu mendeteksi dengan
cepat. Tugas Akhir ini menyusun model untuk mendeteksi lowongan kerja palsu dengan
model probabilistik (Naive Bayes dan Logistic Regression), nonprobabilistik (Support
Vector Machine dan K-Nearest Neighbor), dan model berbasis pohon (Decision Tree,
Random Forest, dan XGBoost). Analisis difokuskan untuk membandingkan performa
model probabilistik dibandingkan dengan model nonprobabilistik dan model berbasis
pohon. Dalam penyusunan masing-masing model, dilakukan dua percobaan metode
pengambilan sampel, yakni systematic dan stratified sampling. Selain itu, dilakukan pula
percobaan metode text encoding, yakni dengan TF-IDF dan Count Vectorizer beserta
optimasi dengan pembatasan jumlah fitur dan N-gram. Metrik evaluasi utama dalam
Tugas Akhir ini adalah recall dan akurasi. Hasil evaluasi model menunjukkan bahwa
Logistic Regression memiliki recall tertinggi yakni 96% dan Naive Bayes memiliki
akurasi tertinggi yakni 94.61%. Dengan demikian, diperoleh bahwa model probabilistik
memberikan performa yang lebih baik dalam kasus klasifikasi lowongan kerja palsu.
Perpustakaan Digital ITB