digilib@itb.ac.id +62 812 2508 8800

Lowongan kerja merupakan informasi mengenai kebutuhan tenaga kerja dengan keahlian dan syarat-syarat khusus. Saat ini, persebaran lowongan kerja khususnya di internet meningkat signifikan. Sayangnya, lowongan kerja dapat menjadi salah satu kesempatan untuk mengumpulkan data di luar kepentingan rekrutmen. Karena itu, perlu adanya upaya preventif untuk mendeteksi lowongan kerja yang palsu, salah satunya dapat dilakukan dengan membangun model pembelajaran mesin yang mampu mendeteksi dengan cepat. Tugas Akhir ini menyusun model untuk mendeteksi lowongan kerja palsu dengan model probabilistik (Naive Bayes dan Logistic Regression), nonprobabilistik (Support Vector Machine dan K-Nearest Neighbor), dan model berbasis pohon (Decision Tree, Random Forest, dan XGBoost). Analisis difokuskan untuk membandingkan performa model probabilistik dibandingkan dengan model nonprobabilistik dan model berbasis pohon. Dalam penyusunan masing-masing model, dilakukan dua percobaan metode pengambilan sampel, yakni systematic dan stratified sampling. Selain itu, dilakukan pula percobaan metode text encoding, yakni dengan TF-IDF dan Count Vectorizer beserta optimasi dengan pembatasan jumlah fitur dan N-gram. Metrik evaluasi utama dalam Tugas Akhir ini adalah recall dan akurasi. Hasil evaluasi model menunjukkan bahwa Logistic Regression memiliki recall tertinggi yakni 96% dan Naive Bayes memiliki akurasi tertinggi yakni 94.61%. Dengan demikian, diperoleh bahwa model probabilistik memberikan performa yang lebih baik dalam kasus klasifikasi lowongan kerja palsu.