digilib@itb.ac.id +62 812 2508 8800

Sejalan dengan pesatnya digitalisasi proses bisnis di Direktorat Jenderal Pajak, ukuran data yang tersimpan di lembaga tersebut tumbuh secara eksponensial. Masalah bagaimana menghasilkan pendapatan pajak dari data pemicu yang potensial masih belum terpecahkan. Sejalan dengan itu, penelitian ini memberikan analisis prediktif berbasis pembelajaran mesin sebagai solusi tentang bagaimana menggunakan data pemicu wajib pajak sebagai sistem pendukung keputusan untuk menemukan dan mewujudkan potensi pendapatan pajak yang belum dieksplorasi. Lebih khusus lagi, penelitian ini menyajikan model analitik prediktif yang dapat memprediksi secara akurat atribut wajib pajak mana yang kemungkinan besar akan membayar kewajibannya. Kami mengembangkan tiga model pembelajaran mesin yaitu logistic regression, random forest, dan decision tree. Kami menganalisis total 5.562 sampel data potensi penerimaan pajak dengan delapan prediktor terdiri dari nilai nominal data pemicu, jarak kantor pajak, jenis wajib pajak, media pelaporan pajak, jenis pajak, jenis status laporan, tahun terdaftar wajib pajak dan cakupan wilayah. Studi kami menunjukkan bahwa model random forest memberikan kinerja prediksi terbaik. Hasil pembobotan masing-masing atribut menunjukkan bahwa status pelaporan pajak merupakan variabel paling penting dalam memprediksi potensi penerimaan pajak. Analisis ini dapat membantu petugas pajak dalam menentukan calon wajib pajak dengan kemungkinan tertinggi untuk membayar kewajibannya. Mengingat ukuran data, pendekatan ini dapat memberikan pegawai pajak dengan alat yang ampuh untuk meningkatkan efisiensi kerja, memerangi penghindaran pajak, dan memberikan layanan kepada wajib pajak yang lebih baik.