digilib@itb.ac.id +62 812 2508 8800

Dropout menjadi salah satu tantangan yang dihadapi oleh perguruan tinggi yang nda di berbagai dunia termasuk Indonesia. Dropout dapat menjadi acuan bagaimana kualitas sistem pendidikan akademik diterapkan pada perguruan tinggi. Menurut Statistik Pendidikan Tinggi tahun 2020, mencatatkan mahasiswa dropout di Indonesia sebanyak 600 ribu mahasiswa atau dalam persentase sekitar 7% dari total 8,5 juta. Oleh karena itu, pihak perguruan tinggi harus memiliki kesadaran untuk mengatasi terjadinya risiko dropout ini. Dalam mengatasi permasalahan dropout, yaitu dengan mengembangkan sistem early warning mahasiswa yang berpotensi dropout, sehingga dapat melalukan intervensi untuk mencegah sebelum terjadi. Early warning dibangun menggunakan data individu mahasiswa. Salah satu teknik yang dapat digunakan adalah Educational Data Mining (EDM), yang merupakan teknik untuk mengevaluasi dan memprediksi kinerja mahasiswa. EDM merupakan proses mengekstraksi informasi dan pola berguna yang digunakan untuk memprediksi kinerja mahasiswa. Dalam penelitian ini, kami akan mencoba mengembangkan sistem prediksi untuk mahasiswa yang berpotensi dropout menggunakan algoritma data mining, seperti Naive Bayes, SVM, dan ANN. Namun, ada masalah yang diliadapi dalam penelitian lain sebelumnya seperti kualitas data yang buruk. Banyak data yang tidak berguna atau tidak relevan yang menyebabkan hasil kinerja menjadi buruk. Maka akan dilakukan modifikasi dengan menggunakan feature importance dan transfer learning untuk memilih data yang relevan dan diharapkan dapat meningkatkan hasil kinerja. Dari hasil evaluasi terhadap ketiga alternatif algoritma data minfng yang digunakan, memperlihatkan bahwa ANN paling baik dari precision dan recall, yaitu 0,905 dan 0,959. Sementara itu, algoritma SVM hanya mencapai 0,892 dan 0,920 sedangkan naivc baycs mcncapai 0,897 dan 0,852. Penggunaan ANN dcngan modiPikasi feature importance dan transfer learning menghasilkan rata-rata precision dan recall sekitar 0,921 dan 0,967. Dengan modifikasi tersebut terdapat peningkatan hasil kinerja model sekitar 2%.