Menghasilkan perangkat lunak yang tidak mengandung defect atau sedikit defect bukanlah
sebuah tugas yang mudah untuk para pengembang perangkat lunak. Pengujian perangkat lunak
adalah proses penting untuk memastikan kualitas perangkat lunak. Memprediksi kerusakan
perangkat lunak dapat membantu penguji memutuskan alokasi sumber daya secara rasional
karena dapat menemukan cacat secara efektif, sehingga dapat meningkatkan kualitas perangkat
lunak.
Software defect prediction (SDP) merupakan salah satu solusi bagi para pengembang untuk
mencapai hal tersebut. Salah satu pendekatan yang dapat dilakukan dalam memprediksi defect
yaitu dengan memanfaatkan metrik perangkat lunak. Naive Bayes (NB) adalah salah satu
algoritma klasifikasi yang paling banyak digunakan karena kesederhanaan algoritmanya dan
mudah untuk diimplementasikan, selain itu NB juga memiliki kinerja akurasi yang sangat baik
dan termasuk metode yang membutuhkan waktu yang cepat dalam komputasinya, namun NB
dalam mengklasifikasikan sebuah kelas target tidak memperdulikan keterkaitan antar attribut
yang ada di dataset karena setiap attribut dianggap independen. Makalah ini mengusulkan
pemilihan attribut dengan metode Association Rule Mining (ARM) untuk menemukan
hubungan antar attribut didalam dataset yang mendukung dalam memprediksi cacat.
Tujuannya dari penelitian ini adalah untuk menambahkan proses seleksi attribut menggunakan
ARM pada proses prediksi cacat perangkat lunak menggunakan metode NB dengan harapan
dapat meningkatkan kinerja akurasi dari metode tersebut dengan memanfaatkan metrics
perangkat lunak. Metrics perangkat lunak memiliki keterkaitan satu dengan lainya dalam
menyimpulkan sebuah defect perangkat lunak, sehingga hal ini tidak dapat diabaikan begitu
saja. Tiga skenario yang dilakukan untuk mengevaluasi metode yang diusulkan: 1)
Membandingkan metode yang diusulkan (NB-ARM) dengan metode NB tanpa pemilihan fitur;
2) Membandingkan metode yang diusulkan (NB-ARM) dengan metode NB dengan pemilihan
fitur konvensional; dan 3) Membandingkan metode yang diusulkan dengan metode SVM, NN
dan DTREE.
Dengan menggunakan dataset NASA MDP yang memiliki 21 attribut (metrics perangkat
lunak) dan 1 kelas target dengan 2 level yaitu defect dan non-defect, hasil empiris dari ketiga
skenario yang dibuat menunjukan bahwa pada evaluasi skenario 1 parmeter precision, recall,
F-measure, dan akurasi mengalami peningkatan sebesar 0.101, 0.190, 0.154 dan 0.180, dan
evaluasi skenario 2 juga mengalami peningkatan sebesar 0.106, 0.182, 0.159 dan 0.163, begitu
juga pada evaluasi skenario 3 juga metode yang diusulkan menunjukan kinerja akurasi lebih
baik dibanding SVM, NN dan Dtree dengan rata – rata performa 0.960 pada metode yang
diusulkan sedangkan lainnya ialah 0.855, 0.859 dan 0.861. Dari hasil empiris ketiga skenario
yang dibuat menunjukan bahwa kinerja akurasi metode yang diusulkan lebih baik daripada
metode pembandingnya.