Quantum annealing (QA) adalah pendekatan komputasi kuantum yang banyak
digunakan untuk menangani persoalan optimasi dan probabilistic sampling.
Meskipun QA masih tergolong baru, pendekatan ini telah banyak diterapkan untuk
optimasi persoalan machine learning, seperti clustering, support vector machines,
dan lain-lain. Sebagian besar penelitian yang telah mengimplementasikan QA pada
domain machine learning menunjukkan bahwa QA memberikan kinerja prediksi
yang lebih baik dibandingkan metode state-of-the-art klasik. Akan tetapi, persoalan
machine learning yang dioptimasi dengan QA umumnya hanya persoalan yang
menggunakan satu learner. QA memiliki peluang yang menjanjikan untuk
menangani persoalan machine learning yang terdiri atas banyak learner, yaitu
ensemble learning.
Fundamental dari pembuatan model ensemble adalah menggunakan strategi
“perturb and combine” di mana model ensemble yang baik harus memperhatikan
trade-off optimal antara akurasi dan diversity dari trained learners. Salah satu
metode state-of-the-art yang banyak digunakan untuk meningkatkan diversity dari
trained learners pada model ensemble adalah metode clustering balancing dengan
over-sampling. Akan tetapi, terdapat kelemahan dari metode clustering balancing
yang sudah ada, yaitu 1) hasil cluster yang tidak selalu strong dan balanced, 2)
adanya persentase similarity clusters yang lebih tinggi, serta 3) adanya persentase
korelasi trained learners yang lebih tinggi karena metode ini melakukan
penambahan data pada kelas minor dengan menduplikasi beberapa sampel yang
memengaruhi proses training. Seluruh trained learners yang dihasilkan untuk
membentuk ensemble juga belum tentu memberikan kontribusi positif pada
peningkatan akurasi. Pemilihan sekumpulan trained learners yang optimal perlu
dilakukan agar kinerja ensemble semakin meningkat. Hal ini berpeluang untuk
dioptimasi menggunakan QA karena QA ditemukan berpotensi untuk memberikan
kinerja akurasi dan efisiensi yang lebih baik pada persoalan optimasi dibandingkan
metode state-of-the-art klasik. Akan tetapi, implementasi QA juga memiliki
beberapa kelemahan, yaitu: 1) adanya kemungkinan tetap terjebak pada minimum
lokal, 2) adanya kemungkinan overfitting pada solusi awal, serta 3) sensitivitas
terhadap parameter. Oleh karena itu, diperlukan juga peningkatan kualitas dari
implementasi QA.
Berdasarkan persoalan dan peluang yang telah dianalisis, penelitian ini
mengusulkan pengembangan algoritma hybrid QA yang berfokus untuk menangani
tiga persoalan ensemble learning, yaitu: 1) pembuatan strong dan balanced clusters
menggunakan algoritma hybrid QA yang mengombinasikan pendekatan clustering
balancing dan QA; 2) pemilihan clusters optimal menggunakan algoritma QA;
serta 3) pemilihan trained learners optimal menggunakan algoritma QA. Ketiga
usulan metode ini merupakan satu kesatuan proses untuk menghasilkan model
ensemble yang optimal. Selain itu, pada proses pemilihan clusters dan trained
learners, diterapkan juga proses re-sampling pada algoritma QA yang diusulkan
untuk menangani tiga kelemahan dari implementasi QA dan meningkatkan kualitas
ensemble.
Algoritma usulan dievaluasi menggunakan empat dataset dari UCI repository, satu
dataset dari Airbus – BMW Group, serta satu dataset real. Evaluasi dilakukan
berdasarkan empat aspek utama: ukuran, akurasi, diversity, dan waktu komputasi
ensemble. Algoritma usulan dibandingkan dengan beberapa metode ensemble
benchmark, yaitu bagging, AdaBoost, clustering, clustering balancing, dan metode
ensemble yang menggunakan particle swarm optimization. Selain itu, hasil
eksperimen juga dievaluasi dengan enam single learner yang menjadi base
classifiers, yaitu artificial neural network, support vector machines, linear
discriminant analysis, decision trees, K-nearest neighbors, dan Naïve Bayes. Hasil
evaluasi menunjukkan bahwa algoritma usulan memiliki rata-rata akurasi tertinggi,
yaitu 72.40%, dengan confidence interval 95%. Penelitian ini pun menganalisis
adanya tiga faktor yang memengaruhi dan dipengaruhi oleh peningkatan akurasi
ini, yaitu ukuran ensemble, nilai diversity, dan waktu komputasi. Algoritma usulan
ditemukan dapat mereduksi ukuran ensemble awal meskipun persentase
penurunannya tidak sebesar metode benchmark particle swarm optimization. Selain
itu, algoritma usulan juga memiliki rata-rata nilai diversity paling tinggi
dibandingkan seluruh metode benchmark di mana nilai diversity yang tinggi dan
diiringi dengan pengurangan bias dapat mendorong peningkatan akurasi. Algoritma
usulan juga ditemukan memiliki waktu komputasi yang lebih cepat dibandingkan
metode benchmark yang melakukan pruning dengan algoritma metaheuristik klasik
particle swarm optimization.