Boiler merupakan suatu komponen penting dalam industri, salah satu contoh kegunaan
boiler dalam industri pembangkit tenaga listrik adalah menyediakan suplai uap air
untuk memutar turbin yang akan menghasilkan listrik. Sistem dalam boiler terdiri dari
banyak komponen dan sub-sistem yang saling terhubung dan terintegrasi satu dengan
yang lain seperti economizer, primary superheater, secondary superheater, air heater
dan sejenisnya. Pada sektor industri pada umumnya, deteksi anomali dilakukan dengan
menetapkan batas atas (Upper Control Limit / UCL) dan batas bawah (Lower Control
Limit/ LCL) untuk setiap parameter yang diawasi. Namun metode tersebut tidak dapat
memetakan hubungan antar variabel-variabel terkait sehingga akan mengalami
kesulitan untuk mendeteksi anomali yang terjadi dalam rentang diantara UCL dan
LCL.
Dalam penelitian ini akan dibuat suatu sistem deteksi anomali dengan menggunakan
metode klasterisasi hirarkikal dan klasifikasi Naïve Bayes. Diharapkan metode
klasterisasi hirarkikal dapat memetakan relasi antar variabel-variabel dan membedakan
kondisi normal dan anomali pada boiler, selain itu klasifikasi Naïve Bayes
diimplementasikan untuk meningkatkan kemampuan mendeteksi anomali lebih awal
dengan pendekatan probabilitas dan statistik dalam Naïve Bayes. Dalam studi akan
dipilih bagian superheater sebagai objek deteksi anomali karena komponen tersebut
rawan terjadi gangguan pembakaran maupun kebocoran boiler. Dari hasil penelitian
didapat bahwa metode deteksi anomali dengan seleksi fitur analisis sistem serta
gabungan antara klasterisasi hirarkikal dan klasifikasi naïve Bayes mampu mendeteksi
anomali yang kontinyu pada superheater boiler 13 jam 40 menit sebelum terjadi
kebocoran. Selain itu juga seleksi fitur menggunakan PCA dapat memperpanjang
waktu prediksi hingga 25 jam namun menimbulkan banyak false alarm dan
menghilangkan makna fisis dari pengukuran yang dilakukan. Di sisi lain, seleksi fitur
menggunakan analisis sistem tidak menghilangkan makna fisis pengukuran serta
menimbulkan sedikit false alarm, meskipun waktu prediksinya lebih pendek dari PCA.