digilib@itb.ac.id +62 812 2508 8800

Random forest adalah sebuah algoritma pembelajaran mesin yang dapat digunakan secara supervised (terawasi). Karena itu, algoritma ini dapat digunakan untuk memprediksi luaran dari sebuah kasus berdasarkan pengetahuan akan data yang sudah ada. Random forest dibangun atas metode decision trees, yakni algoritma pembelajaran mesin yang menyusun pohon keputusan berdasarkan daya pisah fitur-fitur dalam data. Decision trees menghasilkan pohon keputusan yang dapat digunakan untuk memprediksi luaran dari dataset baru. Metode random forest adalah pengembangan dari decision trees dengan konsep bootstrapping dan agregasi. Pengacakan fitur dan sampel yang dipakai (bootstrap-ping) menghasilkan pohon-pohon yang unik. Dalam kasus klasifikasi, agregasi oleh sebuah model random forest menghasilkan luaran berupa kelas dengan vote terbanyak oleh pohon-pohon keputusan dalam random forest. Salah satu aplikasi random forest adalah dalam otomasi klasifikasi bintang variabel berdasarkan kurva cahaya. Dalam pekerjaan ini, performa model random forest untuk klasifikasi bintang variabel bernama UPSILoN diuji dengan data kurva cahaya dari survei OGLE pada pita fotometri Cousins I. Dalam pengujian, model memprediksi kelas atau subkelas sebuah bintang berdasarkan 16 fitur kurva cahaya OGLE. Terdapat 7 kelas dalam model UPSILoN, yakni Scuti, RR Lyrae, Cepheid, Type II Cepheid, eclipsing binary, long-period variable, dan non-variable. Hasil prediksi model dicocokkan dengan kelas atau subkelas variabilitas kurva cahaya tersebut menurut survei OGLE. Jumlah klasifikasi benar maupun misklasifikasi digunakan untuk mengukur performa model UPSILoN dalam besaran ketepatan berupa precision, recall, serta F1. Diperoleh hasil precision, recall, dan F1 rata-rata senilai 0.95, 0.92, dan 0.93 secara berurutan. Dengan membandingkan nilai-nilai tersebut pada tiap subkelas, maka ditemukan bahwa UPSILoN mampu mengklasifikasikan 3 kelas variabilitas dengan performa yang konsisten di atas rata-rata. Maka, model UPSILoN dapat diterapkan secara otomatis maupun semiotomatis dalam klasifikasi kurva cahaya baru dari pengamatan, dengan syarat jumlah pengamatan yang memadai dan rentang pengamatan yang cukup secara statistik. Model ini kelak dapat digunakan oleh astronom pemula, Observatorium Nasional, hingga program survei langit observatorium internasional yang menghasilkan data bervolume besar.