Machine learning dilakukan dengan menggunakan data latih yang dikumpulkan
dari dunia nyata dalam membangun model untuk prediksi. Dalam kenyataannya,
data dari dunia nyata tidak luput dari bias oleh manusia yang mengumpulkan data.
Ketika data yang digunakan mengandung informasi personal seorang individu/
orang, bias pada data dapat bersifat diskriminatif. Diskriminasi biasanya ditujukan
pada golongan atau kelompok minoritas tertentu dalam pengambilan keputusan.
Model machine learning yang dibangun dengan data yang mengandung
diskriminasi dapat menghasilkan model classifier yang juga bersifat diskriminatif.
Pada Tugas Akhir ini, dibahas beberapa beberapa metode penanganan bias
khususnya pada tahapan post-processing yang diusulkan beberapa ahli. Metode
penanganan bias pada tahapan post-processing yang dibahas yaitu equalized odds
post-processing (Hardt et al., 2016), calibrated equalized odds post-processing
(Pleiss et al., 2017), dan reject option classification (Kamiran et al., 2012). Ketiga
metode tersebut diuji pada classifier yang dibangun dengan Adult Dataset,
COMPAS Recidivism Dataset, German Dataset, dan MEPS Dataset. Hasil evaluasi
dari penerapan ketiga metode post-processing tersebut dianalisis dan dibandingkan.
Dari hasil pengujian, didapat bahwa metode equalized odds post-processing
mengurangi bias grup paling signifikan dibandingkan metode post-processing
lainnya. Namun, jika mempertimbangkan penurunan kinerja classifier setelah
melakukan penanganan bias, reject option classification menjadi metode postprocessing yang paling robust. Pengerjaan Tugas Akhir ini masih dapat dilanjutkan
lagi dengan pengujian pada dataset lain yang lebih beragam dengan atribut-atribut
sensitif yang lebih beragam.
Perpustakaan Digital ITB