Imbalance dataset pada chest X-ray menimbulkan tantangan yang signifikan untuk
membangun model pradiagnosis yang akurat dan andal. kondisi imbalance terjadi
saat salah satu label di dalam dataset memiliki kemunculan yang jauh lebih sedikit
jika dibandingkan dengan kemunculan label lainnya. Menggunakan dataset dalam
kondisi imbalance untuk membangun model pradiagnosis akan mengarahkan
kepada kondisi underfitting dan overfitting. Meskipun beberapa penelitian sudah
dilakukan dengan melakukan adaptasi algoritma learning, tetapi pendekatan
tersebut tidak menyelesaikan permasalahan distribusi data yang tidak seimbang.
Pada tesis ini, peneliti menghasilkan citra X-ray sintesis menggunakan algoritma
generative adversarial network untuk memperbaiki model klasifikasi pada kasus
infeksi pneumonia. Studi ini menghasilkan citra X-ray sintesis dengan nilai Fréchet
Inception Distance yang lebih rendah jika dibandingkan dengan augmentasi data
konvensional dan SMOTE. Selain itu, model klasifikasi dengan penambahan data
sintesis menghasilkan peningkatan yang signifikan pada nilai F1 berdasarkan uji
Man-Whitney U.