Klasifikasi pada data medis menggunakan deep learning cukup memberikan hasil
yang memuaskan. Namun, data medis masih mengalami kendala pada jumlah
dataset yang tersedia secara publik, contohnya data tumor otak. Permasalahan lain
pada dataset adalah mengalami dataset tidak seimbang. Untuk mengatasi hal
tersebut, dapat dilakukan peningkatan jumlah data. Oleh karena itu, penelitian ini
melakukan pembangkitan data sintesis tumor otak dengan tujuan meningkatkan
jumlah dataset saat pelatihan model klasifikasi berbasis deep learning. Penelitian
ini menggunakan dataset MRI tumor otak yang tersedia berjumlah 3064 dengan
tiga kelas tumor. Untuk menghasilkan data sintesis, GAN dipilih dengan
membangun 9 model untuk tiap kelas tumor dan tiap plane pencitraan-nya agar
GAN terfokus mempelajari satu karakteristik gambar. Kualitas dari data sintesis,
hasil dari GAN, dievaluasi secara kuantitatif dan kualitatif.
Hasil dari penelitian ini menunjukkan bahwa modifikasi terhadap arsitektur
diskriminator dan generator menggunakan Residual Network, menghasilkan data
sintesis yang dapat menangkap fitur penting, yaitu tumor dibandingkan dengan
Deep Convolutional Network. Kemudian, untuk meningkatkan proses pelatihan dan
hasil data sintesis yang dihasilkan, penelitian dilanjutkan dengan menambahkan
gradient penalty. Hasilnya adalah dengan penambahan teknik tersebut, dihasilkan
data sintesis dengan perbaikan fitur yang lebih baik meskipun kekurangannya
adalah terdapat banyak noise pada data sintesis sehingga nilai FID lebih tinggi dan
inception score lebih rendah. Selanjutnya, dilakukan penambahan data sintesis pada
data latih di ketiga model klasifikasi berbasis deep learning. Hasil terbaik
didapatkan menggunakan data sintesis model ResWGAN-GP, akurasi model
InceptionV3 meningkat dari 95% menjadi 96%, dengan DenseNet121 akurasi
model meningkat dari 96% menjadi 97% dan dengan MobileNetv2 akurasi model
meningkat dari 92% menjadi 93%. Peningkatan akurasi ini terjadi dikarenakan
adanya perbaikan prediksi untuk kelas meningioma dan glioma setelah
ditambahkan data sintesis.