13518003 Dimas Lucky Mahendra.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan
Pada tahun 2019-2022 virus Sars-CoV-2 atau yang biasa disebut dengan COVID-19
diklasifikasikan sebagai pandemi di seluruh dunia. Hal ini memotivasi banyak peneliti untuk
melakukan penelitian terkait pembelajaran mesin untuk mendeteksi virus ini dengan
menggunakan suara batuk. Tantangan dari penelitian terkait topik ini adalah sedikitnya data
pasien positif yang tersedia untuk digunakan pada pembelajaran mesin dibandingkan dengan
data pasien negatif yang sangat banyak, dan jenis arsitektur model yang dapat digunakan sangat
banyak untuk diteliti. Beberapa penelitian menunjukkan bahwa model berbasis CNN
mendapatkan hasil yang lebih baik dibandingkan dengan model berbasis shallow learning,
namun kombinasi antara metode preprocessing data dan model yang digunakan masih dapat
diteliti lebih lanjut agar bisa mendapatkan hasil yang paling optimal.
Pada penelitian ini, dilakukan eksperimen dengan menggunakan dua jenis metode imbalance
data handling, yaitu Random Undersampling dan augmentasi data. Eksperimen dilakukan
dengan menggunakan dua jenis fitur, Mel Frequency Cepstral Coefficient (MFCC) dan Log-
Mel Spectrogram, dan menggunakan model dengan tiga jenis arsitektur, yaitu CNN, ResNet-
50, dan VGGish. Untuk baseline model, digunakan kombinasi Random Undersampling,
MFCC, dan model dengan arsitektur CNN. Eksperimen kemudian dilanjutkan dengan
menggunakan variasi jumlah akhir train data setelah melalui tahap preprocessing sebanyak
1000-1500 data.
Didapatkan hasil eksperimen terbaik dengan menggunakan kombinasi metode imbalance data
handling White Noise Injection, fitur MFCC, dan model dengan arsitektur CNN. Variasi ini
mendapatkan nilai specificity sebesar 83%, sensitivity sebesar 44%, dan F1-Score sebesar 79%.
Variasi ini memberikan peningkatan specificity sebesar 0.248, sensitivity sebesar 0.0178, dan
F1-Score sebesar 0.02 ketika dibandingkan dengan baseline model. Dengan demikian,
kombinasi ini merupakan kombinasi terbaik untuk mengklasifikasikan COVID-19 melalui
suara batuk pada penelitian ini.