digilib@itb.ac.id +62 812 2508 8800

13518003 Dimas Lucky Mahendra.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Pada tahun 2019-2022 virus Sars-CoV-2 atau yang biasa disebut dengan COVID-19 diklasifikasikan sebagai pandemi di seluruh dunia. Hal ini memotivasi banyak peneliti untuk melakukan penelitian terkait pembelajaran mesin untuk mendeteksi virus ini dengan menggunakan suara batuk. Tantangan dari penelitian terkait topik ini adalah sedikitnya data pasien positif yang tersedia untuk digunakan pada pembelajaran mesin dibandingkan dengan data pasien negatif yang sangat banyak, dan jenis arsitektur model yang dapat digunakan sangat banyak untuk diteliti. Beberapa penelitian menunjukkan bahwa model berbasis CNN mendapatkan hasil yang lebih baik dibandingkan dengan model berbasis shallow learning, namun kombinasi antara metode preprocessing data dan model yang digunakan masih dapat diteliti lebih lanjut agar bisa mendapatkan hasil yang paling optimal. Pada penelitian ini, dilakukan eksperimen dengan menggunakan dua jenis metode imbalance data handling, yaitu Random Undersampling dan augmentasi data. Eksperimen dilakukan dengan menggunakan dua jenis fitur, Mel Frequency Cepstral Coefficient (MFCC) dan Log- Mel Spectrogram, dan menggunakan model dengan tiga jenis arsitektur, yaitu CNN, ResNet- 50, dan VGGish. Untuk baseline model, digunakan kombinasi Random Undersampling, MFCC, dan model dengan arsitektur CNN. Eksperimen kemudian dilanjutkan dengan menggunakan variasi jumlah akhir train data setelah melalui tahap preprocessing sebanyak 1000-1500 data. Didapatkan hasil eksperimen terbaik dengan menggunakan kombinasi metode imbalance data handling White Noise Injection, fitur MFCC, dan model dengan arsitektur CNN. Variasi ini mendapatkan nilai specificity sebesar 83%, sensitivity sebesar 44%, dan F1-Score sebesar 79%. Variasi ini memberikan peningkatan specificity sebesar 0.248, sensitivity sebesar 0.0178, dan F1-Score sebesar 0.02 ketika dibandingkan dengan baseline model. Dengan demikian, kombinasi ini merupakan kombinasi terbaik untuk mengklasifikasikan COVID-19 melalui suara batuk pada penelitian ini.