Hasil Ringkasan
BAB 4 Miftahul Faridl

Jumlah halaman: 27 · Jumlah kalimat ringkasan: 50

20 Bab IV Hasil dan Pembahasan IV.1 Hasil IV.1.1 Metadata Pasien Metadata pasien disediakan pada Tabel IV.1 dengan umur pasien merupakan umur saat pengambilan sampel. Berdasarkan kategori luaran klinis NIH (NIH, 2021), pasien AS1 dan AS2 merupakan pasien tanpa gejala (asymptomatic) karena tidak menunjukkan gejala umum COVID-19. Sementara itu, pasien SY1 dan SY2 merupakan pasien dengan gejala ringan (mildly symptomatic) karena menunjukkan setidaknya satu gejala umum COVID-19. Tabel IV.1 Metadata Pasien Karakteristik Pasien AS1 AS2 SY1 SY2 Umur, tahun 51 15 33 54 Jenis Kelamin Perempuan Laki-laki Perempuan Laki-laki Batuk Tidak Tidak Ya Ya Demam Tidak Tidak Ya Ya Sesak napas Tidak Tidak Ya Tidak Nyeri sendi Tidak Tidak Tidak Ya Pilek Tidak Tidak Tidak Ya Komorbiditas Tidak ada Tidak ada Tidak ada Penyakit Jantung Kronis Nilai Ct 14,66 18,27 17,97 27,52 IV.1.2 Hasil Pembacaan Sekuen Basa DNA Pada penelitian ini didapatkan hasil pengurutan basa DNA dengan mesin Illumina NextSeq 550 untuk 4 set sampel. Masing-masing sampel memiliki 4 buah replikat teknis untuk pengurutan basa dari 4 buah lane pada flow cell. Replikat ini selanjutnya disingkat sebagai R1, R2, R3 dan R4 untuk tiap kode sampel (Tabel IV.2). Tabel IV.2 Pemberian kode sampel dan penamaan replikatnya 21 Kelompok Pasien Kode Sampel Kode Replikat Tanpa Gejala AS1 AS1_R1 AS1_R2 AS1_R3 AS1_R4 AS2 AS2_R1 AS2_R2 AS2_R3 AS2_R4 Bergejala Ringan SY1 SY1_R1 SY1_R2 SY1_R3 SY1_R4 SY2 SY2_R1 SY2_R2 SY2_R3 SY2_R4 Pengurutan basa DNA ini menghasilkan read berukuran 2 x 101 nt yang memiliki adapter unik untuk tiap sampel dari set adapter IDT-Illumina Nextera UD Index Set B for Nextera Flex for Enrichment. Jumlah bacaan per sampel yang diperoleh berada pada kisaran 20-26 juta bacaan per sampel (Tabel IV.3). Total bacaan yang didapatkan dari pengurutan basa DNA ini adalah 362.500.558 bacaan. Tabel IV.3 Rangkuman hasil pengurutan basa DNA Sampel Jumlah Bacaan Mentah (basa) % >Q20 % >Q30 AS1_R1 25.019.684 95,4 93,8 AS1_R2 24.374.062 95,5 94 AS1_R3 25.486.770 95,4 93,8 AS1_R4 24.707.128 95,4 93,8 AS2_R1 23.053.224 94 92,6 22 AS2_R2 22.528.516 94,1 92,7 AS2_R3 23.411.024 94,1 92,6 AS2_R4 22.715.164 94,1 92,6 SY1_R1 22.351.080 81,7 79,8 SY1_R2 21.618.678 81,6 79,8 SY1_R3 22.271.314 82,3 80,4 SY1_R4 21.760.834 81,9 80,1 SY2_R1 20.980.906 93,6 92,1 SY2_R2 20.556.566 93,8 92,2 SY2_R3 21.048.910 94 92,5 SY2_R4 20.616.698 93,7 92,1 Total 362.500.558 Rata-rata jumlah bacaan yang lolos kontrol kualitas adalah 18,3 juta bacaan per replikat sampel (Tabel IV.4). Tabel IV.4 Rangkuman hasil bacaan setelah kontrol kualitas DNA Sampel Jumlah Bacaan Mentah (basa) % >Q20 % >Q30 AS1_R1 23.720.432 98,2 96,9 AS1_R2 23.138.982 98,2 97 AS1_R3 24.165.070 98,2 96,9 AS1_R4 23.425.880 98,2 96,9 AS2_R1 20.777.102 98,4 97,2 AS2_R2 20.316.322 98,4 97,3 AS2_R3 21.138.190 98,4 97,2 AS2_R4 20.496.042 98,4 97,2 SY1_R1 14.932.012 98,1 96,7 SY1_R2 14.402.962 98,2 96,8 SY1_R3 15.149.764 98,1 96,7 SY1_R4 14.623.846 98,1 96,7 SY2_R1 18.977.632 98,2 97 SY2_R2 18.615.806 98,3 97 SY2_R3 19.255.316 98,2 97 23 SY2_R4 18.656.894 98,2 97 Total 293.345.814 Tabel IV.5 Rangkuman hasil pemetaan bacaan basa DNA Sampel Jumlah Bacaan Terpetakan (basa) Persen Bacaan Terpetakan (%) AS1_R1 22.838.242 96,28 AS1_R2 22.283.119 96,30 AS1_R3 23.267.999 96,29 AS1_R4 22.554.455 96,28 AS2_R1 1.774.505 8,54 AS2_R2 1.736.295 8,55 AS2_R3 1.801.538 8,52 AS2_R4 1.745.224 8,51 SY1_R1 10.183.385 68,20 SY1_R2 9.842.188 68,33 SY1_R3 10.341.170 68,26 SY1_R4 9.982.866 68,26 SY2_R1 6.879.217 36,25 SY2_R2 6.820.904 36,64 SY2_R3 6.955.501 36,12 SY2_R4 6.747.402 36,17 Total 165.754.010 IV.1.3 Hasil Analisis Ekspresi Diferensial (DE) Analisis ekspresi gen diferensial (DE) dilakukan dengan menggunakan package DESeq2 (Love et al., 2014). Input yang digunakan adalah matriks raw read counts (Lampiran F) dari pemetaan bacaan terhadap genom manusia di bagian IV.1.2. Mula-mula dilakukan analisis kontrol kualitas untuk memastikan sampel terklasterisasi sesuai dengan kelompoknya masing-masing. Berdasarkan plot PCA (Gambar IV.1), diketahui bahwa similaritas profil ekspresi gen dari sampel pasien tidak bergejala dan bergejala ringan berbeda jauh. Keduanya juga berbeda dengan sampel kontrol individu sehat. Hal ini telah sesuai dengan ekspektasi desain eksprimen yang mana ada perbedaan ekspresi gen total dari pasien pada tingkat 24 keparahan yang berbeda-beda. Sementara itu, berdasarkan heatmap pengklasteran hierarki (Gambar IV.2) dapat disimpulkan nilai Pearson’s correlation sampel dari kondisi keparahan yang sama di atas 0,95 yang menunjukkan similaritas yang tinggi. Hal ini juga menunjukkan kedua sampel dari tiap kategori keparahan tidak memiliki replikat yang terpisah keluar (outlying sample). Sementara itu, terdapat 8 sampel kontrol (NEG_10, NEG_12, NEG_31, NEG_36, NEG_37, NEG_38, NEG_48, NEG_49) yang berada dalam klaster yang sama dengan sampel pasien tidak bergejala, dan 4 sampel kontrol (NEG_005, NEG_008, NEG_011, NEG_056) yang berada dalam klaster yang sama dengan sampel pasien bergejala. Namun, 12 sampel kontrol ini memiliki nilai Pearson’s correlation di bawah 0,9 yang menunjukkan korelasi sedang hingga lemah dibandingkan sampel pasien terinfeksi SARS-CoV-2. Nilai Pearson’s correlation di bawah 0,9 umumnya tidak diterima sebagai satu kelompok sampel dalam analisis ekspresi gen diferensial (Koch et al., 2018). Berdasarkan kedua hasil ini, maka analisis ekspresi diferensial dapat dilanjutkan. Gambar IV.1 Plot PCA antarsampel. Tiap replikat sampel kontrol negatif (hijau), tanpa gejala (merah), dan bergejala ringan (biru) terkelompok 25 bersama kategori masing-masing. Overlapping titik menyebabkan titik tampak lebih sedikit dari jumlah sampel dan replikatnya. Gambar IV.2 Heatmap pengklasteran hierarki antarsampel. Setiap replikat sampel dari kelompok yang sama memiliki nilai korelasi Pearson di atas 0,9. Sampel dari kelompok berbeda memiliki korelasi di bawah 0,9. Untuk melakukan analisis ekspresi gen diferensial (DE) maka digunakan perintah DESeq(). Perintah ini mengeksekusi beberapa tahapan sekaligus dalam pipeline DE yang berturut-turut sebagai berikut: perkiraan faktor ukuran, perkiraan dispersi data, perkiraan dispersi berdasarkan gen (gene-wise dispersion), hubungan dispersi rata-rata (mean-dispersion), perkiraan dispersi akhir, serta pencocokan model dan pengetesan. Untuk mengidentifikasi perubahan ekspresi gen, maka dilakukan analisis Wald test terhadap luaran analisis DE ini. Perbandingan (contrast) sampel pasien tidak bergejala atau bergejala terhadap kontrol negatif ditentukan dengan fungsi list(“kategori”, “kontrol”). Luaran dalam bentuk tabel dibuat dengan perintah results(output, contrast). Luaran yang dihasilkan berupa data frame dengan row names berupa simbol gen dan column names berupa parameter- 26 parameter DE. Parameter yang didapatkan yaitu rata-rata counts ternormalisasi seluruh sampel, nilai log2 fold change, standar error, nilai statistik Wald, nilai p- value Wald, dan nilai p-value Benjamini-Hochberg adjusted (padj). Gambar IV.3 Plot volcano perubahan ekspresi gen pada pasien tidak bergejala (atas) dan pasien bergejala ringan (bawah) dibandingkan dengan 27 kontrol. 20 gen dengan nilai padj tertinggi diberikan label simbol gen. Nilai ambang batas untuk sebuah gen dianggap terekspresi secara diferensial (DE genes) adalah log2 fold change ≥ |2| dan padj < 0,01. Kedua nilai ini digambarkan (Gambar IV.3) dalam suatu plot (nilai padj sebagai -log10 padj) menggunakan package EnhancedVolcano (Blighe et al., 2020). Luaran DESeq2 dapat dilihat pada lampiran F. Gambar IV.4 Plot heatmap gen-gen dengan perubahan ekspresi yang signifikan. Nilai yang ditampilkan merupakan Z-score dari ekspresi gen. Selain itu, juga dilakukan pembuatan plot heatmap berdasarkan nilai Z-score dari gen-gen yang terekspresi diferensial saja (Gambar IV.4). Plot heatmap ini membantu visualisasi pembagian kelompok gen yang mengalami peningkatan dan penurunan ekspresi dari kedua kelompok pasien jika dibandingkan dengan kontrol. Dari Gambar IV.4, dapat diketahui adanya kelompok gen yang diekspresikan hanya pada pasien COVID-19 saja. Sementara itu, dapat pula diamati bahwa terdapat satu set gen yang besar yang tidak diekspresikan atau diekspresikan dengan rendah pada 28 pasien COVID-19 di kedua kategori gejala. Pasien dengan gejala ringan hanya memiliki sedikit perpotongan gen yang terekspresi lebih tinggi dengan pasien tanpa gejala. Hal ini menunjukkan terdapat gen-gen dan fungsi biologis yang secara khusus dideregulasi pada pasien dengan gejala. ACE2 dan TMPRSS2 merupakan dua gen yang terkait dalam infeksi SARS-CoV-2. Masing-masing berperan sebagai reseptor protein S serta menyebabkan protein S mengalami priming sehingga dapat masuk ke dalam target sel (Hoffmann et al., 2020). Pada penelitian sebelumnya, level ekspresi keduanya berbandung lurus dengan tingkat keparahan gejala klinis COVID-19 (Jain et al., 2021). Pada penelitian ini (Gambar IV.5), ditemukan bahwa level ekspresi ACE2 pada kelompok pasien bergejala signifikan lebih tinggi (p < 0,01) dibandingkan kontrol sehat dan pasien tidak bergejala. Sementara itu, level ekspresi TMPRSS2 lebih rendah pada pasien COVID-19 di kedua kategori. Gambar IV.5 Plot level normalized count ekspresi gen ACE2 dan TMPRSS2 dibandingkan kontrol sehat IV.1.4 Hasil Analisis Ontologi Gen (GO) 29 Analisis ontologi gen dilakukan dengan menggunakan package R clusterProfiler. Input yang digunakan berupa simbol gen-gen yang terekspresi diferensial – baik upregulated maupun downregulated – untuk tiap kategori keparahan penyakit dari hasil analisis DESeq2. Input lainnya merupakan daftar seluruh simbol gen yang digunakan pada analisis DE sebagai latar belakang atau universe gen sehingga nilai Benjamini-Hochberg p adjusted value (p.adj) dapat dihitung. Istilah ontologi gen dari kategori proses biologis (BP) dengan 25 p.adj terendah diplot ke dalam grafik batang (Gambar IV.6 & Gambar IV.7) beserta jumlah gen yang terekspresi signifikan berbeda untuk tiap-tiap istilah GO-nya. Gambar IV.6 Visualisasi dotplot 25 istilah ontologi gen dengan nilai adjusted p- value terendah pada pasien tidak bergejala Gen-gen terkait modifikasi cilia (cilium assembly, cilium organization, ciliary basal body-plasma membrane docking) mengalami pengayaan pada pasien tidak bergejala (Gambar IV.6). Selain itu, juga terdapat pengayaan istilah-istilah proses biologis terkait modifikasi epigenetik (histone modification, covalent chromatin modification), regulasi siklus sel, modifikasi RNA dan transfer inti sel (nuclear transfer, nucleocytoplasmic transport), transportasi dan modifikasi protein (peptidyl-lysine modification, Golgi vesicle transport, proteasome-mediated ubiquitin-dependent protein catabolic process, proteasomal protein catabolic 30 process, regulation of intracellular protein transport, regulation of intracellular transport, protein-containing complex localization, establishment of vesicle localization, cytosolic transport, positive regulation of cellular protein localization, organelle localization by membrane tethering, vesicle localization). Gambar IV.7 Plot 25 istilah ontologi gen dengan nilai adjusted p-value terendah pada pasien bergejala ringan Istilah ontologi gen yang paling ter-enriched pada sampel pasien bergejala ringan adalah proses-proses terkait modifikasi RNA dan translasi mRNA (mRNA catabolic process, RNA splicing, RNA catabolic process, regulation of mRNA metabolic process, RNA localization, regulation of translation, establishment of RNA localization, nucleic acid transport, RNA transport, translational initiation). Selain itu, proses biologis yang mengalami pengayaan adalah modifikasi cilia, modifikasi protein dan transportasi RNA dari nukleus. Proses katabolisme RNA, merupakan proses biologis yang mengalami enrichment tinggi (adjusted p value = 2,77x10 -18 ) pada kelompok pasien bergejala. Melalui data ini, diduga terjadi deregulasi ekspresi gen yang berbeda pada kedua kelompok pasien, dan dapat menjadi hallmark molekuler keparahan COVID-19. Untuk 31 diketahui lebih lanjut, maka dibuat plot heatmap nilai fold change relatif gen-gen pada kategori ontologi gen ini (Gambar IV.8). Gambar IV.8 Peta heatmap nilai log2foldchange beberapa gen pada kategori proses katabolisme mRNA. Nilai positif menunjukkan peningkatan ekspresi, nilai negatif menunjukkan penurunan level ekspresi. Beberapa gen mengalami penurunan level ekspresi (Gambar IV.8) pada kelompok tidak bergejala dalam satuan log 2 fold change. Beberapa di antaranya yaitu gen ERN1 (log2foldchange = -8,127; p = 7,89 x 10 -18 ), PNPT1 (log2foldchange = - 8,072; p = 2,02 x 10 -17 ), RNH1 (log2foldchange = -9,179; p = 5,33 x 10 -23 ), dan YTHDF2 (log2foldchange = -8,97; p = 1,68 x 10 -23 ). Sementara itu, gen LSM2 (log2foldchange = 2,252; p = 8,00 x 10 -3 ) dan ZC3H12D (log2foldchange = 3,665; p = 1,11 x 10 -4 ) secara spesifik mengalami peningkatan ekspresi pada pasien tidak bergejala. Selain proses katabolisme mRNA, makroautofagi merupakan salah satu proses yang secara khusus termodulasi di 25 proses teratas pada pasien tanpa gejala. Oleh karena itu, juga dilakukan pembuatan peta heatmap untuk gen-gen pada kategori 32 ini (Gambar IV.9). Setidaknya ada tiga gen yang secara ekstrem turun ekspresinya pada pasien tidak bergejala dan tidak teramati pada pasien bergejala: CHMP3 (log2foldchange = -10,725; p = 5,42 x 10 -38 ), MFN2 (log2foldchange = -9,432; p = 4,43 x 10 -21 ) dan ATG5 (log2foldchange = -8,275; p = 5,39 x 10 -14 ). Sementara itu, dua gen lagi mengalami peningkatan level ekspresi pada pasien bergejala ringan: MAP1LC3C (log2foldchange = 6,32; p = 3,85 x 10 -4 ) dan TMEM74 (log2foldchange = 7,301; p = 2,04 x 10 -16 ). 33 Gambar IV.9 Peta heatmap nilai log2foldchange beberapa gen pada kategori makroautofagi. Nilai positif menunjukkan peningkatan ekspresi, nilai negatif menunjukkan penurunan level ekspresi. IV.1.5 Pengurutan Basa Genom SARS-CoV-2 Rangkuman hasil pemetaan basa genom SARS-CoV-2 ini dapat dilihat pada tabel di bawah (Tabel IV.6). Seluruh assembly genom memiliki panjang setidaknya 29,8 ribu pasang basa yang cukup untuk meng-cover wilayah pengkode gen dari genom SARS-CoV-2. Sementara itu, jenia varian virus yang menginfeksi berdasarkan klasifikasi Pango Lineage yaitu B.1.1.398 kecuali pada pasien AS_2. Tabel IV.6 Rangkuman hasil pengurutan & pemetaan basa genom SARS-CoV-2 dan data Pango Lineage sesuai klasifikasi oleh GISAID Sampel Accession ID Panjang Assembly (bp) Median Coverage Pango Lineage AS_1 EPI_ISL_747235 29.860 343 B.1.1.398 AS_2 EPI_ISL_747239 29.877 11.306 B.1.1 SY_1 EPI_ISL_747236 29.862 929 B.1.1.398 SY_2 EPI_ISL_745033 29.866 5.512 B.1.1.398 IV.1.6 Analisis Koinfeksi Untuk jumlah bacaan pada level spesies, dibuat plot batang yang menunjukkan kelimpahan relatif (dalam persen) untuk tiap sampel (Gambar IV.10). Berdasarkan plot tersebut, dapat diamati kelimpahan relatif Streptococcus pneumoniae pada pasien SY1 dan SY2 berturut-turut adalah 50,91% dan 0,15%. Nilai ini 2-700 kali lebih besar dibandingkan persen kelimpahan relatif pada pasien AS1 dan AS2 masing-masing sebesar 0% dan 0,07%. Sementara itu, teramati kelimpahan Cutibacterium acnes yang lebih rendah pada pasien bergejala ringan (0,46% pada pasien SY1 & 7,76% pada pasien SY2) dibandingkan pada pasien tanpa gejala (24,19% pada pasien AS1 & 13,49% pada pasien AS2). 34 Gambar IV.10 Grafik batang nilai kelimpahan relatif (0-1) spesies bakteri pada sampel nasofaring berdasarkan analisis DRAGEN Metagenomics Pipeline IV.1.7 Profil Inflamasi Berdasarkan penelitian sebelumnya, ditemukan kenaikan level sitokin proinflamasi pada pasien terinfeksi SARS-CoV-2 (Daamen et al., 2021; Jain et al., 2021; Lieberman et al., 2020). Fenomena badai sitokin, yaitu elevasi level sitokin pada plasma, juga terasosiasi dengan ciri utama infeksi SARS-CoV-2 pada pasien dengan gejala berat hingga kritis (Eljilany & Elzouki, 2020; Trougakos et al., 2021). Selain sitokin proinflamasi, elevasi protein cascade sistem komplemen pada sampe darah juga terasosiasi dengan perburukan kondisi pasien COVID-19, terutama yang diikuti dengan trombosis (Benmansour et al., 2021; Rogan et al., 2020). Berdasarkan penelitian dan analisis di atas, maka pada studi ini disajikan peta heatmap yang menampilkan perubahan ekspresi (log 2 fold change) dari gen-gen sitokin proinflamasi (IV.11) dan sistem komplemen (IV.12). Berdasarkan informasi ini, teramati adanya penurunan ekspresi IL15 secara khusus pada pasien tanpa gejala serta peningkatan ekspresi C7, C8A, dan C9 pada pasien bergejala ringan. 35 Gambar IV.11 Nilai log 2 fold change sitokin proinflamasi yang mengalami perubahan ekspresi signifikan pada kedua kelompok sampel Gambar IV.12 Nilai log 2 fold change komponen sistem komplemen yang mengalami perubahan ekspresi signifikan pada kedua kelompok sampel IV.2 Pembahasan Pada penelitian ini, baik pada pasien bergejala maupun tidak bergejala diketahui tidak terdapat perbedaan yang signifikan pada ekspresi beberapa sitokin proinflamasi apabila dibandingkan dengan kontrol. Namun, terdapat penurunan 36 beberapa sitokin di kedua kelompok pasien (CXCL8, IL16, IL18, dan TXLNA) kecuali IL15 (Gambar IV.11). Rendahnya ekspresi sitokin proinflamasi ini dapat disebabkan oleh kondisi pasien yang seluruhnya tidak memiliki gejala berat serta karena digunakannya sampel nasofaring di mana respon inflamasi tidak terdeteksi. Hasil penelitian sebelumnya menemukan korelasi positif profil inflamasi dengan keparahan gejala (Jain et al., 2021), serta perbedaan profil inflamasi yang signifikan antara sampel saluran pernafasan dengan sampel jaringan alveoli dan darah (Daamen et al., 2021). Seperti penelitian sebelumnya (Lieberman et al., 2020), profil inflamasi pada sampel nasofaring tidak tinggi karena diduga bukan merupakan lokasi anatomi yang tepat untuk mengamati respon inflamasi. Walaupun demikian, ditemukan ekspresi IL15 yang hanya turun pada pasien tanpa gejala (p < 0,01) namun tidak pada pasien bergejala ringan (Gambar IV.11). Hal ini mengindikasikan peran ekspresi basal IL15 yang dapat terlibat dalam perburukan kondisi pasien. IL15 sendiri merupakan sitokin proinflamasi yang memiliki peran dalam aktivasi neutrofil. Ekspresinya yang berlebihan dapat menginduksi merekrut banyak neutrofil (R. C & D, 2004) sehingga meningkatkan rasio neutrofil/limfosit yang merupakan marka keparahan COVID-19 di tahap awal infeksi (Liu et al., 2020). Pada penelitian identifikasi profil ekspresi gen sebelumnya, didapatkan bahwa terjadi aktivasi sistem komplemen yang berhubungan dengan keparahan COVID- 19 (Jain et al., 2021). Hal ini juga dibuktikan dengan ditemukannya elevasi level protein-protein komplemen pada sampel darah pasien COVID-19 dengan gejala berat yang menunjukkan potensinya sebagai marka prognosis serta target untuk terapi (Benmansour et al., 2021; Holter et al., 2020; Java et al., 2020; Risitano et al., 2020). Pada penelitian ini, kami menemukan elevasi level ekspresi gen C7, C8a, dan C9 pada pasien bergejala ringan, namun tidak berubah pada pasien tanpa gejala (Gambar IV.12).