ANALISIS TRANSKRIPTOMIK USAP NASOFARING PASIEN COVID-19 TANPA GEJALA & BERGEJALA RINGAN UNTUK IDENTIFIKASI KANDIDAT MARKA KEPARAHAN PENYAKIT TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh MIFTAHUL FARIDL NIM: 21120027 (Program Studi Magister Bioteknologi) INSTITUT TEKNOLOGI BANDUNG September 2021 v ANALISIS TRANSKRIPTOMIK USAP NASOFARING PASIEN COVID-19 TANPA GEJALA & BERGEJALA RINGAN UNTUK IDENTIFIKASI KANDIDAT MARKA KEPARAHAN PENYAKIT HALAMAN PEN Oleh Miftahul Faridl NIM: 21120027 (Program Studi Magister Bioteknologi) Institut Teknologi Bandung Menyetujui Tim Pembimbing Tanggal 4 September 2021 Ketua ______________________ (Azzania Fibriani, Ph.D.) Anggota Anggota ______________________ ______________________ (Popi Septiani, Ph.D.) (dr. Cut Nur Cinthia Alamanda, Sp.PK., M.Kes.) ______________________________________________________________________________________________________________________________________________________________________________________________________________ PoPoPPPoPoPPoPPoopiSepepepepepeepepepepepepepepeititiani, P ___________________ Ketua ___________________ zzania Fibriani, Ph.D i ABSTRAK ANALISIS TRANSKRIPTOMIK USAP NASOFARING PASIEN COVID-19 TANPA GEJALA & BERGEJALA RINGAN UNTUK IDENTIFIKASI KANDIDAT MARKA KEPARAHAN PENYAKIT Oleh Miftahul Faridl NIM: 21120027 (Program Studi Magister Bioteknologi) COVID-19 memiliki manifestasi klinis yang sangat beragam, yaitu kelompok tanpa gejala dan kelompok bergejala. Untuk kelompok dengan gejala dapat dikategorikan menjadi gejala ringan, sedang, berat, sampai dengan kritis. Setiap tingkat keparahan penyakit diperkirakan memiliki proses patofisiologi yang berbeda-beda, yang bergantung dari faktor virus serta inangnya. Oleh karena itu, karakterisasi virus dan marka molekuler yang terdapat pada tubuh inang amat penting untuk dipelajari. Dalam penelitian ini dilakukan studi yang bertujuan untuk menganalisis karakter virus, profil transkriptomik, dan profil koinfeksi dari kelompok pasien yang tidak bergejala dan bergejala ringan. Ekstraksi total RNA dilakukan pada sampel usap nasofaring dari kelompok pasien tanpa gejala (n = 2) dan bergejala ringan (n = 2). Pustaka cDNA dibuat dengan kit Illumina Stranded Total RNA Prep with Ribo- Zero™ Plus untuk mendapatkan total RNA dengan deplesi rRNA. Pembacaan sekuen dilakukan pada sistem NextSeq 550 Illumina yang menghasilkan sepanjang 100 bp per bacaan. Pemetaan genom SARS-CoV-2 dibuat dengan program berbasis web DRAGEN RNA Pathogen Detection (BaseSpace Illumina). Kontrol kualitas serta pemetaan bacaan ke genom Homo sapiens (versi hg19) dilakukan dengan perangkat lunak Geneious (v.2021.1). Ekspresi gen diferensial dianalisis menggunakan package R DESeq2. Selanjutnya, analisis ontologi gen dilakukan dengan package R clusterProfiler. Analisis koinfeksi dilakukan dengan DRAGEN Metagenomics Pipeline (BaseSpace Illumina). Hasil penelitian menunjukkan, bahwa virus varian Pango Lineage B.1.1 atau B.1.1.398 menginfeksi baik kelompok bergejala dan tidak bergejala tanpa memengaruhi luaran klinis. Analisis principal component dan klasterisasi menunjukkan perbedaan ekspresi gen secara global pada kedua kelompok pasien. Kedua kelompok pasien mengalami modifikasi struktur cilia jaringan epitel saluran pernafasan atas serta deregulasi splicing mRNA yang merupakan strategi infeksi SARS-CoV-2 pada inang. Secara khusus, pasien tidak bergejala mengalami modulasi proses makroautofagi, epigenetik, dan siklus sel. Sementara itu, pada pasien bergejala terjadi gangguan pada sistem transportasi inti sel dan metabolisme RNA. Perubahan ekspresi gen global terjadi pada dua kelompok pasien yang terkait dengan keparahan penyakit. Penurunan ekspresi autophagy-related genes (ATG) dalam respon autofagi serta inflammasome interleukin-15 (IL15) dapat dijadikan kandidat marka penting pada ii pasien tidak bergejala. Sementara itu, peningkatan ekspresi gen MAP1LC3C dalam proses autofagi dan gen-gen terkait aktivasi sistem imun komplemen (C7, C8A, & C9) dapat dijadikan kandidat marka yang terkait dengan keparahan penyakit pada pasien bergejala ringan. Analisis koinfeksi menunjukkan adanya peningkatan kelimpahan relatif bakteri Streptococcus pneumoniae, serta penurunan kelimpahan Cutibacterium acnes pada pasien bergejala dibandingkan tanpa gejala. Analisis transkriptomik pada penelitian ini menyajikan beberapa kandidat marka molekuler keparahan COVID-19 serta menunjukkan kemungkinan koinfeksi bakteri terhadap perburukan gejala. Kata kunci: COVID-19, ekspresi gen diferensial, ontologi gen, SARS-CoV-2, transkriptomik iii ABSTRACT TRANSCRIPTOMIC ANALYSIS OF NASOPHARYNGEAL SWAB FROM ASYMPTOMATIC AND MILDLY SYMPTOMATIC COVID-19 PATIENTS TO IDENTIFY CANDIDATES OF DISEASE SEVERITY MARKER By Miftahul Faridl NIM: 21120027 (Master’s Program in Biotechnology) COVID-19 involves multiple clinical manifestations which include asymptomatic and symptomatic. Symptomatic patients can be categorized into asymptomatic infection, mild illness, moderate illness, severe illness, and critical. Each category is presumed to occupy different pathological processes depending on the viral and host factors. Therefore, characterization of viral properties and host's molecular markers due to SARS-CoV-2 infection is relevant to be investigated. This study aims to analyze viral variants and identify transcriptomic and coinfection profiles of asymptomatic and mildly symptomatic patients. Total RNA was extracted from nasopharyngeal swab samples of asymptomatic (n=2) and mildly symptomatic (n=2) patients. A cDNA library was synthesized using Illumina Stranded Total RNA Prep with Ribo-Zero™ Plus to obtain total RNA with rRNA depletion. Sequencing was performed in Illumina NextSeq 550 system, resulting in 100 bp long reads. SARS-CoV-2 genome assembly was carried out using the web-based program DRAGEN RNA Pathogen Detection (BaseSpace Illumina). Quality control analysis and reads assembly onto Homo sapiens genome (hg19 version) were performed using Geneious software (v.2021.1). Differentially expressed genes were analyzed using the R package DESeq2. After that, R package clusterProfiler was operated to study the enriched gene ontologies. Coinfections were identified using DRAGEN Metagenomics Pipeline (BaseSpace Illumina). This study shows that Pango Lineage variants of B.1.1 or B.1.1.398 infected both asymptomatic and symptomatic patients without affecting the clinical manifestations. Principal component and clustering analysis showed differences in the global expression of both groups of patients. The two groups were subjected to upper respiratory tract ciliated tissue structure modification and mRNA splicing deregulation which are SARS-CoV-2 infection strategies on host tissue. Individually, asymptomatic patients underwent modulation in their macroautophagy, epigenetics, and cell cycle processes. Meanwhile, mildly symptomatic patients underwent disruption in their nuclear transport system and RNA metabolism. Global gene expression occurs in both groups and is correlated with their level of severity. Downregulation of autophagy-related genes (ATG) in autophagy and inflammasome response, as well iv as interleukin-15 (IL15), can be suggested as important markers in asymptomatic illness. On the other hand, we suggest the upregulation of autophagy regulator MAP1LC3C and genes in the immune complement system (C7, C8A, & C9) as markers for disease severity in mild illness. Coinfection analysis revealed intensification of Streptococcus pneumoniae and decreasing of Cutibacterium acnes relative abundance in symptomatic patients to asymptomatic patients. The transcriptomic analysis of this study provides several candidates of molecular markers of COVID-19 severity, as well as offering the possibility of bacterial coinfection in worsening the symptoms. Keywords: COVID-19, differential gene expression, gene ontology, SARS-CoV-2, transcriptomics..