KODE BATANG DNA SEBAGAI ALAT IDENTIFIKASI KEANEKARAGAMAN DIATOM YANG BERASAL DARI PERAIRAN TELUK LAMPUNG DAN KEPULAUAN SERIBU DISERTASI Karya tulis sebagai salah satu syarat untuk memperoleh gelar Doktor dari Institut Teknologi Bandung Oleh ELFIRA ROSA PANE NIM: 30516008 (Program Studi Doktor Kimia) INSTITUT TEKNOLOGI BANDUNG Juli 2023 Judul Bahasa Indonesia: KODE BATANG DNA SEBAGAI ALAT IDENTIFIKASI KEANEKARAGAMAN DIATOM YANG BERASAL DARI PERAIRAN TELUK LAMPUNG DAN KEPULAUAN SERIBU Judul Bahasa Inggris: DNA BARCODING AS A TOOL FOR IDENTIFYING THE DIVERSITY OF DIATOMS ORIGINATING FROM THE WATERS OF LAMPUNG BAY AND SERIBU ISLANDS ABSTRAK KODE BATANG DNA SEBAGAI ALAT IDENTIFIKASI KEANEKARAGAMAN DIATOM YANG BERASAL DARI PERAIRAN TELUK LAMPUNG DAN KEPULAUAN SERIBU Oleh Elfira Rosa Pane NIM: 30516008 (Program Studi Doktor Kimia) Indonesia adalah negara kepulauan dengan persentase wilayah perairan mencapai 70%. Keanekaragaman organisme yang tumbuh dalam perairan Indonesia menjadi kekayaan alam yang harus dijaga dan diidentifikasi jenisnya. Diatom adalah salah satu organisme yang mampu berfotosintesis di perairan dan berperan sebagai rantai makanan terbawah. Diatom merupakan organisme uniseluler berukuran mikro sehingga untuk mengamati morfologi sel diatom harus menggunakan mikroskop cahaya. Pengamatan dengan mikroskop cahaya dapat menunjukkan keanekaragaman bentuk, ukuran, dan warna sel diatom, akan tetapi tidak cukup membantu dalam penentuan identitasnya, karena morfologi beberapa jenis diatom yang berbeda dapat terlihat sama/mirip dibawah mikroskop cahaya. Untuk itu, metode identifikasi lain diperlukan dan sebagai alternatif adalah metode identifikasi secara genetik. Beberapa gen yang telah digunakan sebagai penanda genetik untuk identifikasi adalah COX1, ITS1, ITS2, 5,8S, 28S, 18S, rbcL, dan rbcS. Namun hingga saat ini, belum ada gen yang dipastikan dapat digunakan untuk mengidentifikasi diatom hingga level spesies. Gen rbcL mengkode protein rubisco, protein ini berperan dalam fiksasi karbondioksida dalam reaksi gelap fotosintesis. Sebagai organisme yang berfotosintesis, diatom memiliki gen rbcL dan mampu mensintesis protein rubisco ini. Oleh karena itu pada penelitian ini gen rbcL digunakan bersama dengan gen 18S rRNA V4 untuk mengidentifikasi diatom yang berasal dari perairan laut tropis, khususnya di Teluk Lampung dan Kepulauan Seribu. Kode batang DNA sebagai suatu Teknik yang dapat mempermudah proses pengidentifikasian dibangun dari gen rbcL. Metode penelitian mencakup pengambilan sampel diatom dari perairan laut Indonesia yaitu di perairan Teluk Lampung dan Kepulauan Seribu tepatnya di gugusan Pulau Pari. Sampel air laut diamati dibawah mikroskop cahaya, diatom yang ditemukan dalam sampel air laut diambil satu persatu dan ditumbuhkan dalam tabung reaksi berisi media air laut termodifikasi. Tidak semua diatom yang diambil berhasil tumbuh. Hanya sebagian yang mampu beradaptasi yang dapat tumbuh dan diperbanyak secara bertahap hingga diperoleh jumlah sel yang cukup untuk pengisolasian DNA genom. Isolat DNA genom digunakan sebagai templat PCR untuk memperbanyak gen 18S V4 rRNA dan rbcL. Kedua gen tersebut ditentukan urutan nukleotidanya kemudian dianalisis menggunakan aplikasi Blast (NCBI) untuk mengidentifikasi sampel diatom, pohon filogenetik berbasis 18S rRNA V4 dan rbcL dibuat dari 20 genus diatom. Urutan nukleotida rbcL dari 20 genus tersebut dianalisis untuk mengetahui posisi nukleotida penanda yang menjadi pembeda antar Clade dan antar genus. Nukleotida penanda pada rbcL dianalisis efeknya terhadap residu-residu deduksi asam amino dalam protein rubisco. Kode batang DNA dibuat dari fragmen pendek rbcL yang memuat SNP-SNP diagnostik. Di dalam sampel air laut di Teluk Lampung dan Pulau Pari di Kepulauan Seribu, didapatkan 18 diatom yang berasal dari perairan Teluk Lampung dan 28 diatom yang berasal dari Pulau Pari. Dari total semua diatom, hanya 13 saja yang berhasil tumbuh, dikultivasi di laboratorium dan dapat diisolasi DNA genomnya. Berdasarkan morfologi dan urutan nukleotida gen 18S rRNA V4 dan rbcL, ke 13 diatom tersebut teridentifikasi sebagai genus Serratifera (isolat SELBA1), Lauderia (isolat LLBA2), Actinocyclus (isolat ALBA1), Cyclotella (isolat TMA2), Nitsczhia (isolat TMGS1 dan PBI2), Psammodyction (isolat TMA3), Entomoneis (isolat EPI1), Navicula (isolat NLA1, PBI1, dan NLBA2), dan Halamphora (isolat HLBA1 dan NLBA1). Pohon filogenetik yang dibuat berdasarkan gen rbcL memiliki susunan cabang atau pengelompokan Clade dan genus yang mirip/serupa dengan pohon filogenetik berdasarkan 18S V4 rRNA. Hal ini menunjukkan bahwa rbcL memiliki kemampuan yang sama dengan 18S V4 rRNA untuk membedakan Clade dan genus dari diatom. Analisis urutan rbcL pada 20 genus diatom menghasilkan total 120 posisi nukleotida penanda Clade dan genus, yang meliputi 17 posisi nukleotida penanda Clade dan 113 posisi nukleotida penanda genus. Untuk memudahkan identifikasi dengan menggunakan urutan gen rbcL rantai pendek, maka urutan gen rbcL dibagi menjadi empat region yang setiap region tersebut mampu mengidentifikasi 20 genus yang dianalisis. Empat region tersebut yaitu region 1 sepanjang 228 pb dimulai dari nukleotida no 177 ̶ 405; region 2 sepanjang 336 pb dimulai dari nukleotida 513 ̶ 849; region 3 sepanjang 237 pb dimulai dari nukleotida 909 ̶ 1146; dan region 4 sepanjang 207 pb dimulai dari nukleotida 1182 ̶ 1389. Variasi nukleotida pada posisi nukleotida penanda Clade dan genus telah mendeduksi residu-residu asam amino yang bervariasi pula di dalam protein rubisco, akan tetapi variasi tersebut tidak mempengaruhi residu katalitik. Empat region yang mampu mengidentifikasi dalam rbcL diamati posisinya, region 1 dan 3 terlibat dalam interaksi dengan RbcL tetangganya didalam rubisco, dan region 2 dan 4 terlibat dalam interaksi dengan RbcS dalam rubisco. Keempat region tersebut dapat digunakan sebagai kode batang DNA rbcL untuk pengidentifikasian genus diatom dengan cepat. Kode batang DNA adalah urutan DNA rantai pendek yang dapat digunakan untuk mengidentifikasi. rbcL memiliki 1473 nukleotida, urutan nukleotida yang terlalu panjang untuk digunakan sebagai kode batang DNA. Empat region dalam rbcL yang telah dianalisis mampu mengidentifikasi 3 Clade dan 20 genus, masing-masingnya dapat digunakan sebagai kode batang DNA. Dari empat region dalam rbcL yang sudah kami petakan dan berdasarkan jumlah nukleotida yang paling sedikit untuk mengidentifikasi Clade dan genus, maka region 1> region 3> region 2 > region 4. Region 1 memiliki nukleotia sepanjang 250 pb dan berada pada basa nukleotida 177 ̶ 405 pada gen rbcL. Berdasarkan hasil ini, primer untuk perbanyakan gen rbcL pada region 1 dapat dibuat, dan identifikasi Clade dan genus diatom dapat dilakukan dengan cepat. Kata kunci: pengidentifikasian genus, identifikasi diatom, rbcL, nukleotida penanda Clade dan genus, kode batang DNA. ABSTRACT DNA BARCODING AS A TOOL FOR IDENTIFYING THE DIVERSITY OF DIATOMS ORIGINATING FROM THE WATERS OF LAMPUNG BAY AND SERIBU ISLANDS. By Elfira Rosa Pane NIM: 30516008 (Doctoral Program in Chemistry) Indonesia is an archipelagic country with a percentage of its territory consisting of water reaching 70%. Various types of organisms thrive in Indonesian waters. The diversity of organisms found in Indonesian waters is a natural treasure that needs to be protected and identified by their species. Diatoms are one of the important organisms in aquatic environments as they serve as the foundation of the food chain and are capable of photosynthesis. Diatoms are single-celled microorganisms, and to observe the morphology of diatom cells, a light microscope is required. Observation under a light microscope can reveal the diversity of shapes, sizes, and colors of diatom cells. However, it is not sufficient to determine their identity because the morphology of different diatom species can appear similar under a light microscope. Therefore, alternative methods, such as genetic identification, are needed for species identification. Several genes, including COX1, ITS1, ITS2, 5.8S, 28S, 18S, rbcL, and rbcS, have been utilized as genetic markers for identification purposes. However, as of now, no gene has been definitively established for diatom identification. The rbcL gene is responsible for encoding the rubisco protein, which is crucial for carbon dioxide fixation during the dark phase of photosynthesis. Diatoms, being photosynthetic organisms, possess the rbcL gene and can synthesize the rubisco protein. Therefore, in this research, the rbcL gene, along with the 18S V4rRNA gene, was employed to identify diatoms originating from tropical marine environments, specifically in Lampung Bay and Seribu Islands. The research methodology involved the collection of diatom samples from Indonesian marine waters, specifically in Lampung Bay and Seribu Islands, specifically in the cluster of Pari Islands. Seawater samples were observed under a light microscope, and individual diatoms found in the seawater samples were carefully selected and cultivated in reaction tubes containing modified seawater media. Not all the collected diatoms were able to grow successfully. Only those that could adapt were able to grow and gradually propagate until a sufficient number of cells were obtained for DNA genome isolation. The isolated DNA was used as a PCR template to amplify the 18S rRNA V4 and rbcL genes. The nucleotide sequences of both genes were determined and analyzed using the Blast application (NCBI) to identify the diatom samples. A phylogenetic tree based on the 18S V4 rRNA and rbcL genes was constructed using 20 diatom genera. The nucleotide sequences of the rbcL gene from these 20 genera were analyzed to identify nucleotide markers that differentiate between clades and genera. The effects of these nucleotide markers on the deduced amino acid residues in the rubisco protein were analyzed. Barcode sequences were created from short rbcL fragments that contain the nucleotide markers for clades and genera. The results of this study revealed the presence of 18 diatoms from the waters of Lampung Bay and 28 diatoms from Pari Island. Out of all the diatoms collected, only 13 were able to grow, be cultivated in the laboratory, and have their DNA genomes isolated. Based on the morphology and nucleotide sequences of the 18S V4 rRNA and rbcL genes, these 13 diatoms were identified as the following genera: Serratifera (SELBA1 isolate), Lauderia (LLBA2 isolate), Actinocyclus (ALBA1 isolate), Cyclotella (TMA2 isolate), Nitzschia (TMGS1 and PBI2 isolates), Psammodyction (TMA3 isolate), Entomoneis (EPI1 isolate), Navicula (NLA1, PBI1, and NLBA2 isolates), and Halamphora (HLBA1 and NLBA1 isolates). The phylogenetic tree constructed based on the rbcL gene exhibited similar branching patterns and clustering of Clades and genera as the tree based on the 18S V4 rRNA gene. This indicates that rbcL possesses the same capability as the 18S V4 rRNA gene in distinguishing clades and genera of diatoms. Analysis of the rbcL sequences from the 20 diatom genera resulted in a total of 120 nucleotide markers, including 17 nucleotide markers for Clades and 113 nucleotide markers for genera. To facilitate identification using the rbcL short chain gene sequence, the rbcL gene sequence is divided into four regions, each capable of identifying 20 analyzed genera. These four regions are as follows: region 1, spanning 228 bp starting from nucleotide 177 to 405; region 2, spanning 336 bp starting from nucleotide 513 to 849; region 3, spanning 237 bp starting from nucleotide 909 to 1146; and region 4, spanning 207 bp starting from nucleotide 1182 to 1389. Nucleotide variations at clade marker positions and genus have led to varying amino acid residues within the rubisco protein, although these variations do not affect the catalytic residues. The positions of the four regions that are capable of identification in rbcL were observed: regions 1 and 3 are involved in interactions with their neighboring RbcL in rubisco, while regions 2 and 4 are involved in interactions with RbcS in rubisco. These four regions can be used as a DNA barcode for rapid identification of diatom genera. The barcode DNA sequence is a short DNA chain sequence that can be used for identification purposes. The rbcL gene has 1473 nucleotides, which is too long to be used as a barcode DNA sequence. Four regions within the rbcL gene that have been analyzed are capable of identifying 3 clades and 20 genera, each of which can be used as a barcode DNA sequence. Among the four regions in the rbcL gene that we have mapped, based on the minimum number of nucleotides required to identify clades and genera, region 1 > region 3 > region 2 > region 4. Region 1 has a length of 250 base pairs and is located at nucleotide positions 177 to 405 in the rbcL gene. Based on these results, primers for amplifying the rbcL gene in region 1 can be designed, and rapid identification of diatom clades and genera can be achieved. Keywords: Genus’s identification, diatom identification, rbcL, nucleotide markers for clades and genus, barcode DNA..