Abstrak - Dzakwanil Hakim
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan
Terbatas  Irwan Sofiyan
» Gedung UPT Perpustakaan
Hepatocellular carcinoma (HCC) merupakan jenis kanker hati primer yang paling dominan, dengan prevalensi ke-6 di dunia dan ke-5 di Indonesia, serta peringkat kematian akibat kanker ke-4 di dunia dan ke-3 di Indonesia. Untuk menekan prevalensi dan kematian akibat kanker ini, diperlukan suatu upaya precision cancer. Tumor grade pada HCC, yang terdiri dari G1 (terdiferensiasi baik), G2 (terdiferensiasi sedang), G3 (kurang terdiferensiasi), dan G4 (tak terdiferensiasi), memiliki kemampuan prognosis yang baik berdasarkan histologi. Namun, heterogenitas molekuler yang tinggi pada HCC memerlukan identifikasi profil molekuler yang berkorelasi dengan perkembangan tumor grade. Metilasi DNA berperan penting dalam inisiasi dan progresi kanker melalui penghambatan ekspresi gen tumor suppressor dan induksi ekspresi gen proto-oncogene. Namun, belum terdapat penelitian yang mengkorelasikan profil metilasi DNA dengan sistem tumor grade HCC. Selain itu, data metilasi DNA merupakan data berdimensi tinggi dan kompleks sehingga diperlukan metode analisis yang tepat. Oleh karena itu, penelitian ini bertujuan untuk menentukan apakah tumor grade HCC (G1, G2, G3) dan jaringan normal dapat dibedakan berdasarkan data metilasi DNA daerah promoter melalui pendekatan supervised learning, serta mengidentifikasi gen-gen termetilasi yang relevan dan hubungannya dengan proses biologis terkait migrasi, proliferasi, dan diferensiasi sel. Data metilasi DNA dikoleksi dari studi TCGA-LIHC dan GEO GSE61278, terdiri dari 433 data (G1: 46 sampel, G2: 167 sampel, G3: 120 sampel, normal: 100 sampel). Setelah proses seleksi fitur probe CpG dan oversampling dengan SMOTE, didapatkan 1044 situs CpG yang mencakup 928 gen dan 167 titik data yang seimbang untuk setiap kelas. Kandidat model supervised learning yang diuji meliputi Gaussian NB, linear SVM, kernel SVM, random forest, dan neural network. Evaluasi performa menunjukkan model linear SVM dan kernel SVM dengan kernel polinomial memiliki performa terbaik dengan nilai metrik evaluasi keseluruhan adalah 90% dalam memprediksi G1, G2, G3, dan normal. Namun, klasifikasi antara G2 dan G3 memerlukan klasifikasi biner dengan model kernel SVM dengan kernel RBF untuk performa terbaik dengan nilai metrik evaluasi keseluruhan adalah 85%. Analisis lanjutan dengan SHAP mengungkapkan didapatkan 400 gen relevan dengan 88 gen terhipermetilasi dan 312 gen terhipometilasi relatif terhadap normal. Dari 10 gen terhipermetilasi dan terhipometilasi relevan untuk masing-masing tumor grade, mayoritas valid berdasarkan literatur dan berperan dalam aktivasi jalur persinyalan Wnt/?-catenin, PI3K/Akt, ERK, TNF?-NF?B, regulasi ECM, regulasi sitoskelet, dan siklus sel. Pola metilasi gen-gen relevan yang didapatkan juga mendukung proses migrasi, proliferasi, dan dediferensiasi seiring perkembangan tumor grade HCC yang melibatkan jalur persinyalan ERK/MAPK, Ras, persinyalan Ca2+, dan aktivitas fosforilasi serta defosforilasi.