digilib@itb.ac.id +62 812 2508 8800

Kanker adalah salah satu penyakit paling berbahaya di dunia. Kanker adalah istilah untuk penyakit di rnana sel-sel abnormal dapat membelah tak terkendali dan menyerang sel-sel jaringan lain, memungkinkan sel-sel berbahaya menyebar ke bagian lain dari tubuh rnelalui darah. Menurut WHO (Organisasi Kesehatan Dunia), kanker merupakan penyebab utama kematian di seluruh dunia, merenggut 10 juta nyawa dan jurnlah ini meningkat setiap tahun dengan akibat yang fatal jika tidak terdiagnosis lebih awal. Salah satu cara untuk mendeteksi kanker adalah dengan rnenggunakan teknologi rnicroarray, yang rnernantau sejumlah besar data secara bersamaan untuk berbagai ekspresi (gen). Data yang digunakan adalah dataset colon, ovarian dan paru-paru. Namun, rintangan terbesar dengan data microarray adalah ukuran dimensinya yang mernpengaruhi hasil dan larnanya waktu klasifikasi. Oleh karena itu diperlukan suatu teknik dengan proses reduksi dimensi dan proses klasifikasi, agar model klasifikasi data rnicroarray dapat rnencapai hasil dan akurasi yang baik. Pada tesis ini, rnetodologi CRISP-DM digunakan untuk rnengatasi permasalahan analisis data dan merancang model prediktif yang efektif terhadap data colon, ovarian dan lung. Principal Component Analysis (PCA) berfungsi sebagai teknik ekstrasi fitur untuk mereduksi dirnensi yang besar pada data rnicroarray dan rnenerapkan teknik deep learning Long Short-Term Memory (LSTM) untuk proses klasifikasi. Dengan menggunakan LSTM, hasil klasifikasi yang diperoleh sangatlah baik dirnana LSTM dengan PCA rnasih lebih kurang nilai akurasinya. Hasil klasifikasi dengan model terbaik rnenunjukkan bahwa nilai terbaik LSTM pada data "lung" dengan nilai akurasi dan F1 sebesar 100% dalarn waktu 4164 detik. Sedangkan nilai terbaik LSTM+PCA juga pada data "lung" rnendapatkan nilai akurasi dan F1 sebesar 100% dalam waktu 4.6 detik.