digilib@itb.ac.id +62 812 2508 8800

Keandalan sistem Teknologi Informasi (TI) sangat penting bagi bisnis berbasis teknologi, karena kegagalan sistem dapat menyebabkan kerugian finansial, gangguan operasional, dan ketidakpuasan pelanggan. Meskipun PT INUSA telah memiliki kerangka kerja manajemen insiden, perusahaan masih mengalami insiden TI berulang, yang mengindikasikan adanya ketidakefisienan dalam pencegahan, deteksi, dan respons insiden. Penelitian ini menyelidiki akar penyebab insiden besar serta mengevaluasi kekurangan dalam deteksi dan penyelesaian insiden. Penelitian ini mengadopsi pendekatan kualitatif dengan melakukan analisis tematik pada 26 laporan post-mortem dari Agustus 2023 hingga Agustus 2024. Temuan menunjukkan bahwa 80% insiden dipicu oleh perubahan internal. Berbagai permasalahan sistemik ditemukan, termasuk kekurangan cakupan pengujian, kelemahan dalam proses deployment dan kontrol perubahan, serta penanganan konfigurasi yang kurang optimal. Selain itu, penelitian ini menemukan bahwa 69% insiden besar tidak memiliki sistem peringatan yang memadai, menyebabkan terlambatnya deteksi dengan Mean Time to Detect (MTTD) selama 82,5 jam. Ketidakefisienan dalam respons insiden, seperti eskalasi yang tertunda dan pemantauan pasca-perbaikan yang tidak cukup, turut berkontribusi terhadap Mean Time to Resolve (MTTR) selama 38,5 jam, yang jauh melampaui standar industri. Untuk mengatasi tantangan ini, penelitian ini mengusulkan berbagai perbaikan terstruktur dalam manajemen insiden TI. Rekomendasi utama mencakup peningkatan pengujian otomatis, perbaikan prosedur deployment dan tinjauan perubahan, penerapan prosedur eskalasi on-call yang lebih terstruktur, serta standarisasi mekanisme peringatan insiden. Selain itu, pemantauan pascaperbaikan harus diperkuat guna memastikan efektivitas penyelesaian masalah. Penelitian ini berkontribusi dalam manajemen insiden TI dengan menyajikan wawasan berbasis data mengenai kegagalan sistemik serta rekomendasi praktis untuk mengurangi frekuensi insiden, meningkatkan cakupan pemantauan, dan mengoptimalkan alur respons insiden. Dengan menerapkan perbaikan ini, PT INUSA dan perusahaan fintech serupa dapat meningkatkan ketahanan sistem, serta meminimalkan dampak bisnis akibat kegagalan sistem TI.