25 Bab III Metode Penelitian Bab ini berfokus pada proses analisis data historis, pemodelan forecasting inflow dan hasil pengujian model di Unit PLTA Bakaru. Melalui metode peramalan yang digunakan, diharapkan dapat diperoleh rekomendasi yang relevan dan aplikatif untuk mengantisipasi variasi inflow selama perubahan musim, sehingga pemanfaatan sumber daya air dapat dioptimalkan tanpa mengabaikan aspek pemeliharaan yang esensial. Penjelasan dan diskusi dalam bab ini meliputi analisis data inflow historis, perhitungan model peramalan, dan pengujian hasil model peramalan. Metode yang digunakan dalam penelitian ini adalah metode LSTM dan SARIMAX. Beberapa hal yang mendasari pemilihan metode LSTM adalah sebagai berikut: 1. LSTM mampu menangani hubungan temporal yang panjang 2. LSTM memiliki kemampuan mengatasi pola non linear 3. LSTM mampu mendeteksi pola musiman dan tran jangka panjang Sedangkan beberapa hal yang mendasari pemilihan metode SARIMAX antara lain: 1. SARIMAX mampu menangkap pola musiman dengan sangat baik 2. Peramalan yang dibantu dengan variabel exogen yaitu curah hujan 3. Cocok dengan data stasioner III.1 Pengumpulan Data Dalam proses penelitian Forecasting Inflow untuk Optimalisasi Pola Operasional dan Pemeliharaan Pembangkit Listrik pada Musim Hujan dan Kemarau di Unit PLTA Bakaru, pendataan merupakan langkah krusial yang harus dilakukan secara sistematis dan menyeluruh. Data yang terkumpul berfungsi sebagai dasar untuk menganalisis dan memprediksi aliran air yang akan digunakan untuk pembangkit listrik. Pengumpulan data melibatkan berbagai parameter yang berkaitan dengan hidrologi, kondisi cuaca, dan pola aliran sungai, yang dipengaruhi oleh fluktuasi musim hujan dan kemarau. Selain itu, data operasional historis dan data teknis dari unit PLTA Bakaru juga terintegrasi untuk memastikan bahwa hasil peramalan arus 26 masuk secara akurat mencerminkan kondisi aktual dan berfungsi sebagai panduan yang dapat diandalkan untuk mengoptimalkan pola operasional dan strategi pemeliharaan. Melalui pengumpulan data yang cermat, diharapkan prediksi arus masuk yang dihasilkan akan membantu manajemen dalam merencanakan strategi operasional yang efisien dan mengantisipasi tantangan yang timbul selama transisi musiman. III.1.1 Data Historis Inflow di PLTA Bakaru Data historis inflow di PLTA Bakaru memiliki peran yang sangat penting dalam penelitian ini karena memberikan gambaran rinci mengenai pola aliran air yang masuk ke unit pembangkit listrik dalam jangka waktu yang panjang. Data historis ini memungkinkan analisis yang lebih mendalam untuk mengidentifikasi tren, pola musiman, dan fluktuasi aliran air yang terjadi selama beberapa dekade. Dengan memahami pola-pola ini, peneliti dapat memperoleh wawasan yang berharga untuk peramalan inflow di masa depan secara lebih akurat. Prediksi ini sangat relevan dalam konteks pengelolaan sumber daya air yang optimal, baik untuk mendukung produksi listrik yang berkelanjutan maupun untuk memastikan keberlanjutan operasional pembangkit dalam menghadapi perubahan musim atau kondisi ekstrem. Data historis inflow yang digunakan dalam penelitian ini diperoleh dari arsip pencatatan di Unit PLTA Bakaru, yang terdiri dari data harian mulai tahun 1993 hingga 2023. Data yang sangat panjang ini memberikan cakupan waktu yang cukup untuk menangkap berbagai fenomena musiman maupun anomali aliran air. Data harian tersebut kemudian diolah dan direkapitulasi menjadi satu dataset yang komprehensif, seperti yang disajikan pada Tabel 4 dan Tabel 5. Dengan mengintegrasikan data tersebut ke dalam model peramalan, penelitian ini bertujuan untuk menghasilkan peramalan inflow yang tidak hanya akurat, tetapi juga relevan dalam mendukung perencanaan operasi dan pemeliharaan PLTA secara lebih strategis. Hal ini diharapkan dapat meningkatkan efisiensi pemanfaatan air sekaligus menjaga keandalan sistem kelistrikan yang ada. 27 Tabel 4 Data harian inflow unit PLTA Bakaru Tabel 5 Dataset parameter inflow PLTA Bakaru 28 III.1.2 Data Curah Hujan di DAS Mamasa Data di Daerah Aliran Sungai Mamasa (DAS Mamasa) akan digunakan sebagai data pendukung dalam proses forecasting inflow karena curah hujan berdampak langsung pada volume dan pola aliran air yang masuk ke unit PLTA Bakaru. Sebagai sumber air utama DAS ini, data curah hujan dapat memberikan wawasan tentang intensitas, distribusi, dan variabilitas curah hujan yang terjadi baik pada musim hujan maupun kemarau. Dengan menganalisis data ini, model prakiraan aliran masuk dapat lebih akurat mencerminkan fluktuasi aliran air yang dipengaruhi oleh perubahan cuaca atau iklim. Informasi curah hujan juga berguna untuk mengantisipasi potensi aliran puncak selama hujan lebat, serta periode kekeringan yang dapat memengaruhi pasokan air. Data curah hujan didapatkan dari Badan Meteorologi, Klimatologi dan Geofisika (BMKG) dengan range data dari Tahun 2013 2023. Gambar 8 menunjukkan beberapa contoh data yang didapatkan dari BMKG: Gambar 8 Data curah hujan DAS Mamasa Data yang didapatkan dari BMKG berupa akumulasi curah hujan yang terjadi pada 10 harian pada tiap bulannya. Dari data tersebut, dilakukan breakdown menjadi data harian dan mingguan dengan melakukan pembagian secara acak dan mengikuti beberapa curah hujan yang masih bisa terbaca di unit PLTA Bakaru. III.2 Preprocessing / Pra-pemrosesan Data Preprocessing data dalam machine learning adalah serangkaian langkah awal untuk mempersiapkan data mentah agar dapat digunakan secara efektif dalam 29 pelatihan model. Tahapan ini penting karena data yang digunakan dalam machine learning sering kali tidak sempurna; data bisa saja memiliki nilai yang hilang, format yang tidak seragam, outlier, atau skala yang berbeda. Oleh karena itu, preprocessing data bertujuan untuk membersihkan, mentransformasikan, dan menstandarisasi data sehingga lebih sesuai untuk algoritma yang digunakan. Proses preprocessing meliputi berbagai langkah, seperti: 1. Pembersihan Data: Menghapus atau mengganti nilai-nilai yang hilang (missing values), mengatasi data duplikat, dan menangani outlier. 2. Transformasi Data: Mengubah format data menjadi representasi yang lebih sesuai, seperti konversi kategori ke bentuk numerik (encoding) atau transformasi logaritmik untuk data yang memiliki distribusi skewed. 3. Normalisasi atau Standardisasi: Menyetarakan skala fitur untuk mencegah algoritma tertentu menjadi bias terhadap variabel dengan nilai yang lebih besar. III.2.1 Mengimpor Libraries dan Dataset Pada penelitian ini, platform komputasi interaktif yang digunakan adalah Google Colab dengan bahasa pemrograman Python. Beberapa library yang diimpor untuk mendukung analisis data meliputi numpy, pandas, matplotlib.pyplot, seaborn, dan datetime. Setelah proses impor dataset selesai dilakukan, data untuk setiap parameter, seperti inflow dan curah hujan, ditampilkan dalam bentuk tabel. Sebagai ilustrasi, Tabel 6 menyajikan contoh dataset inflow dalam bentuk tabel tahun 2016 2023. Tabel 6 Dataset Inflow Bulan Tgl 2016 2017 2018 2019 2020 2021 2022 2023 0 1 1 19,65 39,28 45,92 39,11 55,54 50,34 55,73 64,28 1 1 2 30,51 37,93 90,04 38,91 108,56 103,15 58,46 60,48 2 1 3 23,16 46,39 58,94 37,84 119,13 119,13 65,87 59,94 3 1 4 23,32 52,64 61,73 32,94 99,34 99,34 73,77 57,48 4 1 5 21,67 61,44 92,35 36,00 56,91 56,91 64,55 59,12 Setelah semua dataset telah diimpor kedalam Google Colab, selanjutnya dicari data statistik untuk tiap parameter. Tabel 7 dan Tabel 8 adalah contoh tabel statistik dari parameter inflow dan curah hujan tahun 2016 2023. 30 Tabel 7 Descripive Statistics Inflow Bulan Tgl 2016 2017 2018 2019 2020 2021 2022 2023 Count 366 366 366 365 365 365 366 365 365 365 Mean 6,51 15,75 77,57 59,30 44,69 37,12 58,19 65,45 83,49 55,01 STD 3,45 8,82 37,72 30,45 25,07 28,06 32,04 36,78 41,18 31,33 Min 1 1 16,05 25,71 15,82 12,68 18,78 27,77 34,21 17,59 25% 4 8 45,40 36,68 27,65 19,30 35,33 40,68 55,73 30,52 50% 7 16 73,15 48,24 36,86 29,91 50,33 55,14 74,63 47,94 75% 9,75 23 98,70 74,59 51,30 43,46 70,05 76,83 94,44 69,33 Max 12 31 216,43 214,18 176,62 228,04 205,08 382,06 302,24 218,18 Tabel 8 Descriptive Statistics Curah Hujan Bulan Tgl 2016 2017 2018 2019 2020 2021 2022 2023 Count 366 366 364 365 365 365 365 365 365 364 Mean 6,51 15,75 15,10 11,89 8,75 8,10 15,08 12,17 8,80 4,60 STD 3,45 8,82 18,62 17,31 11,93 11,53 23,47 15,17 19,85 13,99 Min 1 1 0 0 0 0 0 0 0 0 25% 4 8 0 0 0 0 0 0 0 0 50% 7 16 10 9 0 0 8 8 0 0 75% 9,75 23 23 20 17 15,1 24 20 10 2,32 Max 12 31 167 221 76 66,1 258 110 225,3 150,1 III.2.2 Data Cleansing (Unpivot Dataset) Pada dasarnya, data cleansing dengan unpivot dataset merupakan suatu langkah yang dilakukan untuk mengubah bentuk data dari dataset yang lebar menjadi dataset yang panjang dengan menghilangkan batas maksimal rows yang ditampilkan, sehingga struktur data menjadi lebih fleksibel dan mudah diproses dalam analisis atau pemrograman. Dengan demikian, dataset tersebut akan lebih mudah diproses dalam pemrograman untuk tahap analisis lebih lanjut. Selain melakukan unpivot dataset, dilakukan juga data cleansing berupa date formatting agar format tanggal menjadi sesuai dengan yang dibutuhkan dan konsisten dengan format yang diterima oleh software pemrosesan data. Setelah melakukan data cleansing, maka dataset yang muncul untuk tiap parameter adalah sebagaimana contoh dataset inflow dan curah hujan yang ditunjukkan pada Tabel 9.