Tesis ini, yang ditulis oleh Noval Dwi Jayanto untuk meraih gelar magister dari Institut Teknologi Bandung pada Juli 2024, membahas optimasi lampu lalu lintas di Simpang Samsat menggunakan Reinforcement Learning (RL). Simpang Samsat, yang sering mengalami kemacetan parah dengan lebih dari 10.000 kendaraan per jam, menjadi studi kasus karena belum memiliki sistem lampu lalu lintas adaptif. Penelitian ini bertujuan membuat simulasi lingkungan yang akurat, mengevaluasi kinerja pelatihan RL, dan menentukan metode RL paling efisien untuk mengatur lampu lalu lintas.
Metode penelitian melibatkan simulasi menggunakan SUMO (Simulation of Urban Mobility) untuk membandingkan tiga kondisi di Simpang Samsat, Bandung: Pengaturan default tanpa RL, pengaturan dengan Proximal Policy Optimization (PPO), dan pengaturan dengan Deep Q-Network (DQN). Data lalu lintas yang digunakan diperoleh dari divisi ATCS Dinas Perhubungan Kota Bandung selama periode April-Juni 2023. Simulasi dilakukan pada jam sibuk pagi, siang, dan sore. Parameter evaluasi meliputi panjang antrean rata-rata, waktu tunggu, dan durasi lampu merah maksimal.
Hasil penelitian menunjukkan bahwa penerapan lampu lalu lintas adaptif, khususnya menggunakan PPO dan DQN, memiliki potensi signifikan untuk meningkatkan efisiensi simpang dan mengurangi kemacetan. PPO dapat menurunkan panjang antrean rata-rata sebesar 13,09%, mengurangi waktu tunggu sebesar 45,9%, dan menurunkan durasi lampu merah maksimal sebesar 22,69%. Sementara itu, DQN dapat mengurangi panjang antrean rata-rata sebesar 11,74%, menurunkan waktu tunggu sebesar 39,1%, dan menurunkan durasi lampu merah maksimal sebesar 25,7%. PPO lebih unggul dalam mengurangi waktu tunggu rata-rata dan panjang antrian rata-rata. DQN lebih unggul dalam mengurangi durasi lampu merah maksimal.
Kesimpulan utama dari penelitian ini adalah strategi berbasis RL efektif dalam mengurangi kemacetan lalu lintas dan dapat menjadi referensi untuk perbaikan manajemen lalu lintas di perkotaan. Implementasi PPO dan DQN mampu menyesuaikan sinyal lalu lintas dengan lebih efisien.
Tesis ini juga menyertakan tinjauan pustaka mengenai lampu lalu lintas adaptif, SUMO, dan RL. Bagian analisis dan perancangan menjelaskan alur eksperimen, analisis masalah dan kebutuhan, preliminary experiment, arsitektur sistem, traffic signal control, dan problem model and design (termasuk state space, action space, reward definition, dan arsitektur jaringan).