digilib@itb.ac.id +62 812 2508 8800

Dari perspektif Muslim yang taat, mereka dibatasi untuk berinvestasi hanya pada aset yang tidak bertentangan dengan prinsip-prinsip Islam. Namun, sulit untuk mendapatkan hasil yang optimal dengan alternatif yang lebih sedikit dalam saham syariah. Untuk menjawab tantangan ini, Deep Reinforcement Learning (DRL) dieksplor untuk mengoptimalkan trading saham syariah. Perdagangan saham dimodelkan sebagai Markov Decision Process (MDP), karena sifatnya yang stokastik, interaktif dan bertujuan maksimalisasi profit. Agen DRL yang digunakan adalah algoritma actor-critic yaitu A2C, DDPG, dan PPO. Portofolio yang dipilih terdiri dari 30 saham syariah paling likuid di Indonesia yang membentuk indeks JII. Terakhir, kinerja masing-masing algoritma dibandingkan, dan dibandingkan juga terhadap indeks LQ45 yang terdiri dari 45 saham konvensional paling likuid di Bursa Efek Indonesia (BEI). Hasil penelitian menunjukkan bahwa trading saham syariah dari Januari 2019 hingga Desember 2020 menggunakan agen DRL dapat mengungguli indeks saham konvensional pembanding