Tesis Anisa Dwizarah dari Institut Teknologi Bandung mengusulkan integrasi algoritma Q-learning ke dalam sistem embedded untuk mengendalikan lampu lalu lintas adaptif. Penelitian ini mengatasi celah implementasi nyata dari sistem lampu lalu lintas pintar berbasis *machine learning*, yang sebagian besar masih dalam tahap simulasi karena risiko dan tantangan penerapan. Dengan menggunakan platform embedded PYNQ-Z1, sistem ini mengembangkan model miniatur lampu lalu lintas di mana perilaku lampu hijau dapat beradaptasi secara dinamis terhadap kondisi kemacetan yang disimulasikan. Proses pembelajaran mesin (eksplorasi dan eksploitasi) dijalankan langsung pada sistem embedded, bertujuan sebagai alat pembelajaran praktis sebelum implementasi dunia nyata. Tesis ini mendefinisikan 256 kondisi *state* kemacetan unik dan formula *reward* yang tepat, menunjukkan bahwa metode ini memungkinkan pembelajaran yang lebih cepat dengan kebutuhan memori yang lebih rendah, serta menjamin keadilan (*fairness*) antar jalur, dengan saran pengembangan lebih lanjut menggunakan akselerator FPGA.