Yonaka Research | Developing reinforcement learning to let Yonaka play games

Posts

Jul 31, 2025
Q-Learning with Multiple Subactions
Autoregressive subaction sampling lets DQN handle composite actions without combinatorial explosion.
Apr 18, 2025
Extending DQN to Continuous Action Spaces with Cubic Splines
Cubic splines let DQN handle continuous action space without discretizing