Quoridor RL

Reinforcement learning agents for the board game Quoridor on a 3x3 board with 1 wall per player.

Project Structure

Game engine:

game.py — game logic, Alpha-Beta, MCTS
quoridor_env.py — Gymnasium environment (flat/grid obs, sparse/dense reward)
wrappers.py — observation, reward, and action mask wrappers
opponents.py — baseline agents (Random, GreedyPath, Blocking, Minimax)

Value-based methods:

deep_q_network.py, double_deep_q_network.py, dueling_deep_q_network.py, categorical_deep_q_network.py, rainbow_deep_q_network.py — DQN variant implementations
train_all.py, run_train_all.py — training scripts
best_params.json — tuned hyperparameters per model
dqn_agents.py — unified loader for all DQN models

Policy gradient methods:

train_pg.py — REINFORCE, A2C, PPO, TRPO training
policy_agents.py — unified loader for PG models

Evaluation:

arena.py — round-robin tournament framework
eval_ppo.py — tournament runner
visualize.py — game replay and visualization
quoridor_research.ipynb — main analysis notebook with all results

Trained models:

models/ — DQN models (20 variants, retrained with alternating starts)
pg_results/ — PG models and training curves

Setup

python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
pip install stable-baselines3 sb3-contrib torchrl

Reproducing

Train policy gradient models:

python train_pg.py

Train DQN models:

python run_train_all.py

Run the full tournament:

python arena.py

Analysis notebook:

jupyter notebook quoridor_research.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Quoridor RL

Project Structure

Setup

Reproducing

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
models		models
pg_results		pg_results
.gitignore		.gitignore
README.md		README.md
arena.py		arena.py
best_params.json		best_params.json
categorical_deep_q_network.py		categorical_deep_q_network.py
deep_q_network.py		deep_q_network.py
double_deep_q_network.py		double_deep_q_network.py
dqn_agents.py		dqn_agents.py
dueling_deep_q_network.py		dueling_deep_q_network.py
eval_ppo.py		eval_ppo.py
game.py		game.py
opponents.py		opponents.py
policy_agents.py		policy_agents.py
quoridor_env.py		quoridor_env.py
quoridor_research.ipynb		quoridor_research.ipynb
rainbow_deep_q_network.py		rainbow_deep_q_network.py
requirements.txt		requirements.txt
run_train_all.py		run_train_all.py
train_all.py		train_all.py
train_all.slurm		train_all.slurm
train_pg.py		train_pg.py
visualize.py		visualize.py
wrappers.py		wrappers.py

Folders and files

Latest commit

History

Repository files navigation

Quoridor RL

Project Structure

Setup

Reproducing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages