gryf/coach

mirror of https://github.com/gryf/coach.git synced 2026-07-07 18:06:31 +02:00

Files

T

History

Itai Caspi d59a700248 updated benchmarks for pong and breakout for dueling ddqn with PER

2018-09-06 14:05:46 +03:00

..

breakout_dueling_ddqn_with_per.png

updated benchmarks for pong and breakout for dueling ddqn with PER

2018-09-06 14:05:46 +03:00

pong_dueling_ddqn_with_per.png

updated benchmarks for pong and breakout for dueling ddqn with PER

2018-09-06 14:05:46 +03:00

README.md

benchmarks and pip package updates

2018-08-19 14:23:20 +03:00

space_invaders_dueling_ddqn_with_per.png

updated the benchmarks for space invaders with dueling ddqn variants

2018-09-06 12:13:49 +03:00

README.md

Dueling DDQN with Prioritized Experience Replay

Each experiment uses 3 seeds and is trained for 10k environment steps. The parameters used for Dueling DDQN with PER are the same parameters as described in the following paper.

Breakout Dueling DDQN with PER - single worker

coach -p Atari_Dueling_DDQN_with_PER_OpenAI -lvl breakout

Breakout Dueling DDQN with PER

Pong Dueling DDQN with PER - single worker

coach -p Atari_Dueling_DDQN_with_PER_OpenAI -lvl pong

Pong Dueling DDQN with PER

Space Invaders Dueling DDQN with PER - single worker

coach -p Atari_Dueling_DDQN_with_PER_OpenAI -lvl space_invaders

Space Invaders Dueling DDQN with PER