gryf/coach

mirror of https://github.com/gryf/coach.git synced 2026-07-07 01:46:31 +02:00

Files

T

History

Itai Caspi c5165cd7d6 benchmarks and pip package updates

2018-08-19 14:23:20 +03:00

..

breakout_dqn.png

additional benchmarks for dqn and a3c

2018-08-18 15:21:50 +03:00

pong_dqn.png

additional benchmarks for dqn and a3c

2018-08-18 15:21:50 +03:00

README.md

benchmarks and pip package updates

2018-08-19 14:23:20 +03:00

space_invaders_dqn.png

additional benchmarks for dqn and a3c

2018-08-18 15:21:50 +03:00

README.md

DQN

Each experiment uses 3 seeds. The parameters used for DQN are the same parameters as described in the original paper, except for the optimizer (changed to ADAM) and learning rate (1e-4) used.

Breakout DQN - single worker

coach -p Atari_DQN -lvl breakout

Breakout DQN

Pong DQN - single worker

coach -p Atari_DQN -lvl pong

Pong DQN

Space Invaders DQN - single worker

coach -p Atari_DQN -lvl space_invaders

Space Invaders DQN