gryf/coach

mirror of https://github.com/gryf/coach.git synced 2026-07-08 02:16:32 +02:00

Files

T

History

Itai Caspi c5165cd7d6 benchmarks and pip package updates

2018-08-19 14:23:20 +03:00

..

breakout_qr_dqn.png

pre-release 0.10.0

2018-08-13 17:11:34 +03:00

pong_qr_dqn.png

pre-release 0.10.0

2018-08-13 17:11:34 +03:00

README.md

benchmarks and pip package updates

2018-08-19 14:23:20 +03:00

README.md

Quantile Regression DQN

Each experiment uses 3 seeds and is trained for 10k environment steps. The parameters used for QR-DQN are the same parameters as described in the original paper.

Breakout QR-DQN - single worker

coach -p Atari_QR_DQN -lvl breakout

Breakout QR-DQN

Pong QR-DQN - single worker

coach -p Atari_QR_DQN -lvl pong

Pong QR-DQN