coach

gryf/coach

Fork 0

mirror of https://github.com/gryf/coach.git synced 2025-12-18 11:40:18 +01:00

Commit Graph

Author	SHA1	Message	Date
Sina Afrooze	67a90ee87e	Add tensor input type for arbitrary dimensional observation (#125 ) * Allow arbitrary dimensional observation (non vector or image) * Added creating PlanarMapsObservationSpace to GymEnvironment when number of channels is not 1 or 3	2018-11-19 16:41:12 +02:00
Thom Lane	3358e04a6a	Corrected MXNet's PPO Head for Continuous Action Spaces (#84 ) * Changes required for Continuous PPO Head with MXNet. Used in MountainCarContinuous_ClippedPPO. * Simplified changes for continuous ppo. * Cleaned up to avoid duplicate code, and simplified covariance creation.	2018-11-15 13:27:54 -08:00
Sina Afrooze	5fadb9c18e	Adding mxnet components to rl_coach/architectures (#60 ) Adding mxnet components to rl_coach architectures. - Supports PPO and DQN - Tested with CartPole_PPO and CarPole_DQN - Normalizing filters don't work right now (see #49) and are disabled in CartPole_PPO preset - Checkpointing is disabled for MXNet	2018-11-07 17:07:15 +02:00

Author

SHA1

Message

Date

Sina Afrooze

67a90ee87e

Add tensor input type for arbitrary dimensional observation (#125 )

* Allow arbitrary dimensional observation (non vector or image)
* Added creating PlanarMapsObservationSpace to GymEnvironment when number of channels is not 1 or 3

2018-11-19 16:41:12 +02:00

Thom Lane

3358e04a6a

Corrected MXNet's PPO Head for Continuous Action Spaces (#84 )

* Changes required for Continuous PPO Head with MXNet. Used in MountainCarContinuous_ClippedPPO.

* Simplified changes for continuous ppo.

* Cleaned up to avoid duplicate code, and simplified covariance creation.

2018-11-15 13:27:54 -08:00

Sina Afrooze

5fadb9c18e

Adding mxnet components to rl_coach/architectures (#60 )

Adding mxnet components to rl_coach architectures.

- Supports PPO and DQN
- Tested with CartPole_PPO and CarPole_DQN
- Normalizing filters don't work right now (see #49) and are disabled in CartPole_PPO preset
- Checkpointing is disabled for MXNet

2018-11-07 17:07:15 +02:00

3 Commits