coach

gryf/coach

mirror of https://github.com/gryf/coach.git synced 2026-01-24 08:05:50 +01:00

Author	SHA1	Message	Date
Gal Novik	fc6604c09c	added missing license headers	2018-11-27 22:43:40 +02:00
Sina Afrooze	19a68812f6	Added ONNX compatible broadcast_like function (#152 ) - Also simplified the hybrid_clip implementation.	2018-11-25 11:23:18 +02:00
Thom Lane	81bac050d7	Added Custom Initialisation for MXNet Heads (#86 ) * Added NormalizedRSSInitializer, using same method as TensorFlow backend, but changed name since ‘columns’ have different meaning in dense layer weight matrix in MXNet. * Added unit test for NormalizedRSSInitializer.	2018-11-16 08:15:43 -08:00
Thom Lane	3358e04a6a	Corrected MXNet's PPO Head for Continuous Action Spaces (#84 ) * Changes required for Continuous PPO Head with MXNet. Used in MountainCarContinuous_ClippedPPO. * Simplified changes for continuous ppo. * Cleaned up to avoid duplicate code, and simplified covariance creation.	2018-11-15 13:27:54 -08:00
Sina Afrooze	5fadb9c18e	Adding mxnet components to rl_coach/architectures (#60 ) Adding mxnet components to rl_coach architectures. - Supports PPO and DQN - Tested with CartPole_PPO and CarPole_DQN - Normalizing filters don't work right now (see #49) and are disabled in CartPole_PPO preset - Checkpointing is disabled for MXNet	2018-11-07 17:07:15 +02:00