Gal Leibovich
a1bb8eef89
DDPG Critic Head Bug Fix (#344)
* A bug fix for DDPG, where the update to the policy network was based on the sum of the critic's Q predictions on the batch instead of their mean
2019-06-05 17:47:56 +03:00
..
2019-06-05 17:47:56 +03:00
2019-06-05 17:47:56 +03:00
2019-03-19 18:07:09 +02:00
2019-04-26 12:27:33 -07:00
2019-05-27 10:46:07 +03:00
2019-05-28 09:34:49 +03:00
2019-05-28 15:44:55 +03:00
2019-05-28 09:34:49 +03:00
2019-05-28 15:44:55 +03:00
2019-05-28 09:34:49 +03:00
2019-04-26 12:27:33 -07:00
2019-05-28 12:19:57 +03:00
2019-06-05 00:16:50 +03:00
2018-12-17 21:36:27 +02:00
2018-08-13 17:11:34 +03:00
2019-05-28 12:19:57 +03:00
2018-11-23 18:05:44 -08:00
2019-04-26 12:27:33 -07:00
2019-04-09 12:14:27 -04:00
2019-03-10 13:15:14 +02:00
2018-08-27 10:54:11 +03:00
2019-04-09 12:14:27 -04:00
2019-03-19 18:07:09 +02:00
2018-08-13 17:11:34 +03:00
2018-11-18 18:02:55 +02:00
2019-04-26 12:27:33 -07:00
2018-11-25 08:33:09 +02:00
2018-11-27 22:43:40 +02:00
2018-08-13 17:11:34 +03:00
2019-03-19 18:07:09 +02:00
2019-04-26 12:27:33 -07:00
2019-03-27 21:14:19 +02:00