Corrected MXNet's PPO Head for Continuous Action Spaces (#84)

* Changes required for Continuous PPO Head with MXNet. Used in MountainCarContinuous_ClippedPPO. * Simplified changes for continuous ppo. * Cleaned up to avoid duplicate code, and simplified covariance creation.
2026-07-09 19:06:33 +02:00 · 2018-11-15 13:27:54 -08:00
parent fde73ced13
commit 3358e04a6a
3 changed files with 25 additions and 19 deletions
@@ -299,8 +299,7 @@ class MxnetArchitecture(Architecture):
        assert outputs is None, "outputs must be None"

        output = self._predict(inputs)
-
-        output = tuple(o.asnumpy() for o in output)
+        output = list(o.asnumpy() for o in output)
        if squeeze_output:
            output = squeeze_list(output)
        return output