Corrected MXNet's PPO Head for Continuous Action Spaces (#84)

* Changes required for Continuous PPO Head with MXNet. Used in MountainCarContinuous_ClippedPPO. * Simplified changes for continuous ppo. * Cleaned up to avoid duplicate code, and simplified covariance creation.
2026-07-09 19:06:33 +02:00 · 2018-11-15 13:27:54 -08:00
parent fde73ced13
commit 3358e04a6a
3 changed files with 25 additions and 19 deletions
@@ -412,7 +412,10 @@ class SingleModel(HybridBlock):
        # Head
        outputs = tuple()
        for head in self._output_heads:
-            outputs += (head(state_embedding),)
+            out = head(state_embedding)
+            if not isinstance(out, tuple):
+                out = (out,)
+            outputs += out

        return outputs