Add is_on_policy property to agents (#480)

2026-04-29 20:14:09 +02:00 · 2021-05-06 18:02:02 +03:00
parent 06bacd9de0
commit 9106b69227
21 changed files with 86 additions and 1 deletions
@@ -92,6 +92,10 @@ class NStepQAgent(ValueOptimizationAgent, PolicyOptimizationAgent):
        self.q_values = self.register_signal('Q Values')
        self.value_loss = self.register_signal('Value Loss')

+    @property
+    def is_on_policy(self) -> bool:
+        return False
+
    def learn_from_batch(self, batch):
        # batch contains a list of episodes to learn from
        network_keys = self.ap.network_wrappers['main'].input_embedders_parameters.keys()