update evaluation periods

2026-07-09 02:46:33 +02:00 · 2018-03-19 17:48:57 +02:00
parent 24a0f24279
commit efc6e67a45
1 changed files with 4 additions and 2 deletions
@@ -538,8 +538,10 @@ class Humanoid_ClippedPPO(Preset):
        self.env.level = 'Humanoid-v1'
        self.learning_rate = 0.0001
        self.num_heatup_steps = 0
-        self.agent.num_consecutive_training_steps = 1
+        self.agent.num_consecutive_training_steps = 0
-        self.agent.num_consecutive_playing_steps = 2048
+        self.agent.num_consecutive_playing_steps = 200
        self.evaluate_every_x_episodes = 1
        self.evaluation_episodes = 10000
        self.agent.discount = 0.99
        self.batch_size = 64
        self.agent.policy_gradient_rescaler = 'GAE'