Simulating the act on the trainer. (#65)

* Remove the use of daemon threads for Redis subscribe. * Emulate act and observe on trainer side to update internal vars.
2026-02-01 05:25:44 +01:00 · 2018-11-15 08:38:58 -08:00
parent fe6857eabd
commit fde73ced13
13 changed files with 221 additions and 55 deletions
--- a/rl_coach/training_worker.py
+++ b/rl_coach/training_worker.py
@@ -31,7 +31,14 @@ def training_worker(graph_manager, checkpoint_dir):
    # evaluation offset
    eval_offset = 1

+    graph_manager.setup_memory_backend()
+
    while(steps < graph_manager.improve_steps.num_steps):
+
+        graph_manager.phase = core_types.RunPhase.TRAIN
+        graph_manager.fetch_from_worker(num_steps=graph_manager.agent_params.algorithm.num_consecutive_playing_steps.num_steps)
+        graph_manager.phase = core_types.RunPhase.UNDEFINED
+
        if graph_manager.should_train():
            steps += 1