1
0
mirror of https://github.com/gryf/coach.git synced 2025-12-31 02:52:33 +01:00
Files
coach/rl_coach/traces/InvertedPendulum_PG/trace.csv
Itai Caspi 72a1d9d426 Itaicaspi/episode reset refactoring (#105)
* reordering of the episode reset operation and allowing to store episodes only when they are terminated

* reordering of the episode reset operation and allowing to store episodes only when they are terminated

* revert tensorflow-gpu to 1.9.0 + bug fix in should_train()

* tests readme file and refactoring of policy optimization agent train function

* Update README.md

* Update README.md

* additional policy optimization train function simplifications

* Updated the traces after the reordering of the environment reset

* docker and jenkins files

* updated the traces to the ones from within the docker container

* updated traces and added control suite to the docker

* updated jenkins file with the intel proxy + updated doom basic a3c test params

* updated line breaks in jenkins file

* added a missing line break in jenkins file

* refining trace tests ignored presets + adding a configurable beta entropy value

* switch the order of trace and golden tests in jenkins + fix golden tests processes not killed issue

* updated benchmarks for dueling ddqn breakout and pong

* allowing dynamic updates to the loss weights + bug fix in episode.update_returns

* remove docker and jenkins file
2018-09-04 15:07:54 +03:00

27 KiB

1Episode #Training IterIn HeatupER #TransitionsER #EpisodesEpisode LengthTotal stepsEpsilonShaped Training RewardTraining RewardUpdate Target NetworkEvaluation RewardShaped Evaluation RewardSuccess RateLoss/MeanLoss/StdevLoss/MaxLoss/MinLearning Rate/MeanLearning Rate/StdevLearning Rate/MaxLearning Rate/MinGrads (unclipped)/MeanGrads (unclipped)/StdevGrads (unclipped)/MaxGrads (unclipped)/MinEntropy/MeanEntropy/StdevEntropy/MaxEntropy/MinReturns Mean/MeanReturns Mean/StdevReturns Mean/MaxReturns Mean/MinReturns Variance/MeanReturns Variance/StdevReturns Variance/MaxReturns Variance/Min
210.01.04.01.04.04.00.10.0
320.01.03.01.03.07.00.10.0
430.01.03.01.03.010.00.10.0
540.01.07.01.07.017.00.10.0
650.01.06.01.06.023.00.10.0
760.01.08.01.08.031.00.10.0
870.01.03.01.03.034.00.10.0
980.01.03.01.03.037.00.10.0
1090.01.04.01.04.041.00.10.0
11100.01.06.01.06.047.00.10.0
12110.01.06.01.06.053.00.10.0
13120.01.03.01.03.056.00.10.0
14130.01.03.01.03.059.00.10.0
15140.01.04.01.04.063.00.10.0
16150.01.04.01.04.067.00.10.0
17160.01.05.01.05.072.00.10.0
18170.01.010.01.010.082.00.10.0
19180.01.03.01.03.085.00.10.0
20190.01.06.01.06.091.00.10.0
21200.01.04.01.04.095.00.10.0
22210.01.05.01.05.0100.00.10.0
23220.01.03.01.03.0103.00.10.0
24230.01.015.01.015.0118.00.10.0
25240.01.03.01.03.0121.00.10.0
26250.01.010.01.010.0131.00.10.0
27260.01.03.01.03.0134.00.10.0
28270.01.04.01.04.0138.00.10.0
29280.01.04.01.04.0142.00.10.0
30290.01.04.01.04.0146.00.10.0
31300.01.06.01.06.0152.00.10.0
32310.01.016.01.016.0168.00.10.0
33320.01.04.01.04.0172.00.10.0
34330.01.06.01.06.0178.00.10.0
35340.01.09.01.09.0187.00.10.0
36350.01.012.01.012.0199.00.10.0
37360.01.011.01.011.0210.00.10.0
38370.01.06.01.06.0216.00.10.0
39380.01.05.01.05.0221.00.10.0
40390.01.04.01.04.0225.00.10.0
41400.01.06.01.06.0231.00.10.0
42410.01.08.01.08.0239.00.10.0
43420.01.05.01.05.0244.00.10.0
44430.01.07.01.07.0251.00.10.0
45440.01.011.01.011.0262.00.10.0
46450.01.08.01.08.0270.00.10.0
47460.01.03.01.03.0273.00.10.0
48470.01.03.01.03.0276.00.10.0
49480.01.03.01.03.0279.00.10.0
50490.01.03.01.03.0282.00.10.0
51500.01.04.01.04.0286.00.10.0
52510.01.06.01.06.0292.00.10.0
53520.01.010.01.010.0302.00.10.0
54530.01.04.01.04.0306.00.10.0
55540.01.07.01.07.0313.00.10.0
56550.01.03.01.03.0316.00.10.0
57560.01.04.01.04.0320.00.10.0
58570.01.05.01.05.0325.00.10.0
59580.01.04.01.04.0329.00.10.0
60590.01.04.01.04.0333.00.10.0
61600.01.03.01.03.0336.00.10.0
62610.01.03.01.03.0339.00.10.0
63620.01.04.01.04.0343.00.10.0
64630.01.07.01.07.0350.00.10.0
65640.01.014.01.014.0364.00.10.0
66650.01.03.01.03.0367.00.10.0
67660.01.05.01.05.0372.00.10.0
68670.01.04.01.04.0376.00.10.0
69680.01.011.01.011.0387.00.10.0
70690.01.06.01.06.0393.00.10.0
71700.01.04.01.04.0397.00.10.0
72710.01.06.01.06.0403.00.10.0
73720.01.04.01.04.0407.00.10.0
74730.01.04.01.04.0411.00.10.0
75740.01.03.01.03.0414.00.10.0
76750.01.09.01.09.0423.00.10.0
77760.01.04.01.04.0427.00.10.0
78770.01.08.01.08.0435.00.10.0
79780.01.013.01.013.0448.00.10.0
80790.01.05.01.05.0453.00.10.0
81800.01.07.01.07.0460.00.10.0
82810.01.09.01.09.0469.00.10.0
83820.01.05.01.05.0474.00.10.0
84830.01.05.01.05.0479.00.10.0
85840.01.05.01.05.0484.00.10.0
86850.01.06.01.06.0490.00.10.0
87860.01.06.01.06.0496.00.10.0
88870.01.06.01.06.0502.00.10.0
89880.01.07.01.07.0509.00.10.0
90890.01.04.01.04.0513.00.10.0
91900.01.05.01.05.0518.00.10.0
92910.01.05.01.05.0523.00.10.0
93920.01.03.01.03.0526.00.10.0
94930.01.04.01.04.0530.00.10.0
95940.01.03.01.03.0533.00.10.0
96950.01.04.01.04.0537.00.10.0
97960.01.04.01.04.0541.00.10.0
98970.01.015.01.015.0556.00.10.0
99980.01.03.01.03.0559.00.10.0
100990.01.06.01.06.0565.00.10.0
1011000.01.07.01.07.0572.00.10.0
1021010.01.05.01.05.0577.00.10.0
1031020.01.04.01.04.0581.00.10.0
1041030.01.03.01.03.0584.00.10.0
1051040.01.05.01.05.0589.00.10.0
1061050.01.03.01.03.0592.00.10.0
1071060.01.06.01.06.0598.00.10.0
1081070.01.03.01.03.0601.00.10.0
1091080.01.03.01.03.0604.00.10.0
1101090.01.03.01.03.0607.00.10.0
1111100.01.08.01.08.0615.00.10.0
1121110.01.012.01.012.0627.00.10.0
1131120.01.011.01.011.0638.00.10.0
1141130.01.03.01.03.0641.00.10.0
1151140.01.03.01.03.0644.00.10.0
1161150.01.08.01.08.0652.00.10.0
1171160.01.014.01.014.0666.00.10.0
1181170.01.03.01.03.0669.00.10.0
1191180.01.04.01.04.0673.00.10.0
1201190.01.07.01.07.0680.00.10.0
1211200.01.07.01.07.0687.00.10.0
1221210.01.05.01.05.0692.00.10.0
1231220.01.04.01.04.0696.00.10.0
1241230.01.04.01.04.0700.00.10.0
1251240.01.04.01.04.0704.00.10.0
1261250.01.012.01.012.0716.00.10.0
1271260.01.03.01.03.0719.00.10.0
1281270.01.03.01.03.0722.00.10.0
1291280.01.08.01.08.0730.00.10.0
1301290.01.09.01.09.0739.00.10.0
1311300.01.06.01.06.0745.00.10.0
1321310.01.04.01.04.0749.00.10.0
1331320.01.010.01.010.0759.00.10.0
1341330.01.06.01.06.0765.00.10.0
1351340.01.04.01.04.0769.00.10.0
1361350.01.021.01.021.0790.00.10.0
1371360.01.05.01.05.0795.00.10.0
1381370.01.03.01.03.0798.00.10.0
1391380.01.03.01.03.0801.00.10.0
1401390.01.010.01.010.0811.00.10.0
1411400.01.04.01.04.0815.00.10.0
1421410.01.06.01.06.0821.00.10.0
1431420.01.03.01.03.0824.00.10.0
1441430.01.05.01.05.0829.00.10.0
1451440.01.04.01.04.0833.00.10.0
1461450.01.04.01.04.0837.00.10.0
1471460.01.06.01.06.0843.00.10.0
1481470.01.011.01.011.0854.00.10.0
1491480.01.03.01.03.0857.00.10.0
1501490.01.07.01.07.0864.00.10.0
1511500.01.05.01.05.0869.00.10.0
1521510.01.05.01.05.0874.00.10.0
1531520.01.03.01.03.0877.00.10.0
1541530.01.04.01.04.0881.00.10.0
1551540.01.05.01.05.0886.00.10.0
1561550.01.05.01.05.0891.00.10.0
1571560.01.03.01.03.0894.00.10.0
1581570.01.06.01.06.0900.00.10.0
1591580.01.03.01.03.0903.00.10.0
1601590.01.05.01.05.0908.00.10.0
1611600.01.04.01.04.0912.00.10.0
1621610.01.09.01.09.0921.00.10.0
1631620.01.04.01.04.0925.00.10.0
1641630.01.03.01.03.0928.00.10.0
1651640.01.010.01.010.0938.00.10.0
1661650.01.04.01.04.0942.00.10.0
1671660.01.011.01.011.0953.00.10.0
1681670.01.04.01.04.0957.00.10.0
1691680.01.03.01.03.0960.00.10.0
1701690.01.04.01.04.0964.00.10.0
1711700.01.05.01.05.0969.00.10.0
1721710.01.04.01.04.0973.00.10.0
1731720.01.03.01.03.0976.00.10.0
1741730.01.05.01.05.0981.00.10.0
1751740.01.06.01.06.0987.00.10.0
1761750.01.011.01.011.0998.00.10.0
1771760.01.04.01.04.01002.00.10.0
1781770.01.03.01.03.01005.00.10.0
1791780.01.04.01.04.01009.00.10.0
1801790.01.07.01.07.01016.00.10.0
1811800.01.06.01.06.01022.00.10.0
1821810.01.03.01.03.01025.00.10.0
1831820.00.09.01.09.01034.00.10.459.00.0
1841831.00.014.01.014.01048.00.10.700000000000000114.00.0
1851842.00.05.01.05.01053.00.10.255.00.0
1861853.00.07.01.07.01060.00.10.357.00.0
1871864.00.030.01.030.01090.00.11.500000000000000930.00.0
1881875.00.011.01.011.01101.00.10.549999999999999911.00.0
1891886.00.06.01.06.01107.00.10.36.00.0
1901897.00.012.01.012.01119.00.10.612.00.0
1911908.00.06.01.06.01125.00.10.36.00.0
1921919.00.012.01.012.01137.00.10.612.00.0
19319210.00.06.01.06.01143.00.10.36.00.0
19419311.00.09.01.09.01152.00.10.459.00.0
19519412.00.010.01.010.01162.00.10.510.00.0
19619513.00.011.01.011.01173.00.10.549999999999999911.00.0
19719614.00.08.01.08.01181.00.10.48.00.0
19819715.00.07.01.07.01188.00.10.357.00.0
19919816.00.06.01.06.01194.00.10.36.00.0
20019917.00.024.01.024.01218.00.11.200000000000000424.00.0
20120018.00.08.01.08.01226.00.10.48.00.0
20220119.00.018.01.018.01244.00.10.900000000000000218.00.0
20320220.00.05.01.05.01249.00.10.255.00.0
20420321.00.05.01.05.01254.00.10.255.00.0
20520422.00.06.01.06.01260.00.10.36.00.0
20620523.00.08.01.08.01268.00.10.48.00.0
20720624.00.015.01.015.01283.00.10.750000000000000115.00.0
20820725.00.034.01.034.01317.00.11.700000000000000834.00.0
20920826.00.021.01.021.01338.00.11.050000000000000521.00.0
21020927.00.07.01.07.01345.00.10.357.00.0
21121028.00.05.01.05.01350.00.10.255.00.0
21221129.00.010.01.010.01360.00.10.510.00.0
21321230.00.07.01.07.01367.00.10.357.00.0
21421331.00.05.01.05.01372.00.10.255.00.0
21521432.00.010.01.010.01382.00.10.510.00.0
21621533.00.013.01.013.01395.00.10.6513.00.0
21721634.00.06.01.06.01401.00.10.36.00.0
21821735.00.026.01.026.01427.00.11.300000000000000526.00.0
21921836.00.09.01.09.01436.00.10.459.00.0
22021937.00.011.01.011.01447.00.10.549999999999999911.00.0
22122038.00.08.01.08.01455.00.10.48.00.0
22222139.00.06.01.06.01461.00.10.36.00.0
22322240.00.028.01.028.01489.00.11.400000000000000628.00.0
22422341.00.08.01.08.01497.00.10.48.00.0
22522442.00.06.01.06.01503.00.10.36.00.0
22622543.00.07.01.07.01510.00.10.357.00.0
22722644.00.012.01.012.01522.00.10.612.00.0
22822745.00.011.01.011.01533.00.10.549999999999999911.00.0
22922846.00.014.01.014.01547.00.10.700000000000000114.00.0
23022947.00.010.01.010.01557.00.10.510.00.0
23123048.00.026.01.026.01583.00.11.300000000000000526.00.0
23223149.00.06.01.06.01589.00.10.36.00.0
23323250.00.019.01.019.01608.00.10.950000000000000419.00.0
23423351.00.012.01.012.01620.00.10.612.00.0
23523452.00.010.01.010.01630.00.10.510.00.0
23623553.00.012.01.012.01642.00.10.612.00.0
23723654.00.010.01.010.01652.00.10.510.00.0
23823755.00.05.01.05.01657.00.10.255.00.0
23923856.00.021.01.021.01678.00.11.050000000000000521.00.0
24023957.00.010.01.010.01688.00.10.510.00.0
24124058.00.07.01.07.01695.00.10.357.00.0
24224159.00.05.01.05.01700.00.10.255.00.0
24324260.00.010.01.010.01710.00.10.510.00.0
24424361.00.011.01.011.01721.00.10.549999999999999911.00.0
24524462.00.08.01.08.01729.00.10.48.00.0
24624563.00.08.01.08.01737.00.10.48.00.0
24724664.00.05.01.05.01742.00.10.255.00.0
24824765.00.05.01.05.01747.00.10.255.00.0
24924866.00.017.01.017.01764.00.10.850000000000000217.00.0
25024967.00.020.01.020.01784.00.11.000000000000000220.00.0
25125068.00.08.01.08.01792.00.10.48.00.0
25225169.00.030.01.030.01822.00.11.500000000000000930.00.0
25325270.00.010.01.010.01832.00.10.510.00.0
25425371.00.09.01.09.01841.00.10.459.00.0
25525472.00.030.01.030.01871.00.11.500000000000000930.00.0
25625573.00.05.01.05.01876.00.10.255.00.0
25725674.00.029.01.029.01905.00.11.450000000000000629.00.0
25825775.00.06.01.06.01911.00.10.36.00.0
25925876.00.07.01.07.01918.00.10.357.00.0
26025977.00.021.01.021.01939.00.11.050000000000000521.00.0
26126078.00.011.01.011.01950.00.10.549999999999999911.00.0
26226179.00.011.01.011.01961.00.10.549999999999999911.00.0
26326280.00.021.01.021.01982.00.11.050000000000000521.00.0
26426381.00.08.01.08.01990.00.10.48.00.0
26526482.00.015.01.015.02005.00.10.750000000000000115.00.0
26626583.00.06.01.06.02011.00.10.36.00.0
26726684.00.08.01.08.02019.00.10.48.00.0
26826785.00.05.01.05.02024.00.10.255.00.0
26926886.00.06.01.06.02030.00.10.36.00.0
27026987.00.021.01.021.02051.00.11.050000000000000521.00.0
27127088.00.015.01.015.02066.00.10.750000000000000115.00.0
27227189.00.012.01.012.02078.00.10.612.00.0
27327290.00.022.01.022.02100.00.11.100000000000000322.00.0
27427391.00.015.01.015.02115.00.10.750000000000000115.00.0
27527492.00.017.01.017.02132.00.10.850000000000000217.00.0
27627593.00.010.01.010.02142.00.10.510.00.0
27727694.00.011.01.011.02153.00.10.549999999999999911.00.0
27827795.00.033.01.033.02186.00.11.650000000000000833.00.0
27927896.00.012.01.012.02198.00.10.612.00.0
28027997.00.08.01.08.02206.00.10.48.00.0
28128098.00.022.01.022.02228.00.11.100000000000000322.00.0
28228199.00.036.01.036.02264.00.11.80000000000000136.00.0
283282100.00.032.01.032.02296.00.11.600000000000000832.00.0
284283101.00.015.01.015.02311.00.10.750000000000000115.00.0
285284102.00.018.01.018.02329.00.10.900000000000000218.00.0
286285103.00.08.01.08.02337.00.10.48.00.0
287286104.00.05.01.05.02342.00.10.255.00.0
288287105.00.018.01.018.02360.00.10.900000000000000218.00.0
289288106.00.029.01.029.02389.00.11.450000000000000629.00.0
290289107.00.034.01.034.02423.00.11.700000000000000834.00.0
291290108.00.029.01.029.02452.00.11.450000000000000629.00.0
292291109.00.026.01.026.02478.00.11.300000000000000526.00.0
293292110.00.06.01.06.02484.00.10.36.00.0
294293111.00.021.01.021.02505.00.11.050000000000000521.00.0
295294112.00.028.01.028.02533.00.11.400000000000000628.00.0
296295113.00.034.01.034.02567.00.11.700000000000000834.00.0
297296114.00.035.01.035.02602.00.11.750000000000000935.00.0
298297115.00.029.01.029.02631.00.11.450000000000000629.00.0
299298116.00.033.01.033.02664.00.11.650000000000000833.00.0
300299117.00.018.01.018.02682.00.10.900000000000000218.00.0
301300118.00.050.01.050.02732.00.12.49999999999999950.00.0
302301119.00.045.01.045.02777.00.12.2545.00.0
303302120.00.035.01.035.02812.00.11.750000000000000935.00.0
304303121.00.018.01.018.02830.00.10.900000000000000218.00.0
305304122.00.021.01.021.02851.00.11.050000000000000521.00.0
306305123.00.036.01.036.02887.00.11.80000000000000136.00.0
307306124.00.031.01.031.02918.00.11.550000000000000731.00.0
308307125.00.038.01.038.02956.00.11.900000000000000838.00.0
309308126.00.067.01.067.03023.00.13.349999999999995667.00.0
310309127.00.061.01.061.03084.00.13.04999999999999761.00.0
311310128.00.055.01.055.03139.00.12.749999999999998255.00.0
312311129.00.052.01.052.03191.00.12.599999999999998852.00.0
313312130.00.054.01.054.03245.00.12.699999999999998454.00.0
314313131.00.056.01.056.03301.00.12.79999999999999856.00.0
315314132.00.055.01.055.03356.00.12.749999999999998255.00.0
316315133.00.051.01.051.03407.00.12.54999999999999951.00.0
317316134.00.0113.01.0113.03520.00.15.649999999999987113.00.0
318317135.00.052.01.052.03572.00.12.599999999999998852.00.0
319318136.00.044.01.044.03616.00.12.244.00.0
320319137.00.0107.01.0107.03723.00.15.349999999999988107.00.0
321320138.00.056.01.056.03779.00.12.79999999999999856.00.0
322321139.00.0114.01.0114.03893.00.15.699999999999987114.00.0
323322140.00.063.01.063.03956.00.13.14999999999999763.00.0
324323141.00.047.01.047.04003.00.12.3547.00.0
325324142.00.048.01.048.04051.00.12.399999999999999548.00.0
326325143.00.059.01.059.04110.00.12.94999999999999759.00.0
327326144.00.0142.01.0142.04252.00.17.099999999999982142.00.0
328327145.00.083.01.083.04335.00.14.14999999999999383.00.0
329328146.00.057.01.057.04392.00.12.849999999999998357.00.0
330329147.00.055.01.055.04447.00.12.749999999999998255.00.0
331330148.00.047.01.047.04494.00.12.3547.00.0
332331149.00.057.01.057.04551.00.12.849999999999998357.00.0
333332150.00.061.01.061.04612.00.13.04999999999999761.00.0
334333151.00.080.01.080.04692.00.13.999999999999993380.00.0
335334152.00.059.01.059.04751.00.12.94999999999999759.00.0
336335153.00.058.01.058.04809.00.12.899999999999997758.00.0
337336154.00.087.01.087.04896.00.14.349999999999992587.00.0
338337155.00.086.01.086.04982.00.14.29999999999999486.00.0
339338156.00.057.01.057.05039.00.12.849999999999998357.00.0
340339157.00.067.01.067.05106.00.13.349999999999995667.00.0
341340158.00.057.01.057.05163.00.12.849999999999998357.00.0
342341159.00.0102.01.0102.05265.00.15.099999999999991102.00.0
343342160.00.059.01.059.05324.00.12.94999999999999759.00.0
344343161.00.068.01.068.05392.00.13.39999999999999668.00.0
345344162.00.055.01.055.05447.00.12.749999999999998255.00.0
346345163.00.065.01.065.05512.00.13.249999999999996465.00.0
347346164.00.068.01.068.05580.00.13.39999999999999668.00.0
348347165.00.047.01.047.05627.00.12.3547.00.0
349348166.00.042.01.042.05669.00.12.100000000000000542.00.0
350349167.00.056.01.056.05725.00.12.79999999999999856.00.0
351350168.00.067.01.067.05792.00.13.349999999999995667.00.0