Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: BreakoutNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 2.00 +/- 0.00
       name: mean_reward
       verified: false
 ---
@@ -72,7 +72,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 100000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: BreakoutNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 110.70 +/- 67.19
       name: mean_reward
       verified: false
 ---
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 17702433
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 2684586546
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 100000.0
   - - optimize_memory_usage
     - false
   - - policy

   - - learning_starts
     - 100000
   - - n_timesteps
+    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-BreakoutNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a44048879dd24833bf206e18eeb1af9167e2746470c040e93782f327e4e5cf7
-size 13706816

 version https://git-lfs.github.com/spec/v1
+oid sha256:13a4f1cf7859facf7c2ede5b306de317d1206a2634d425cc871bee45b19b7379
+size 27203748

dqn-BreakoutNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-BreakoutNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3fc84919e676e2bdcaa04814c7dfa2b7625d8d53a818418c6db25771364db93
-size 1120

 version https://git-lfs.github.com/spec/v1
+oid sha256:b261e00a4a8d4a55e0e18103c8a192f8e08559e9f41cb88248b8fefad4cb8632
+size 13498044

dqn-BreakoutNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:82f6d1110ed4e24eeeb04e16f36ea61db415c64a0235c359525a7d7d4dce5592
 size 13497178

 version https://git-lfs.github.com/spec/v1
+oid sha256:c720de912a19a70dcef1598c672c785e1efa4a10b99b1429fd6d3fbdc99dd3e2
 size 13497178

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1dd1f72ac713964fdd75c7b097fe8e5be066dd20a65dbfa925d4036fa4cc1121
-size 55866

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4481187ab9168cf2a89acab711c9b5c6fda5f351176cf1b7a4e23f7d689b134
+size 73210

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": 2.0, "std_reward": 0.0, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-01-~~07T04~~:24:00.~~513106~~"}


1	+ {"mean_reward": 110.7, "std_reward": 67.18638254884691, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-01-07T05:52:18.496806"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8630cff8ef80708566a655b651eb9bfefdf52b45971e678b7c8d23d5fafc052
-size 13154

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ec6c59330cb6b711e7dc7d9dfc1b94728c22d2ed695d9e7d010cd05586cc504
+size 46904