Training in progress, step 10

Browse files

Files changed (5) hide show

all_results.json +8 -0
model.safetensors +1 -1
runs/Nov11_11-43-44_9dbf826d7e63/events.out.tfevents.1731325518.9dbf826d7e63.838.1 +3 -0
train_results.json +8 -0
trainer_state.json +170 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 56.666666666666664,
+    "total_flos": 2.576884875160781e+16,
+    "train_loss": 1.7478609253378476,
+    "train_runtime": 55.2269,
+    "train_samples_per_second": 69.26,
+    "train_steps_per_second": 1.539
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c203ee2730ab7937e241d9925bae5007c355c23cb1bc6df5de7896ebdf3bcf99
 size 44774596

 version https://git-lfs.github.com/spec/v1
+oid sha256:62bc9d2b590eed0af938e95e47d7f0771263d223db42ab3626d3b7ad39dd518d
 size 44774596

runs/Nov11_11-43-44_9dbf826d7e63/events.out.tfevents.1731325518.9dbf826d7e63.838.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9974cd827402dc2576099d7ab6726452cf8c1b49c154929d817cb3a643718db
+size 5798

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 56.666666666666664,
+    "total_flos": 2.576884875160781e+16,
+    "train_loss": 1.7478609253378476,
+    "train_runtime": 55.2269,
+    "train_samples_per_second": 69.26,
+    "train_steps_per_second": 1.539
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,170 @@

+{
+  "best_metric": 1.9495443105697632,
+  "best_model_checkpoint": "resnet-18-dungeons-001/checkpoint-80",
+  "epoch": 56.666666666666664,
+  "eval_steps": 10,
+  "global_step": 85,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 6.666666666666667,
+      "grad_norm": 11.739578247070312,
+      "learning_rate": 1.0000000000000002e-06,
+      "loss": 2.3193,
+      "step": 10
+    },
+    {
+      "epoch": 6.666666666666667,
+      "eval_accuracy": 0.16666666666666666,
+      "eval_loss": 2.3046061992645264,
+      "eval_runtime": 0.1857,
+      "eval_samples_per_second": 64.614,
+      "eval_steps_per_second": 10.769,
+      "step": 10
+    },
+    {
+      "epoch": 13.333333333333334,
+      "grad_norm": 12.655901908874512,
+      "learning_rate": 2.0000000000000003e-06,
+      "loss": 2.2945,
+      "step": 20
+    },
+    {
+      "epoch": 13.333333333333334,
+      "eval_accuracy": 0.16666666666666666,
+      "eval_loss": 2.28173828125,
+      "eval_runtime": 0.1043,
+      "eval_samples_per_second": 115.034,
+      "eval_steps_per_second": 19.172,
+      "step": 20
+    },
+    {
+      "epoch": 20.0,
+      "grad_norm": 10.712946891784668,
+      "learning_rate": 3e-06,
+      "loss": 2.1285,
+      "step": 30
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.16666666666666666,
+      "eval_loss": 2.242919921875,
+      "eval_runtime": 0.1024,
+      "eval_samples_per_second": 117.157,
+      "eval_steps_per_second": 19.526,
+      "step": 30
+    },
+    {
+      "epoch": 26.666666666666668,
+      "grad_norm": 10.430768966674805,
+      "learning_rate": 4.000000000000001e-06,
+      "loss": 1.9822,
+      "step": 40
+    },
+    {
+      "epoch": 26.666666666666668,
+      "eval_accuracy": 0.16666666666666666,
+      "eval_loss": 2.1981608867645264,
+      "eval_runtime": 0.1069,
+      "eval_samples_per_second": 112.291,
+      "eval_steps_per_second": 18.715,
+      "step": 40
+    },
+    {
+      "epoch": 33.333333333333336,
+      "grad_norm": 13.252127647399902,
+      "learning_rate": 5e-06,
+      "loss": 1.8001,
+      "step": 50
+    },
+    {
+      "epoch": 33.333333333333336,
+      "eval_accuracy": 0.16666666666666666,
+      "eval_loss": 2.156494140625,
+      "eval_runtime": 0.165,
+      "eval_samples_per_second": 72.742,
+      "eval_steps_per_second": 12.124,
+      "step": 50
+    },
+    {
+      "epoch": 40.0,
+      "grad_norm": 10.211044311523438,
+      "learning_rate": 6e-06,
+      "loss": 1.5728,
+      "step": 60
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy": 0.25,
+      "eval_loss": 2.1058757305145264,
+      "eval_runtime": 0.1024,
+      "eval_samples_per_second": 117.237,
+      "eval_steps_per_second": 19.539,
+      "step": 60
+    },
+    {
+      "epoch": 46.666666666666664,
+      "grad_norm": 8.858285903930664,
+      "learning_rate": 7e-06,
+      "loss": 1.2919,
+      "step": 70
+    },
+    {
+      "epoch": 46.666666666666664,
+      "eval_accuracy": 0.25,
+      "eval_loss": 2.0252277851104736,
+      "eval_runtime": 0.1047,
+      "eval_samples_per_second": 114.573,
+      "eval_steps_per_second": 19.096,
+      "step": 70
+    },
+    {
+      "epoch": 53.333333333333336,
+      "grad_norm": 8.067765235900879,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 1.0619,
+      "step": 80
+    },
+    {
+      "epoch": 53.333333333333336,
+      "eval_accuracy": 0.3333333333333333,
+      "eval_loss": 1.9495443105697632,
+      "eval_runtime": 0.1294,
+      "eval_samples_per_second": 92.703,
+      "eval_steps_per_second": 15.451,
+      "step": 80
+    },
+    {
+      "epoch": 56.666666666666664,
+      "step": 85,
+      "total_flos": 2.576884875160781e+16,
+      "train_loss": 1.7478609253378476,
+      "train_runtime": 55.2269,
+      "train_samples_per_second": 69.26,
+      "train_steps_per_second": 1.539
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 85,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 85,
+  "save_steps": 10,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.576884875160781e+16,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}