Training in progress, step 1000

Browse files

Files changed (7) hide show

model.safetensors +1 -1
run-0/checkpoint-1000/model.safetensors +1 -1
run-0/checkpoint-1000/optimizer.pt +1 -1
run-0/checkpoint-1000/scheduler.pt +1 -1
run-0/checkpoint-1000/trainer_state.json +27 -27
run-0/checkpoint-1000/training_args.bin +1 -1
runs/Oct11_17-03-17_c179252869f4/events.out.tfevents.1728666603.c179252869f4.732.1 +2 -2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33620587b37c196969d3f412f74ef041dcfeee8258db5933dc3c4540e70b1e43
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:2265efdbd127f32817bf80110d8d6f541a55048b2e22b7e0e6227a688a9ef047
 size 268290900

run-0/checkpoint-1000/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:847b25893f634ae7ae19c7fa981b031b671da55fceaff107c9c6fd1535ba9bd9
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:2265efdbd127f32817bf80110d8d6f541a55048b2e22b7e0e6227a688a9ef047
 size 268290900

run-0/checkpoint-1000/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bbdf97ee43485482022c7936b134134b1d804f6bddceb5646e66726f0d638653
 size 536643898

 version https://git-lfs.github.com/spec/v1
+oid sha256:c4557295dc599e62a6393fbd116ab5c4958396bbe86258e055f7094ff579a4f6
 size 536643898

run-0/checkpoint-1000/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f182501c34e4ea3ebc7617d27edab7e1367582b147e518cd90295ec7f2eaa0f
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:72a4307cca951ef6d42c7f184774e8b1259c78b2bf130b8443ec0b62f6dbf689
 size 1064

run-0/checkpoint-1000/trainer_state.json CHANGED Viewed

@@ -10,50 +10,50 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6083870967741936,
-      "eval_loss": 0.26111724972724915,
-      "eval_runtime": 5.07,
-      "eval_samples_per_second": 611.445,
-      "eval_steps_per_second": 12.821,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
-      "grad_norm": 0.612690269947052,
-      "learning_rate": 1.371069182389937e-05,
-      "loss": 0.4067,
       "step": 500
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.8261290322580646,
-      "eval_loss": 0.1251312643289566,
-      "eval_runtime": 5.2675,
-      "eval_samples_per_second": 588.512,
-      "eval_steps_per_second": 12.34,
       "step": 636
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.8719354838709678,
-      "eval_loss": 0.08443494886159897,
-      "eval_runtime": 5.1546,
-      "eval_samples_per_second": 601.399,
-      "eval_steps_per_second": 12.61,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
-      "grad_norm": 0.5761224031448364,
-      "learning_rate": 7.421383647798742e-06,
-      "loss": 0.1453,
       "step": 1000
     }
   ],
   "logging_steps": 500,
-  "max_steps": 1590,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -67,12 +67,12 @@
       "attributes": {}
     }
   },
-  "total_flos": 260941334653608.0,
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.006505868879858823,
-    "num_train_epochs": 5,
-    "temperature": 4
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5887096774193549,
+      "eval_loss": 0.19886387884616852,
+      "eval_runtime": 5.1732,
+      "eval_samples_per_second": 599.241,
+      "eval_steps_per_second": 12.565,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
+      "grad_norm": 0.5294517874717712,
+      "learning_rate": 1.650593990216632e-05,
+      "loss": 0.3203,
       "step": 500
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.8193548387096774,
+      "eval_loss": 0.09618715196847916,
+      "eval_runtime": 5.2244,
+      "eval_samples_per_second": 593.365,
+      "eval_steps_per_second": 12.442,
       "step": 636
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.8783870967741936,
+      "eval_loss": 0.06421981006860733,
+      "eval_runtime": 5.1205,
+      "eval_samples_per_second": 605.405,
+      "eval_steps_per_second": 12.694,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
+      "grad_norm": 0.44660821557044983,
+      "learning_rate": 1.3011879804332637e-05,
+      "loss": 0.1116,
       "step": 1000
     }
   ],
   "logging_steps": 500,
+  "max_steps": 2862,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 9,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 370580110546716.0,
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.260556849082234,
+    "num_train_epochs": 9,
+    "temperature": 11
   }
 }

run-0/checkpoint-1000/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffe43401e68c8a3628adf33b38f6ac638a3a3f3bc1dcbe05d52f58aece31629f
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a815016dfca6056394449b7eec53142e869a6e9ff738e6f9557bb4382010c025
 size 5240

runs/Oct11_17-03-17_c179252869f4/events.out.tfevents.1728666603.c179252869f4.732.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7029f09599f213efddf9c26859a245fd81796dbbf556a04ffae4cf4a5d4ca09b
-size 25652

 version https://git-lfs.github.com/spec/v1
+oid sha256:1e4607fd143d4548a3c3e4f485b963b6458f636733bf845fc8a3470c8ce7d81a
+size 26509