Training in progress, step 1000

Browse files

Files changed (7) hide show

model.safetensors +1 -1
run-3/checkpoint-1000/model.safetensors +1 -1
run-3/checkpoint-1000/optimizer.pt +1 -1
run-3/checkpoint-1000/scheduler.pt +1 -1
run-3/checkpoint-1000/trainer_state.json +26 -26
run-3/checkpoint-1000/training_args.bin +1 -1
runs/Oct12_05-09-37_f46fcd247c16/events.out.tfevents.1728711874.f46fcd247c16.522.4 +2 -2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db7b0ba484d365a8232c614da6b35c1ca8564e014b51324208c27b61981f817d
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:847b25893f634ae7ae19c7fa981b031b671da55fceaff107c9c6fd1535ba9bd9
 size 268290900

run-3/checkpoint-1000/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:10caa747cc9b055b61da3a870005eb9854639faf1659a2954a7623865e788ced
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:847b25893f634ae7ae19c7fa981b031b671da55fceaff107c9c6fd1535ba9bd9
 size 268290900

run-3/checkpoint-1000/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9ccfb4b4789f10457afb99b1aabd35c5ff0b1a3606c647f48c026ef9e8352d6
 size 536643898

 version https://git-lfs.github.com/spec/v1
+oid sha256:bbdf97ee43485482022c7936b134134b1d804f6bddceb5646e66726f0d638653
 size 536643898

run-3/checkpoint-1000/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c794bc4c67ef18245dd516031ce405ab557e4d551d225d8dd1e1abc0f2be8e33
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f182501c34e4ea3ebc7617d27edab7e1367582b147e518cd90295ec7f2eaa0f
 size 1064

run-3/checkpoint-1000/trainer_state.json CHANGED Viewed

@@ -10,50 +10,50 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5803225806451613,
-      "eval_loss": 0.19005867838859558,
-      "eval_runtime": 5.674,
-      "eval_samples_per_second": 546.354,
-      "eval_steps_per_second": 11.456,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
-      "grad_norm": 0.5149380564689636,
-      "learning_rate": 1.685534591194969e-05,
-      "loss": 0.3072,
       "step": 500
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.817741935483871,
-      "eval_loss": 0.0924694836139679,
-      "eval_runtime": 6.0294,
-      "eval_samples_per_second": 514.15,
-      "eval_steps_per_second": 10.781,
       "step": 636
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.8770967741935484,
-      "eval_loss": 0.06209348514676094,
-      "eval_runtime": 5.7978,
-      "eval_samples_per_second": 534.685,
-      "eval_steps_per_second": 11.211,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
-      "grad_norm": 0.4281909167766571,
-      "learning_rate": 1.371069182389937e-05,
-      "loss": 0.1072,
       "step": 1000
     }
   ],
   "logging_steps": 500,
-  "max_steps": 3180,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -71,8 +71,8 @@
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.7637668053146042,
-    "num_train_epochs": 10,
-    "temperature": 18
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6083870967741936,
+      "eval_loss": 0.26111724972724915,
+      "eval_runtime": 5.392,
+      "eval_samples_per_second": 574.924,
+      "eval_steps_per_second": 12.055,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
+      "grad_norm": 0.612690269947052,
+      "learning_rate": 1.371069182389937e-05,
+      "loss": 0.4067,
       "step": 500
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.8261290322580646,
+      "eval_loss": 0.1251312643289566,
+      "eval_runtime": 5.4108,
+      "eval_samples_per_second": 572.929,
+      "eval_steps_per_second": 12.013,
       "step": 636
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.8719354838709678,
+      "eval_loss": 0.08443494886159897,
+      "eval_runtime": 5.5128,
+      "eval_samples_per_second": 562.324,
+      "eval_steps_per_second": 11.791,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
+      "grad_norm": 0.5761224031448364,
+      "learning_rate": 7.421383647798742e-06,
+      "loss": 0.1453,
       "step": 1000
     }
   ],
   "logging_steps": 500,
+  "max_steps": 1590,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.4777308452793029,
+    "num_train_epochs": 5,
+    "temperature": 4
   }
 }

run-3/checkpoint-1000/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33ceb3fabcbf71cb66944e6d8ec61e55f12751f2e6805da39ec868f61cfabfda
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ef5b259539127ef5ddc697d31b7e7180caca610f845f70ff2cba869a6149cf5
 size 5240

runs/Oct12_05-09-37_f46fcd247c16/events.out.tfevents.1728711874.f46fcd247c16.522.4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ff40c380c71915c17772c8a71048733e75150efcceefff845f22247d3166e13
-size 13621

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d802ac01f6c2352b30e80ad15674bc6de269c70f80ea0a9a406db7e8587b62b
+size 14366