End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
-    "epoch": 0.06,
-    "eval_loss": 171.4817352294922,
-    "eval_runtime": 11.6015,
     "eval_samples": 301,
-    "eval_samples_per_second": 25.945,
-    "eval_steps_per_second": 1.638,
-    "eval_wer": 1.2434017595307918,
-    "train_loss": 94.35431518554688,
-    "train_runtime": 13.6182,
     "train_samples": 704,
-    "train_samples_per_second": 2.937,
-    "train_steps_per_second": 0.734
 }

 {
+    "epoch": 0.03,
+    "eval_loss": 156.87892150878906,
+    "eval_runtime": 10.5213,
     "eval_samples": 301,
+    "eval_samples_per_second": 28.609,
+    "eval_steps_per_second": 3.612,
+    "eval_wer": 1.3456221198156681,
+    "train_loss": 94.46571044921875,
+    "train_runtime": 5.7606,
     "train_samples": 704,
+    "train_samples_per_second": 3.472,
+    "train_steps_per_second": 1.736
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 0.06,
-    "eval_loss": 171.4817352294922,
-    "eval_runtime": 11.6015,
     "eval_samples": 301,
-    "eval_samples_per_second": 25.945,
-    "eval_steps_per_second": 1.638,
-    "eval_wer": 1.2434017595307918
 }

 {
+    "epoch": 0.03,
+    "eval_loss": 156.87892150878906,
+    "eval_runtime": 10.5213,
     "eval_samples": 301,
+    "eval_samples_per_second": 28.609,
+    "eval_steps_per_second": 3.612,
+    "eval_wer": 1.3456221198156681
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:48ed59464475a77be01527039b31af1f6ddb03a8719e1c4de899bb0b36a2ff9d
 size 143910

 version https://git-lfs.github.com/spec/v1
+oid sha256:c05ccd9c78fff4448048e975808d4cbfffb9ed1ab3bc22e2e95576f44e950c5d
 size 143910

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 0.06,
-    "train_loss": 94.35431518554688,
-    "train_runtime": 13.6182,
     "train_samples": 704,
-    "train_samples_per_second": 2.937,
-    "train_steps_per_second": 0.734
 }

 {
+    "epoch": 0.03,
+    "train_loss": 94.46571044921875,
+    "train_runtime": 5.7606,
     "train_samples": 704,
+    "train_samples_per_second": 3.472,
+    "train_steps_per_second": 1.736
 }

trainer_state.json CHANGED Viewed

@@ -1,25 +1,25 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.056818181818181816,
   "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.06,
       "step": 10,
-      "total_flos": 988984857600.0,
-      "train_loss": 94.35431518554688,
-      "train_runtime": 13.6182,
-      "train_samples_per_second": 2.937,
-      "train_steps_per_second": 0.734
     }
   ],
   "max_steps": 10,
   "num_train_epochs": 1,
-  "total_flos": 988984857600.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.028409090909090908,
   "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.03,
       "step": 10,
+      "total_flos": 508182128640.0,
+      "train_loss": 94.46571044921875,
+      "train_runtime": 5.7606,
+      "train_samples_per_second": 3.472,
+      "train_steps_per_second": 1.736
     }
   ],
   "max_steps": 10,
   "num_train_epochs": 1,
+  "total_flos": 508182128640.0,
   "trial_name": null,
   "trial_params": null
 }