End of training

Browse files

Files changed (5) hide show

all_results.json +11 -11
eval_results.json +7 -7
runs/Dec16_21-09-39_129-146-104-29/events.out.tfevents.1671227491.129-146-104-29.146624.2 +3 -0
train_results.json +5 -5
trainer_state.json +322 -12

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 69.62,
-    "eval_cer": 0.1969102547256584,
-    "eval_loss": 0.9162458181381226,
-    "eval_runtime": 45.2212,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.637,
-    "eval_steps_per_second": 1.349,
-    "eval_wer": 0.5156036834924966,
-    "train_loss": 0.04894279766082764,
-    "train_runtime": 2118.6173,
     "train_samples": 2528,
-    "train_samples_per_second": 83.073,
-    "train_steps_per_second": 2.596
 }

 {
+    "epoch": 75.95,
+    "eval_cer": 0.1972293657199707,
+    "eval_loss": 0.9162325859069824,
+    "eval_runtime": 45.3436,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.608,
+    "eval_steps_per_second": 0.684,
+    "eval_wer": 0.5159447476125512,
+    "train_loss": 0.044292491674423215,
+    "train_runtime": 2233.4842,
     "train_samples": 2528,
+    "train_samples_per_second": 85.964,
+    "train_steps_per_second": 2.686
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 69.62,
-    "eval_cer": 0.1969102547256584,
-    "eval_loss": 0.9162458181381226,
-    "eval_runtime": 45.2212,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.637,
-    "eval_steps_per_second": 1.349,
-    "eval_wer": 0.5156036834924966
 }

 {
+    "epoch": 75.95,
+    "eval_cer": 0.1972293657199707,
+    "eval_loss": 0.9162325859069824,
+    "eval_runtime": 45.3436,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.608,
+    "eval_steps_per_second": 0.684,
+    "eval_wer": 0.5159447476125512
 }

runs/Dec16_21-09-39_129-146-104-29/events.out.tfevents.1671227491.129-146-104-29.146624.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:40319fc688859220e783165235dc6652e723535f892fdb147887467e472c1a18
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 69.62,
-    "train_loss": 0.04894279766082764,
-    "train_runtime": 2118.6173,
     "train_samples": 2528,
-    "train_samples_per_second": 83.073,
-    "train_steps_per_second": 2.596
 }

 {
+    "epoch": 75.95,
+    "train_loss": 0.044292491674423215,
+    "train_runtime": 2233.4842,
     "train_samples": 2528,
+    "train_samples_per_second": 85.964,
+    "train_steps_per_second": 2.686
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
-  "epoch": 69.62025316455696,
-  "global_step": 5500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3418,18 +3418,328 @@
       "step": 5500
     },
     {
-      "epoch": 69.62,
-      "step": 5500,
-      "total_flos": 6.33124990225071e+19,
-      "train_loss": 0.04894279766082764,
-      "train_runtime": 2118.6173,
-      "train_samples_per_second": 83.073,
-      "train_steps_per_second": 2.596
     }
   ],
-  "max_steps": 5500,
-  "num_train_epochs": 70,
-  "total_flos": 6.33124990225071e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
+  "epoch": 75.9493670886076,
+  "global_step": 6000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 5500
     },
     {
+      "epoch": 69.75,
+      "learning_rate": 7.38e-06,
+      "loss": 0.525,
+      "step": 5510
+    },
+    {
+      "epoch": 69.87,
+      "learning_rate": 7.229999999999999e-06,
+      "loss": 0.5232,
+      "step": 5520
+    },
+    {
+      "epoch": 70.0,
+      "learning_rate": 7.079999999999999e-06,
+      "loss": 0.5318,
+      "step": 5530
+    },
+    {
+      "epoch": 70.13,
+      "learning_rate": 6.929999999999999e-06,
+      "loss": 0.562,
+      "step": 5540
+    },
+    {
+      "epoch": 70.25,
+      "learning_rate": 6.779999999999999e-06,
+      "loss": 0.494,
+      "step": 5550
+    },
+    {
+      "epoch": 70.38,
+      "learning_rate": 6.63e-06,
+      "loss": 0.5314,
+      "step": 5560
+    },
+    {
+      "epoch": 70.51,
+      "learning_rate": 6.48e-06,
+      "loss": 0.5332,
+      "step": 5570
+    },
+    {
+      "epoch": 70.63,
+      "learning_rate": 6.3299999999999995e-06,
+      "loss": 0.552,
+      "step": 5580
+    },
+    {
+      "epoch": 70.76,
+      "learning_rate": 6.179999999999999e-06,
+      "loss": 0.5538,
+      "step": 5590
+    },
+    {
+      "epoch": 70.89,
+      "learning_rate": 6.029999999999999e-06,
+      "loss": 0.5507,
+      "step": 5600
+    },
+    {
+      "epoch": 71.01,
+      "learning_rate": 5.88e-06,
+      "loss": 0.5207,
+      "step": 5610
+    },
+    {
+      "epoch": 71.14,
+      "learning_rate": 5.729999999999999e-06,
+      "loss": 0.5613,
+      "step": 5620
+    },
+    {
+      "epoch": 71.27,
+      "learning_rate": 5.579999999999999e-06,
+      "loss": 0.5263,
+      "step": 5630
+    },
+    {
+      "epoch": 71.39,
+      "learning_rate": 5.43e-06,
+      "loss": 0.5138,
+      "step": 5640
+    },
+    {
+      "epoch": 71.52,
+      "learning_rate": 5.28e-06,
+      "loss": 0.5268,
+      "step": 5650
+    },
+    {
+      "epoch": 71.65,
+      "learning_rate": 5.13e-06,
+      "loss": 0.5285,
+      "step": 5660
+    },
+    {
+      "epoch": 71.77,
+      "learning_rate": 4.98e-06,
+      "loss": 0.539,
+      "step": 5670
+    },
+    {
+      "epoch": 71.9,
+      "learning_rate": 4.8299999999999995e-06,
+      "loss": 0.5518,
+      "step": 5680
+    },
+    {
+      "epoch": 72.03,
+      "learning_rate": 4.679999999999999e-06,
+      "loss": 0.5392,
+      "step": 5690
+    },
+    {
+      "epoch": 72.15,
+      "learning_rate": 4.53e-06,
+      "loss": 0.5341,
+      "step": 5700
+    },
+    {
+      "epoch": 72.28,
+      "learning_rate": 4.3799999999999996e-06,
+      "loss": 0.528,
+      "step": 5710
+    },
+    {
+      "epoch": 72.41,
+      "learning_rate": 4.229999999999999e-06,
+      "loss": 0.5285,
+      "step": 5720
+    },
+    {
+      "epoch": 72.53,
+      "learning_rate": 4.079999999999999e-06,
+      "loss": 0.5291,
+      "step": 5730
+    },
+    {
+      "epoch": 72.66,
+      "learning_rate": 3.93e-06,
+      "loss": 0.56,
+      "step": 5740
+    },
+    {
+      "epoch": 72.78,
+      "learning_rate": 3.78e-06,
+      "loss": 0.5638,
+      "step": 5750
+    },
+    {
+      "epoch": 72.91,
+      "learning_rate": 3.6299999999999995e-06,
+      "loss": 0.5111,
+      "step": 5760
+    },
+    {
+      "epoch": 73.04,
+      "learning_rate": 3.4799999999999993e-06,
+      "loss": 0.5239,
+      "step": 5770
+    },
+    {
+      "epoch": 73.16,
+      "learning_rate": 3.33e-06,
+      "loss": 0.5386,
+      "step": 5780
+    },
+    {
+      "epoch": 73.29,
+      "learning_rate": 3.1799999999999996e-06,
+      "loss": 0.525,
+      "step": 5790
+    },
+    {
+      "epoch": 73.42,
+      "learning_rate": 3.03e-06,
+      "loss": 0.5051,
+      "step": 5800
+    },
+    {
+      "epoch": 73.54,
+      "learning_rate": 2.8799999999999995e-06,
+      "loss": 0.5119,
+      "step": 5810
+    },
+    {
+      "epoch": 73.67,
+      "learning_rate": 2.7299999999999997e-06,
+      "loss": 0.5209,
+      "step": 5820
+    },
+    {
+      "epoch": 73.8,
+      "learning_rate": 2.58e-06,
+      "loss": 0.5659,
+      "step": 5830
+    },
+    {
+      "epoch": 73.92,
+      "learning_rate": 2.4299999999999996e-06,
+      "loss": 0.5178,
+      "step": 5840
+    },
+    {
+      "epoch": 74.05,
+      "learning_rate": 2.2799999999999998e-06,
+      "loss": 0.5523,
+      "step": 5850
+    },
+    {
+      "epoch": 74.18,
+      "learning_rate": 2.13e-06,
+      "loss": 0.5048,
+      "step": 5860
+    },
+    {
+      "epoch": 74.3,
+      "learning_rate": 1.9799999999999997e-06,
+      "loss": 0.5109,
+      "step": 5870
+    },
+    {
+      "epoch": 74.43,
+      "learning_rate": 1.83e-06,
+      "loss": 0.5092,
+      "step": 5880
+    },
+    {
+      "epoch": 74.56,
+      "learning_rate": 1.6799999999999998e-06,
+      "loss": 0.5439,
+      "step": 5890
+    },
+    {
+      "epoch": 74.68,
+      "learning_rate": 1.53e-06,
+      "loss": 0.5501,
+      "step": 5900
+    },
+    {
+      "epoch": 74.81,
+      "learning_rate": 1.38e-06,
+      "loss": 0.5628,
+      "step": 5910
+    },
+    {
+      "epoch": 74.94,
+      "learning_rate": 1.23e-06,
+      "loss": 0.5097,
+      "step": 5920
+    },
+    {
+      "epoch": 75.06,
+      "learning_rate": 1.0799999999999998e-06,
+      "loss": 0.5363,
+      "step": 5930
+    },
+    {
+      "epoch": 75.19,
+      "learning_rate": 9.299999999999999e-07,
+      "loss": 0.5304,
+      "step": 5940
+    },
+    {
+      "epoch": 75.32,
+      "learning_rate": 7.799999999999999e-07,
+      "loss": 0.5358,
+      "step": 5950
+    },
+    {
+      "epoch": 75.44,
+      "learning_rate": 6.299999999999999e-07,
+      "loss": 0.5262,
+      "step": 5960
+    },
+    {
+      "epoch": 75.57,
+      "learning_rate": 4.8e-07,
+      "loss": 0.5258,
+      "step": 5970
+    },
+    {
+      "epoch": 75.7,
+      "learning_rate": 3.3e-07,
+      "loss": 0.4952,
+      "step": 5980
+    },
+    {
+      "epoch": 75.82,
+      "learning_rate": 1.7999999999999997e-07,
+      "loss": 0.5285,
+      "step": 5990
+    },
+    {
+      "epoch": 75.95,
+      "learning_rate": 3e-08,
+      "loss": 0.5252,
+      "step": 6000
+    },
+    {
+      "epoch": 75.95,
+      "eval_cer": 0.19692902596061795,
+      "eval_loss": 0.9505288004875183,
+      "eval_runtime": 45.9888,
+      "eval_samples_per_second": 10.459,
+      "eval_steps_per_second": 0.674,
+      "eval_wer": 0.5117667121418826,
+      "step": 6000
+    },
+    {
+      "epoch": 75.95,
+      "step": 6000,
+      "total_flos": 6.910110276723645e+19,
+      "train_loss": 0.044292491674423215,
+      "train_runtime": 2233.4842,
+      "train_samples_per_second": 85.964,
+      "train_steps_per_second": 2.686
     }
   ],
+  "max_steps": 6000,
+  "num_train_epochs": 76,
+  "total_flos": 6.910110276723645e+19,
   "trial_name": null,
   "trial_params": null
 }