End of training

Browse files

Files changed (5) hide show

all_results.json +8 -8
eval_results.json +4 -4
runs/Dec16_14-39-42_129-146-104-29/events.out.tfevents.1671204006.129-146-104-29.129288.2 +3 -0
train_results.json +5 -5
trainer_state.json +322 -12

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 50.63,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
-    "eval_runtime": 46.1646,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.419,
-    "eval_steps_per_second": 1.321,
     "eval_wer": 0.5156036834924966,
-    "train_loss": 0.07298430502414703,
-    "train_runtime": 2125.6437,
     "train_samples": 2528,
-    "train_samples_per_second": 60.217,
-    "train_steps_per_second": 1.882
 }

 {
+    "epoch": 56.96,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
+    "eval_runtime": 45.5404,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.562,
+    "eval_steps_per_second": 1.339,
     "eval_wer": 0.5156036834924966,
+    "train_loss": 0.06285779211256239,
+    "train_runtime": 2146.9018,
     "train_samples": 2528,
+    "train_samples_per_second": 67.073,
+    "train_steps_per_second": 2.096
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 50.63,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
-    "eval_runtime": 46.1646,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.419,
-    "eval_steps_per_second": 1.321,
     "eval_wer": 0.5156036834924966
 }

 {
+    "epoch": 56.96,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
+    "eval_runtime": 45.5404,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.562,
+    "eval_steps_per_second": 1.339,
     "eval_wer": 0.5156036834924966
 }

runs/Dec16_14-39-42_129-146-104-29/events.out.tfevents.1671204006.129-146-104-29.129288.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80d4d15418295c572aa4591c39561da14f6b9f84af7cb628829d3e04efcf370f
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 50.63,
-    "train_loss": 0.07298430502414703,
-    "train_runtime": 2125.6437,
     "train_samples": 2528,
-    "train_samples_per_second": 60.217,
-    "train_steps_per_second": 1.882
 }

 {
+    "epoch": 56.96,
+    "train_loss": 0.06285779211256239,
+    "train_runtime": 2146.9018,
     "train_samples": 2528,
+    "train_samples_per_second": 67.073,
+    "train_steps_per_second": 2.096
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
-  "epoch": 50.63291139240506,
-  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2488,18 +2488,328 @@
       "step": 4000
     },
     {
-      "epoch": 50.63,
-      "step": 4000,
-      "total_flos": 4.6049855774374625e+19,
-      "train_loss": 0.07298430502414703,
-      "train_runtime": 2125.6437,
-      "train_samples_per_second": 60.217,
-      "train_steps_per_second": 1.882
     }
   ],
-  "max_steps": 4000,
-  "num_train_epochs": 51,
-  "total_flos": 4.6049855774374625e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
+  "epoch": 56.962025316455694,
+  "global_step": 4500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 4000
     },
     {
+      "epoch": 50.76,
+      "learning_rate": 1.4729999999999998e-05,
+      "loss": 0.543,
+      "step": 4010
+    },
+    {
+      "epoch": 50.89,
+      "learning_rate": 1.4429999999999997e-05,
+      "loss": 0.6044,
+      "step": 4020
+    },
+    {
+      "epoch": 51.01,
+      "learning_rate": 1.413e-05,
+      "loss": 0.5749,
+      "step": 4030
+    },
+    {
+      "epoch": 51.14,
+      "learning_rate": 1.383e-05,
+      "loss": 0.6171,
+      "step": 4040
+    },
+    {
+      "epoch": 51.27,
+      "learning_rate": 1.353e-05,
+      "loss": 0.5767,
+      "step": 4050
+    },
+    {
+      "epoch": 51.39,
+      "learning_rate": 1.3229999999999999e-05,
+      "loss": 0.5749,
+      "step": 4060
+    },
+    {
+      "epoch": 51.52,
+      "learning_rate": 1.2929999999999998e-05,
+      "loss": 0.565,
+      "step": 4070
+    },
+    {
+      "epoch": 51.65,
+      "learning_rate": 1.2629999999999998e-05,
+      "loss": 0.5907,
+      "step": 4080
+    },
+    {
+      "epoch": 51.77,
+      "learning_rate": 1.2329999999999999e-05,
+      "loss": 0.575,
+      "step": 4090
+    },
+    {
+      "epoch": 51.9,
+      "learning_rate": 1.2029999999999998e-05,
+      "loss": 0.5692,
+      "step": 4100
+    },
+    {
+      "epoch": 52.03,
+      "learning_rate": 1.173e-05,
+      "loss": 0.5219,
+      "step": 4110
+    },
+    {
+      "epoch": 52.15,
+      "learning_rate": 1.1429999999999999e-05,
+      "loss": 0.5535,
+      "step": 4120
+    },
+    {
+      "epoch": 52.28,
+      "learning_rate": 1.113e-05,
+      "loss": 0.5519,
+      "step": 4130
+    },
+    {
+      "epoch": 52.41,
+      "learning_rate": 1.083e-05,
+      "loss": 0.5826,
+      "step": 4140
+    },
+    {
+      "epoch": 52.53,
+      "learning_rate": 1.0529999999999999e-05,
+      "loss": 0.5472,
+      "step": 4150
+    },
+    {
+      "epoch": 52.66,
+      "learning_rate": 1.0229999999999999e-05,
+      "loss": 0.5603,
+      "step": 4160
+    },
+    {
+      "epoch": 52.78,
+      "learning_rate": 9.929999999999998e-06,
+      "loss": 0.589,
+      "step": 4170
+    },
+    {
+      "epoch": 52.91,
+      "learning_rate": 9.629999999999998e-06,
+      "loss": 0.6005,
+      "step": 4180
+    },
+    {
+      "epoch": 53.04,
+      "learning_rate": 9.329999999999999e-06,
+      "loss": 0.5844,
+      "step": 4190
+    },
+    {
+      "epoch": 53.16,
+      "learning_rate": 9.029999999999998e-06,
+      "loss": 0.5779,
+      "step": 4200
+    },
+    {
+      "epoch": 53.29,
+      "learning_rate": 8.73e-06,
+      "loss": 0.5611,
+      "step": 4210
+    },
+    {
+      "epoch": 53.42,
+      "learning_rate": 8.429999999999999e-06,
+      "loss": 0.5859,
+      "step": 4220
+    },
+    {
+      "epoch": 53.54,
+      "learning_rate": 8.129999999999998e-06,
+      "loss": 0.5906,
+      "step": 4230
+    },
+    {
+      "epoch": 53.67,
+      "learning_rate": 7.83e-06,
+      "loss": 0.5522,
+      "step": 4240
+    },
+    {
+      "epoch": 53.8,
+      "learning_rate": 7.56e-06,
+      "loss": 0.5762,
+      "step": 4250
+    },
+    {
+      "epoch": 53.92,
+      "learning_rate": 7.259999999999999e-06,
+      "loss": 0.5498,
+      "step": 4260
+    },
+    {
+      "epoch": 54.05,
+      "learning_rate": 6.959999999999999e-06,
+      "loss": 0.5752,
+      "step": 4270
+    },
+    {
+      "epoch": 54.18,
+      "learning_rate": 6.66e-06,
+      "loss": 0.5428,
+      "step": 4280
+    },
+    {
+      "epoch": 54.3,
+      "learning_rate": 6.359999999999999e-06,
+      "loss": 0.5515,
+      "step": 4290
+    },
+    {
+      "epoch": 54.43,
+      "learning_rate": 6.06e-06,
+      "loss": 0.5662,
+      "step": 4300
+    },
+    {
+      "epoch": 54.56,
+      "learning_rate": 5.759999999999999e-06,
+      "loss": 0.5916,
+      "step": 4310
+    },
+    {
+      "epoch": 54.68,
+      "learning_rate": 5.459999999999999e-06,
+      "loss": 0.537,
+      "step": 4320
+    },
+    {
+      "epoch": 54.81,
+      "learning_rate": 5.16e-06,
+      "loss": 0.5744,
+      "step": 4330
+    },
+    {
+      "epoch": 54.94,
+      "learning_rate": 4.859999999999999e-06,
+      "loss": 0.5606,
+      "step": 4340
+    },
+    {
+      "epoch": 55.06,
+      "learning_rate": 4.5599999999999995e-06,
+      "loss": 0.5855,
+      "step": 4350
+    },
+    {
+      "epoch": 55.19,
+      "learning_rate": 4.26e-06,
+      "loss": 0.5486,
+      "step": 4360
+    },
+    {
+      "epoch": 55.32,
+      "learning_rate": 3.959999999999999e-06,
+      "loss": 0.5644,
+      "step": 4370
+    },
+    {
+      "epoch": 55.44,
+      "learning_rate": 3.66e-06,
+      "loss": 0.5525,
+      "step": 4380
+    },
+    {
+      "epoch": 55.57,
+      "learning_rate": 3.3599999999999996e-06,
+      "loss": 0.6088,
+      "step": 4390
+    },
+    {
+      "epoch": 55.7,
+      "learning_rate": 3.06e-06,
+      "loss": 0.5344,
+      "step": 4400
+    },
+    {
+      "epoch": 55.82,
+      "learning_rate": 2.76e-06,
+      "loss": 0.5379,
+      "step": 4410
+    },
+    {
+      "epoch": 55.95,
+      "learning_rate": 2.46e-06,
+      "loss": 0.5204,
+      "step": 4420
+    },
+    {
+      "epoch": 56.08,
+      "learning_rate": 2.1599999999999996e-06,
+      "loss": 0.5754,
+      "step": 4430
+    },
+    {
+      "epoch": 56.2,
+      "learning_rate": 1.8599999999999998e-06,
+      "loss": 0.5507,
+      "step": 4440
+    },
+    {
+      "epoch": 56.33,
+      "learning_rate": 1.5599999999999999e-06,
+      "loss": 0.5592,
+      "step": 4450
+    },
+    {
+      "epoch": 56.46,
+      "learning_rate": 1.2599999999999998e-06,
+      "loss": 0.5396,
+      "step": 4460
+    },
+    {
+      "epoch": 56.58,
+      "learning_rate": 9.6e-07,
+      "loss": 0.579,
+      "step": 4470
+    },
+    {
+      "epoch": 56.71,
+      "learning_rate": 6.6e-07,
+      "loss": 0.545,
+      "step": 4480
+    },
+    {
+      "epoch": 56.84,
+      "learning_rate": 3.5999999999999994e-07,
+      "loss": 0.5919,
+      "step": 4490
+    },
+    {
+      "epoch": 56.96,
+      "learning_rate": 6e-08,
+      "loss": 0.5174,
+      "step": 4500
+    },
+    {
+      "epoch": 56.96,
+      "eval_cer": 0.19719182325005163,
+      "eval_loss": 0.9287102818489075,
+      "eval_runtime": 44.3461,
+      "eval_samples_per_second": 10.847,
+      "eval_steps_per_second": 1.376,
+      "eval_wer": 0.5139836289222374,
+      "step": 4500
+    },
+    {
+      "epoch": 56.96,
+      "step": 4500,
+      "total_flos": 5.1775250042658095e+19,
+      "train_loss": 0.06285779211256239,
+      "train_runtime": 2146.9018,
+      "train_samples_per_second": 67.073,
+      "train_steps_per_second": 2.096
     }
   ],
+  "max_steps": 4500,
+  "num_train_epochs": 57,
+  "total_flos": 5.1775250042658095e+19,
   "trial_name": null,
   "trial_params": null
 }