End of training

Browse files

Files changed (5) hide show

all_results.json +9 -9
eval_results.json +5 -5
runs/Nov25_04-10-45_4b2aca464fe8/events.out.tfevents.1669353344.4b2aca464fe8.6258.2 +3 -0
train_results.json +4 -4
trainer_state.json +686 -686

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
     "epoch": 100.0,
-    "eval_loss": 0.3162029981613159,
-    "eval_runtime": 2.8665,
     "eval_samples": 17,
-    "eval_samples_per_second": 5.931,
-    "eval_steps_per_second": 1.744,
-    "eval_wer": 0.3011111111111111,
-    "train_loss": 0.7617763585514492,
-    "train_runtime": 3519.9031,
     "train_samples": 141,
-    "train_samples_per_second": 4.006,
-    "train_steps_per_second": 0.256
 }

 {
     "epoch": 100.0,
+    "eval_loss": 0.2793618440628052,
+    "eval_runtime": 2.668,
     "eval_samples": 17,
+    "eval_samples_per_second": 6.372,
+    "eval_steps_per_second": 1.874,
+    "eval_wer": 0.2733333333333333,
+    "train_loss": 0.2346874083413018,
+    "train_runtime": 3461.7851,
     "train_samples": 141,
+    "train_samples_per_second": 4.073,
+    "train_steps_per_second": 0.26
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 100.0,
-    "eval_loss": 0.3162029981613159,
-    "eval_runtime": 2.8665,
     "eval_samples": 17,
-    "eval_samples_per_second": 5.931,
-    "eval_steps_per_second": 1.744,
-    "eval_wer": 0.3011111111111111
 }

 {
     "epoch": 100.0,
+    "eval_loss": 0.2793618440628052,
+    "eval_runtime": 2.668,
     "eval_samples": 17,
+    "eval_samples_per_second": 6.372,
+    "eval_steps_per_second": 1.874,
+    "eval_wer": 0.2733333333333333
 }

runs/Nov25_04-10-45_4b2aca464fe8/events.out.tfevents.1669353344.4b2aca464fe8.6258.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8882a2b4f9abe93131a9c72fe3b6a3505587a2a7a1862b4e3e9a0f1e469412b2
+size 358

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 100.0,
-    "train_loss": 0.7617763585514492,
-    "train_runtime": 3519.9031,
     "train_samples": 141,
-    "train_samples_per_second": 4.006,
-    "train_steps_per_second": 0.256
 }

 {
     "epoch": 100.0,
+    "train_loss": 0.2346874083413018,
+    "train_runtime": 3461.7851,
     "train_samples": 141,
+    "train_samples_per_second": 4.073,
+    "train_steps_per_second": 0.26
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.3162029981613159,
-  "best_model_checkpoint": "ai-light-dance_drums_ft_pretrain_wav2vec2-base-new_onset-idmt-2/checkpoint-459",
   "epoch": 100.0,
   "global_step": 900,
   "is_hyper_param_search": false,
@@ -9,1452 +9,1452 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 97.93186950683594,
-      "eval_runtime": 2.7466,
-      "eval_samples_per_second": 6.19,
-      "eval_steps_per_second": 1.82,
-      "eval_wer": 1.0,
       "step": 9
     },
     {
       "epoch": 1.11,
-      "learning_rate": 2.9999999999999997e-05,
-      "loss": 17.1836,
       "step": 10
     },
     {
       "epoch": 2.0,
-      "eval_loss": 45.722869873046875,
-      "eval_runtime": 2.9189,
-      "eval_samples_per_second": 5.824,
-      "eval_steps_per_second": 1.713,
-      "eval_wer": 1.0,
       "step": 18
     },
     {
       "epoch": 2.22,
-      "learning_rate": 0.00013,
-      "loss": 13.2869,
       "step": 20
     },
     {
       "epoch": 3.0,
-      "eval_loss": 2.757852554321289,
-      "eval_runtime": 2.8561,
-      "eval_samples_per_second": 5.952,
-      "eval_steps_per_second": 1.751,
-      "eval_wer": 1.0,
       "step": 27
     },
     {
       "epoch": 3.33,
-      "learning_rate": 0.00023,
-      "loss": 2.6495,
       "step": 30
     },
     {
       "epoch": 4.0,
-      "eval_loss": 2.7427165508270264,
-      "eval_runtime": 2.8408,
-      "eval_samples_per_second": 5.984,
-      "eval_steps_per_second": 1.76,
-      "eval_wer": 1.0,
       "step": 36
     },
     {
       "epoch": 4.44,
-      "learning_rate": 0.0002989655172413793,
-      "loss": 1.7135,
       "step": 40
     },
     {
       "epoch": 5.0,
-      "eval_loss": 2.5476696491241455,
-      "eval_runtime": 2.8174,
-      "eval_samples_per_second": 6.034,
-      "eval_steps_per_second": 1.775,
-      "eval_wer": 1.0,
       "step": 45
     },
     {
       "epoch": 5.56,
-      "learning_rate": 0.00029551724137931033,
-      "loss": 1.4609,
       "step": 50
     },
     {
       "epoch": 6.0,
-      "eval_loss": 1.7126435041427612,
-      "eval_runtime": 2.9262,
-      "eval_samples_per_second": 5.81,
-      "eval_steps_per_second": 1.709,
-      "eval_wer": 1.0,
       "step": 54
     },
     {
       "epoch": 6.67,
-      "learning_rate": 0.00029206896551724134,
-      "loss": 1.374,
       "step": 60
     },
     {
       "epoch": 7.0,
-      "eval_loss": 1.3668222427368164,
-      "eval_runtime": 2.8538,
-      "eval_samples_per_second": 5.957,
-      "eval_steps_per_second": 1.752,
-      "eval_wer": 0.9966666666666667,
       "step": 63
     },
     {
       "epoch": 7.78,
-      "learning_rate": 0.0002886206896551724,
-      "loss": 1.2951,
       "step": 70
     },
     {
       "epoch": 8.0,
-      "eval_loss": 1.127436637878418,
-      "eval_runtime": 2.8558,
-      "eval_samples_per_second": 5.953,
-      "eval_steps_per_second": 1.751,
-      "eval_wer": 0.9866666666666667,
       "step": 72
     },
     {
       "epoch": 8.89,
-      "learning_rate": 0.00028517241379310345,
-      "loss": 1.0493,
       "step": 80
     },
     {
       "epoch": 9.0,
-      "eval_loss": 0.7346072196960449,
-      "eval_runtime": 3.0416,
-      "eval_samples_per_second": 5.589,
-      "eval_steps_per_second": 1.644,
-      "eval_wer": 0.5177777777777778,
       "step": 81
     },
     {
       "epoch": 10.0,
-      "learning_rate": 0.00028172413793103445,
-      "loss": 0.8835,
       "step": 90
     },
     {
       "epoch": 10.0,
-      "eval_loss": 0.7663962841033936,
-      "eval_runtime": 2.8583,
-      "eval_samples_per_second": 5.947,
-      "eval_steps_per_second": 1.749,
-      "eval_wer": 0.4122222222222222,
       "step": 90
     },
     {
       "epoch": 11.0,
-      "eval_loss": 0.5438075065612793,
-      "eval_runtime": 2.9205,
-      "eval_samples_per_second": 5.821,
-      "eval_steps_per_second": 1.712,
-      "eval_wer": 0.38666666666666666,
       "step": 99
     },
     {
       "epoch": 11.11,
-      "learning_rate": 0.0002782758620689655,
-      "loss": 0.7019,
       "step": 100
     },
     {
       "epoch": 12.0,
-      "eval_loss": 0.4876076281070709,
-      "eval_runtime": 2.8398,
-      "eval_samples_per_second": 5.986,
-      "eval_steps_per_second": 1.761,
-      "eval_wer": 0.3711111111111111,
       "step": 108
     },
     {
       "epoch": 12.22,
-      "learning_rate": 0.0002748275862068965,
-      "loss": 0.6906,
       "step": 110
     },
     {
       "epoch": 13.0,
-      "eval_loss": 0.519428551197052,
-      "eval_runtime": 2.7785,
-      "eval_samples_per_second": 6.119,
-      "eval_steps_per_second": 1.8,
-      "eval_wer": 0.36,
       "step": 117
     },
     {
       "epoch": 13.33,
-      "learning_rate": 0.00027137931034482756,
-      "loss": 0.6535,
       "step": 120
     },
     {
       "epoch": 14.0,
-      "eval_loss": 0.4489333927631378,
-      "eval_runtime": 2.8252,
-      "eval_samples_per_second": 6.017,
-      "eval_steps_per_second": 1.77,
-      "eval_wer": 0.35555555555555557,
       "step": 126
     },
     {
       "epoch": 14.44,
-      "learning_rate": 0.0002679310344827586,
-      "loss": 0.6225,
       "step": 130
     },
     {
       "epoch": 15.0,
-      "eval_loss": 0.4382663071155548,
-      "eval_runtime": 2.7906,
-      "eval_samples_per_second": 6.092,
-      "eval_steps_per_second": 1.792,
-      "eval_wer": 0.3333333333333333,
       "step": 135
     },
     {
       "epoch": 15.56,
-      "learning_rate": 0.0002644827586206896,
-      "loss": 0.547,
       "step": 140
     },
     {
       "epoch": 16.0,
-      "eval_loss": 0.4521160423755646,
-      "eval_runtime": 2.8251,
-      "eval_samples_per_second": 6.017,
-      "eval_steps_per_second": 1.77,
-      "eval_wer": 0.35555555555555557,
       "step": 144
     },
     {
       "epoch": 16.67,
-      "learning_rate": 0.00026103448275862067,
-      "loss": 0.5525,
       "step": 150
     },
     {
       "epoch": 17.0,
-      "eval_loss": 0.5476210117340088,
-      "eval_runtime": 2.8122,
-      "eval_samples_per_second": 6.045,
-      "eval_steps_per_second": 1.778,
-      "eval_wer": 0.33444444444444443,
       "step": 153
     },
     {
       "epoch": 17.78,
-      "learning_rate": 0.0002575862068965517,
-      "loss": 0.6152,
       "step": 160
     },
     {
       "epoch": 18.0,
-      "eval_loss": 0.4465982913970947,
-      "eval_runtime": 2.8461,
-      "eval_samples_per_second": 5.973,
-      "eval_steps_per_second": 1.757,
-      "eval_wer": 0.36,
       "step": 162
     },
     {
       "epoch": 18.89,
-      "learning_rate": 0.00025413793103448273,
-      "loss": 0.5055,
       "step": 170
     },
     {
       "epoch": 19.0,
-      "eval_loss": 0.39812201261520386,
-      "eval_runtime": 2.805,
-      "eval_samples_per_second": 6.061,
-      "eval_steps_per_second": 1.783,
-      "eval_wer": 0.32555555555555554,
       "step": 171
     },
     {
       "epoch": 20.0,
-      "learning_rate": 0.0002506896551724138,
-      "loss": 0.5204,
       "step": 180
     },
     {
       "epoch": 20.0,
-      "eval_loss": 0.4923681318759918,
-      "eval_runtime": 2.8028,
-      "eval_samples_per_second": 6.065,
-      "eval_steps_per_second": 1.784,
-      "eval_wer": 0.30777777777777776,
       "step": 180
     },
     {
       "epoch": 21.0,
-      "eval_loss": 0.4085298776626587,
-      "eval_runtime": 2.8109,
-      "eval_samples_per_second": 6.048,
-      "eval_steps_per_second": 1.779,
-      "eval_wer": 0.32,
       "step": 189
     },
     {
       "epoch": 21.11,
-      "learning_rate": 0.0002472413793103448,
-      "loss": 0.4742,
       "step": 190
     },
     {
       "epoch": 22.0,
-      "eval_loss": 0.4254695177078247,
-      "eval_runtime": 2.7979,
-      "eval_samples_per_second": 6.076,
-      "eval_steps_per_second": 1.787,
-      "eval_wer": 0.3233333333333333,
       "step": 198
     },
     {
       "epoch": 22.22,
-      "learning_rate": 0.00024379310344827584,
-      "loss": 0.4774,
       "step": 200
     },
     {
       "epoch": 23.0,
-      "eval_loss": 0.43211016058921814,
-      "eval_runtime": 2.8119,
-      "eval_samples_per_second": 6.046,
-      "eval_steps_per_second": 1.778,
-      "eval_wer": 0.28888888888888886,
       "step": 207
     },
     {
       "epoch": 23.33,
-      "learning_rate": 0.00024034482758620687,
-      "loss": 0.5029,
       "step": 210
     },
     {
       "epoch": 24.0,
-      "eval_loss": 0.44116583466529846,
-      "eval_runtime": 2.7953,
-      "eval_samples_per_second": 6.082,
-      "eval_steps_per_second": 1.789,
-      "eval_wer": 0.31666666666666665,
       "step": 216
     },
     {
       "epoch": 24.44,
-      "learning_rate": 0.00023689655172413792,
-      "loss": 0.4889,
       "step": 220
     },
     {
       "epoch": 25.0,
-      "eval_loss": 0.40511757135391235,
-      "eval_runtime": 2.8082,
-      "eval_samples_per_second": 6.054,
-      "eval_steps_per_second": 1.781,
-      "eval_wer": 0.30444444444444446,
       "step": 225
     },
     {
       "epoch": 25.56,
-      "learning_rate": 0.00023344827586206895,
-      "loss": 0.4446,
       "step": 230
     },
     {
       "epoch": 26.0,
-      "eval_loss": 0.39176392555236816,
-      "eval_runtime": 2.8027,
-      "eval_samples_per_second": 6.066,
-      "eval_steps_per_second": 1.784,
-      "eval_wer": 0.3088888888888889,
       "step": 234
     },
     {
       "epoch": 26.67,
-      "learning_rate": 0.00023,
-      "loss": 0.4255,
       "step": 240
     },
     {
       "epoch": 27.0,
-      "eval_loss": 0.403872549533844,
-      "eval_runtime": 2.786,
-      "eval_samples_per_second": 6.102,
-      "eval_steps_per_second": 1.795,
-      "eval_wer": 0.29555555555555557,
       "step": 243
     },
     {
       "epoch": 27.78,
-      "learning_rate": 0.000226551724137931,
-      "loss": 0.4396,
       "step": 250
     },
     {
       "epoch": 28.0,
-      "eval_loss": 0.4112667143344879,
-      "eval_runtime": 2.8335,
-      "eval_samples_per_second": 6.0,
-      "eval_steps_per_second": 1.765,
-      "eval_wer": 0.29555555555555557,
       "step": 252
     },
     {
       "epoch": 28.89,
-      "learning_rate": 0.00022310344827586204,
-      "loss": 0.4265,
       "step": 260
     },
     {
       "epoch": 29.0,
-      "eval_loss": 0.5575971603393555,
-      "eval_runtime": 2.7693,
-      "eval_samples_per_second": 6.139,
-      "eval_steps_per_second": 1.806,
-      "eval_wer": 0.3022222222222222,
       "step": 261
     },
     {
       "epoch": 30.0,
-      "learning_rate": 0.0002196551724137931,
-      "loss": 0.4289,
       "step": 270
     },
     {
       "epoch": 30.0,
-      "eval_loss": 0.35578060150146484,
-      "eval_runtime": 2.7632,
-      "eval_samples_per_second": 6.152,
-      "eval_steps_per_second": 1.81,
-      "eval_wer": 0.30777777777777776,
       "step": 270
     },
     {
       "epoch": 31.0,
-      "eval_loss": 0.33904996514320374,
-      "eval_runtime": 2.7428,
-      "eval_samples_per_second": 6.198,
-      "eval_steps_per_second": 1.823,
-      "eval_wer": 0.31666666666666665,
       "step": 279
     },
     {
       "epoch": 31.11,
-      "learning_rate": 0.00021620689655172412,
-      "loss": 0.3817,
       "step": 280
     },
     {
       "epoch": 32.0,
-      "eval_loss": 0.3738517165184021,
-      "eval_runtime": 2.7731,
-      "eval_samples_per_second": 6.13,
-      "eval_steps_per_second": 1.803,
-      "eval_wer": 0.3422222222222222,
       "step": 288
     },
     {
       "epoch": 32.22,
-      "learning_rate": 0.00021275862068965515,
-      "loss": 0.4192,
       "step": 290
     },
     {
       "epoch": 33.0,
-      "eval_loss": 0.31792330741882324,
-      "eval_runtime": 2.7573,
-      "eval_samples_per_second": 6.166,
-      "eval_steps_per_second": 1.813,
-      "eval_wer": 0.3055555555555556,
       "step": 297
     },
     {
       "epoch": 33.33,
-      "learning_rate": 0.0002093103448275862,
-      "loss": 0.3719,
       "step": 300
     },
     {
       "epoch": 34.0,
-      "eval_loss": 0.3621741235256195,
-      "eval_runtime": 2.7351,
-      "eval_samples_per_second": 6.215,
-      "eval_steps_per_second": 1.828,
-      "eval_wer": 0.30333333333333334,
       "step": 306
     },
     {
       "epoch": 34.44,
-      "learning_rate": 0.00020586206896551723,
-      "loss": 0.3685,
       "step": 310
     },
     {
       "epoch": 35.0,
-      "eval_loss": 0.40566930174827576,
-      "eval_runtime": 2.7612,
-      "eval_samples_per_second": 6.157,
-      "eval_steps_per_second": 1.811,
-      "eval_wer": 0.32555555555555554,
       "step": 315
     },
     {
       "epoch": 35.56,
-      "learning_rate": 0.0002024137931034483,
-      "loss": 0.3752,
       "step": 320
     },
     {
       "epoch": 36.0,
-      "eval_loss": 0.39497387409210205,
-      "eval_runtime": 2.7507,
-      "eval_samples_per_second": 6.18,
-      "eval_steps_per_second": 1.818,
-      "eval_wer": 0.31,
       "step": 324
     },
     {
       "epoch": 36.67,
-      "learning_rate": 0.0001989655172413793,
-      "loss": 0.378,
       "step": 330
     },
     {
       "epoch": 37.0,
-      "eval_loss": 0.39072442054748535,
-      "eval_runtime": 2.7439,
-      "eval_samples_per_second": 6.196,
-      "eval_steps_per_second": 1.822,
-      "eval_wer": 0.3566666666666667,
       "step": 333
     },
     {
       "epoch": 37.78,
-      "learning_rate": 0.00019551724137931032,
-      "loss": 0.4438,
       "step": 340
     },
     {
       "epoch": 38.0,
-      "eval_loss": 0.33762815594673157,
-      "eval_runtime": 2.7815,
-      "eval_samples_per_second": 6.112,
-      "eval_steps_per_second": 1.798,
-      "eval_wer": 0.31,
       "step": 342
     },
     {
       "epoch": 38.89,
-      "learning_rate": 0.00019206896551724134,
-      "loss": 0.3978,
       "step": 350
     },
     {
       "epoch": 39.0,
-      "eval_loss": 0.3395032286643982,
-      "eval_runtime": 2.8043,
-      "eval_samples_per_second": 6.062,
-      "eval_steps_per_second": 1.783,
-      "eval_wer": 0.2833333333333333,
       "step": 351
     },
     {
       "epoch": 40.0,
-      "learning_rate": 0.0001886206896551724,
-      "loss": 0.3639,
       "step": 360
     },
     {
       "epoch": 40.0,
-      "eval_loss": 0.36456623673439026,
-      "eval_runtime": 2.7816,
-      "eval_samples_per_second": 6.112,
-      "eval_steps_per_second": 1.798,
-      "eval_wer": 0.28555555555555556,
       "step": 360
     },
     {
       "epoch": 41.0,
-      "eval_loss": 0.3546362519264221,
-      "eval_runtime": 2.7679,
-      "eval_samples_per_second": 6.142,
-      "eval_steps_per_second": 1.806,
-      "eval_wer": 0.30444444444444446,
       "step": 369
     },
     {
       "epoch": 41.11,
-      "learning_rate": 0.00018517241379310343,
-      "loss": 0.3535,
       "step": 370
     },
     {
       "epoch": 42.0,
-      "eval_loss": 0.36989736557006836,
-      "eval_runtime": 2.8116,
-      "eval_samples_per_second": 6.046,
-      "eval_steps_per_second": 1.778,
-      "eval_wer": 0.28888888888888886,
       "step": 378
     },
     {
       "epoch": 42.22,
-      "learning_rate": 0.00018172413793103448,
-      "loss": 0.3311,
       "step": 380
     },
     {
       "epoch": 43.0,
-      "eval_loss": 0.38820379972457886,
-      "eval_runtime": 2.7493,
-      "eval_samples_per_second": 6.183,
-      "eval_steps_per_second": 1.819,
-      "eval_wer": 0.3022222222222222,
       "step": 387
     },
     {
       "epoch": 43.33,
-      "learning_rate": 0.0001782758620689655,
-      "loss": 0.3475,
       "step": 390
     },
     {
       "epoch": 44.0,
-      "eval_loss": 0.4749428331851959,
-      "eval_runtime": 2.8377,
-      "eval_samples_per_second": 5.991,
-      "eval_steps_per_second": 1.762,
-      "eval_wer": 0.28888888888888886,
       "step": 396
     },
     {
       "epoch": 44.44,
-      "learning_rate": 0.00017482758620689654,
-      "loss": 0.4048,
       "step": 400
     },
     {
       "epoch": 45.0,
-      "eval_loss": 0.34369951486587524,
-      "eval_runtime": 2.794,
-      "eval_samples_per_second": 6.085,
-      "eval_steps_per_second": 1.79,
-      "eval_wer": 0.2911111111111111,
       "step": 405
     },
     {
       "epoch": 45.56,
-      "learning_rate": 0.00017137931034482757,
-      "loss": 0.2984,
       "step": 410
     },
     {
       "epoch": 46.0,
-      "eval_loss": 0.36636969447135925,
-      "eval_runtime": 2.7731,
-      "eval_samples_per_second": 6.13,
-      "eval_steps_per_second": 1.803,
-      "eval_wer": 0.27,
       "step": 414
     },
     {
       "epoch": 46.67,
-      "learning_rate": 0.0001679310344827586,
-      "loss": 0.3535,
       "step": 420
     },
     {
       "epoch": 47.0,
-      "eval_loss": 0.3290660083293915,
-      "eval_runtime": 2.767,
-      "eval_samples_per_second": 6.144,
-      "eval_steps_per_second": 1.807,
-      "eval_wer": 0.28888888888888886,
       "step": 423
     },
     {
       "epoch": 47.78,
-      "learning_rate": 0.00016448275862068962,
-      "loss": 0.3015,
       "step": 430
     },
     {
       "epoch": 48.0,
-      "eval_loss": 0.35376498103141785,
-      "eval_runtime": 2.7572,
-      "eval_samples_per_second": 6.166,
-      "eval_steps_per_second": 1.813,
-      "eval_wer": 0.27666666666666667,
       "step": 432
     },
     {
       "epoch": 48.89,
-      "learning_rate": 0.00016103448275862068,
-      "loss": 0.3628,
       "step": 440
     },
     {
       "epoch": 49.0,
-      "eval_loss": 0.44109877943992615,
-      "eval_runtime": 2.7694,
-      "eval_samples_per_second": 6.139,
-      "eval_steps_per_second": 1.805,
-      "eval_wer": 0.2733333333333333,
       "step": 441
     },
     {
       "epoch": 50.0,
-      "learning_rate": 0.0001575862068965517,
-      "loss": 0.3303,
       "step": 450
     },
     {
       "epoch": 50.0,
-      "eval_loss": 0.34246134757995605,
-      "eval_runtime": 2.7763,
-      "eval_samples_per_second": 6.123,
-      "eval_steps_per_second": 1.801,
-      "eval_wer": 0.29,
       "step": 450
     },
     {
       "epoch": 51.0,
-      "eval_loss": 0.3162029981613159,
-      "eval_runtime": 2.7842,
-      "eval_samples_per_second": 6.106,
-      "eval_steps_per_second": 1.796,
-      "eval_wer": 0.3011111111111111,
       "step": 459
     },
     {
       "epoch": 51.11,
-      "learning_rate": 0.00015413793103448276,
-      "loss": 0.271,
       "step": 460
     },
     {
       "epoch": 52.0,
-      "eval_loss": 0.36851903796195984,
-      "eval_runtime": 2.7813,
-      "eval_samples_per_second": 6.112,
-      "eval_steps_per_second": 1.798,
-      "eval_wer": 0.29333333333333333,
       "step": 468
     },
     {
       "epoch": 52.22,
-      "learning_rate": 0.0001506896551724138,
-      "loss": 0.3299,
       "step": 470
     },
     {
       "epoch": 53.0,
-      "eval_loss": 0.42159539461135864,
-      "eval_runtime": 2.767,
-      "eval_samples_per_second": 6.144,
-      "eval_steps_per_second": 1.807,
-      "eval_wer": 0.29333333333333333,
       "step": 477
     },
     {
       "epoch": 53.33,
-      "learning_rate": 0.00014724137931034482,
-      "loss": 0.2782,
       "step": 480
     },
     {
       "epoch": 54.0,
-      "eval_loss": 0.4713245928287506,
-      "eval_runtime": 2.8739,
-      "eval_samples_per_second": 5.915,
-      "eval_steps_per_second": 1.74,
-      "eval_wer": 0.30444444444444446,
       "step": 486
     },
     {
       "epoch": 54.44,
-      "learning_rate": 0.00014379310344827585,
-      "loss": 0.348,
       "step": 490
     },
     {
       "epoch": 55.0,
-      "eval_loss": 0.4310116767883301,
-      "eval_runtime": 2.7991,
-      "eval_samples_per_second": 6.073,
-      "eval_steps_per_second": 1.786,
-      "eval_wer": 0.30777777777777776,
       "step": 495
     },
     {
       "epoch": 55.56,
-      "learning_rate": 0.00014034482758620688,
-      "loss": 0.2969,
       "step": 500
     },
     {
       "epoch": 56.0,
-      "eval_loss": 0.48976629972457886,
-      "eval_runtime": 2.8118,
-      "eval_samples_per_second": 6.046,
-      "eval_steps_per_second": 1.778,
-      "eval_wer": 0.27666666666666667,
       "step": 504
     },
     {
       "epoch": 56.67,
-      "learning_rate": 0.0001368965517241379,
-      "loss": 0.2757,
       "step": 510
     },
     {
       "epoch": 57.0,
-      "eval_loss": 0.5194886326789856,
-      "eval_runtime": 2.7939,
-      "eval_samples_per_second": 6.085,
-      "eval_steps_per_second": 1.79,
-      "eval_wer": 0.2788888888888889,
       "step": 513
     },
     {
       "epoch": 57.78,
-      "learning_rate": 0.00013344827586206896,
-      "loss": 0.2662,
       "step": 520
     },
     {
       "epoch": 58.0,
-      "eval_loss": 0.46313199400901794,
-      "eval_runtime": 2.7984,
-      "eval_samples_per_second": 6.075,
-      "eval_steps_per_second": 1.787,
-      "eval_wer": 0.2911111111111111,
       "step": 522
     },
     {
       "epoch": 58.89,
-      "learning_rate": 0.00013,
-      "loss": 0.2706,
       "step": 530
     },
     {
       "epoch": 59.0,
-      "eval_loss": 0.427517294883728,
-      "eval_runtime": 2.7564,
-      "eval_samples_per_second": 6.168,
-      "eval_steps_per_second": 1.814,
-      "eval_wer": 0.2833333333333333,
       "step": 531
     },
     {
       "epoch": 60.0,
-      "learning_rate": 0.00012655172413793102,
-      "loss": 0.2684,
       "step": 540
     },
     {
       "epoch": 60.0,
-      "eval_loss": 0.553533136844635,
-      "eval_runtime": 2.7742,
-      "eval_samples_per_second": 6.128,
-      "eval_steps_per_second": 1.802,
-      "eval_wer": 0.2788888888888889,
       "step": 540
     },
     {
       "epoch": 61.0,
-      "eval_loss": 0.4733206331729889,
-      "eval_runtime": 2.7693,
-      "eval_samples_per_second": 6.139,
-      "eval_steps_per_second": 1.806,
-      "eval_wer": 0.29777777777777775,
       "step": 549
     },
     {
       "epoch": 61.11,
-      "learning_rate": 0.00012310344827586205,
-      "loss": 0.2819,
       "step": 550
     },
     {
       "epoch": 62.0,
-      "eval_loss": 0.49692198634147644,
-      "eval_runtime": 2.7566,
-      "eval_samples_per_second": 6.167,
-      "eval_steps_per_second": 1.814,
-      "eval_wer": 0.2833333333333333,
       "step": 558
     },
     {
       "epoch": 62.22,
-      "learning_rate": 0.00011965517241379309,
-      "loss": 0.2819,
       "step": 560
     },
     {
       "epoch": 63.0,
-      "eval_loss": 0.6202179789543152,
-      "eval_runtime": 2.7859,
-      "eval_samples_per_second": 6.102,
-      "eval_steps_per_second": 1.795,
-      "eval_wer": 0.2788888888888889,
       "step": 567
     },
     {
       "epoch": 63.33,
-      "learning_rate": 0.00011620689655172413,
-      "loss": 0.2889,
       "step": 570
     },
     {
       "epoch": 64.0,
-      "eval_loss": 0.39546066522598267,
-      "eval_runtime": 2.7637,
-      "eval_samples_per_second": 6.151,
-      "eval_steps_per_second": 1.809,
-      "eval_wer": 0.2733333333333333,
       "step": 576
     },
     {
       "epoch": 64.44,
-      "learning_rate": 0.00011275862068965516,
-      "loss": 0.2515,
       "step": 580
     },
     {
       "epoch": 65.0,
-      "eval_loss": 0.38055384159088135,
-      "eval_runtime": 2.7537,
-      "eval_samples_per_second": 6.173,
-      "eval_steps_per_second": 1.816,
-      "eval_wer": 0.26555555555555554,
       "step": 585
     },
     {
       "epoch": 65.56,
-      "learning_rate": 0.0001093103448275862,
-      "loss": 0.2468,
       "step": 590
     },
     {
       "epoch": 66.0,
-      "eval_loss": 0.3472989499568939,
-      "eval_runtime": 2.8011,
-      "eval_samples_per_second": 6.069,
-      "eval_steps_per_second": 1.785,
-      "eval_wer": 0.2722222222222222,
       "step": 594
     },
     {
       "epoch": 66.67,
-      "learning_rate": 0.00010586206896551723,
-      "loss": 0.2557,
       "step": 600
     },
     {
       "epoch": 67.0,
-      "eval_loss": 0.417023628950119,
-      "eval_runtime": 2.7867,
-      "eval_samples_per_second": 6.1,
-      "eval_steps_per_second": 1.794,
-      "eval_wer": 0.2722222222222222,
       "step": 603
     },
     {
       "epoch": 67.78,
-      "learning_rate": 0.00010241379310344827,
-      "loss": 0.2477,
       "step": 610
     },
     {
       "epoch": 68.0,
-      "eval_loss": 0.4748758375644684,
-      "eval_runtime": 2.7749,
-      "eval_samples_per_second": 6.126,
-      "eval_steps_per_second": 1.802,
-      "eval_wer": 0.2677777777777778,
       "step": 612
     },
     {
       "epoch": 68.89,
-      "learning_rate": 9.89655172413793e-05,
-      "loss": 0.2965,
       "step": 620
     },
     {
       "epoch": 69.0,
-      "eval_loss": 0.438679039478302,
-      "eval_runtime": 2.7924,
-      "eval_samples_per_second": 6.088,
-      "eval_steps_per_second": 1.791,
-      "eval_wer": 0.2611111111111111,
       "step": 621
     },
     {
       "epoch": 70.0,
-      "learning_rate": 9.551724137931034e-05,
-      "loss": 0.2606,
       "step": 630
     },
     {
       "epoch": 70.0,
-      "eval_loss": 0.45858699083328247,
-      "eval_runtime": 2.7888,
-      "eval_samples_per_second": 6.096,
-      "eval_steps_per_second": 1.793,
-      "eval_wer": 0.26555555555555554,
       "step": 630
     },
     {
       "epoch": 71.0,
-      "eval_loss": 0.5755282044410706,
-      "eval_runtime": 2.7561,
-      "eval_samples_per_second": 6.168,
-      "eval_steps_per_second": 1.814,
-      "eval_wer": 0.2733333333333333,
       "step": 639
     },
     {
       "epoch": 71.11,
-      "learning_rate": 9.206896551724137e-05,
-      "loss": 0.2442,
       "step": 640
     },
     {
       "epoch": 72.0,
-      "eval_loss": 0.5582060217857361,
-      "eval_runtime": 2.7794,
-      "eval_samples_per_second": 6.116,
-      "eval_steps_per_second": 1.799,
-      "eval_wer": 0.26555555555555554,
       "step": 648
     },
     {
       "epoch": 72.22,
-      "learning_rate": 8.862068965517241e-05,
-      "loss": 0.347,
       "step": 650
     },
     {
       "epoch": 73.0,
-      "eval_loss": 0.38965609669685364,
-      "eval_runtime": 2.7716,
-      "eval_samples_per_second": 6.134,
-      "eval_steps_per_second": 1.804,
-      "eval_wer": 0.27111111111111114,
       "step": 657
     },
     {
       "epoch": 73.33,
-      "learning_rate": 8.517241379310344e-05,
-      "loss": 0.2444,
       "step": 660
     },
     {
       "epoch": 74.0,
-      "eval_loss": 0.33690622448921204,
-      "eval_runtime": 2.7566,
-      "eval_samples_per_second": 6.167,
-      "eval_steps_per_second": 1.814,
-      "eval_wer": 0.25333333333333335,
       "step": 666
     },
     {
       "epoch": 74.44,
-      "learning_rate": 8.172413793103448e-05,
-      "loss": 0.2811,
       "step": 670
     },
     {
       "epoch": 75.0,
-      "eval_loss": 0.34874993562698364,
-      "eval_runtime": 2.7479,
-      "eval_samples_per_second": 6.186,
-      "eval_steps_per_second": 1.82,
-      "eval_wer": 0.2577777777777778,
       "step": 675
     },
     {
       "epoch": 75.56,
-      "learning_rate": 7.827586206896551e-05,
-      "loss": 0.24,
       "step": 680
     },
     {
       "epoch": 76.0,
-      "eval_loss": 0.3692302107810974,
-      "eval_runtime": 2.785,
-      "eval_samples_per_second": 6.104,
-      "eval_steps_per_second": 1.795,
-      "eval_wer": 0.2588888888888889,
       "step": 684
     },
     {
       "epoch": 76.67,
-      "learning_rate": 7.482758620689654e-05,
-      "loss": 0.2466,
       "step": 690
     },
     {
       "epoch": 77.0,
-      "eval_loss": 0.45672333240509033,
-      "eval_runtime": 2.7533,
-      "eval_samples_per_second": 6.174,
-      "eval_steps_per_second": 1.816,
-      "eval_wer": 0.2577777777777778,
       "step": 693
     },
     {
       "epoch": 77.78,
-      "learning_rate": 7.137931034482758e-05,
-      "loss": 0.2769,
       "step": 700
     },
     {
       "epoch": 78.0,
-      "eval_loss": 0.40405967831611633,
-      "eval_runtime": 2.7964,
-      "eval_samples_per_second": 6.079,
-      "eval_steps_per_second": 1.788,
-      "eval_wer": 0.2633333333333333,
       "step": 702
     },
     {
       "epoch": 78.89,
-      "learning_rate": 6.79310344827586e-05,
-      "loss": 0.2464,
       "step": 710
     },
     {
       "epoch": 79.0,
-      "eval_loss": 0.38128018379211426,
-      "eval_runtime": 2.7812,
-      "eval_samples_per_second": 6.113,
-      "eval_steps_per_second": 1.798,
-      "eval_wer": 0.26222222222222225,
       "step": 711
     },
     {
       "epoch": 80.0,
-      "learning_rate": 6.448275862068965e-05,
-      "loss": 0.2791,
       "step": 720
     },
     {
       "epoch": 80.0,
-      "eval_loss": 0.3990322947502136,
-      "eval_runtime": 2.7516,
-      "eval_samples_per_second": 6.178,
-      "eval_steps_per_second": 1.817,
-      "eval_wer": 0.25555555555555554,
       "step": 720
     },
     {
       "epoch": 81.0,
-      "eval_loss": 0.39965325593948364,
-      "eval_runtime": 2.7649,
-      "eval_samples_per_second": 6.149,
-      "eval_steps_per_second": 1.808,
-      "eval_wer": 0.24888888888888888,
       "step": 729
     },
     {
       "epoch": 81.11,
-      "learning_rate": 6.103448275862068e-05,
-      "loss": 0.2365,
       "step": 730
     },
     {
       "epoch": 82.0,
-      "eval_loss": 0.4537028968334198,
-      "eval_runtime": 2.7885,
-      "eval_samples_per_second": 6.097,
-      "eval_steps_per_second": 1.793,
-      "eval_wer": 0.25333333333333335,
       "step": 738
     },
     {
       "epoch": 82.22,
-      "learning_rate": 5.758620689655172e-05,
-      "loss": 0.2693,
       "step": 740
     },
     {
       "epoch": 83.0,
-      "eval_loss": 0.5943002104759216,
-      "eval_runtime": 2.8023,
-      "eval_samples_per_second": 6.067,
-      "eval_steps_per_second": 1.784,
-      "eval_wer": 0.2611111111111111,
       "step": 747
     },
     {
       "epoch": 83.33,
-      "learning_rate": 5.413793103448275e-05,
-      "loss": 0.2285,
       "step": 750
     },
     {
       "epoch": 84.0,
-      "eval_loss": 0.5804929733276367,
-      "eval_runtime": 2.7598,
-      "eval_samples_per_second": 6.16,
-      "eval_steps_per_second": 1.812,
-      "eval_wer": 0.26555555555555554,
       "step": 756
     },
     {
       "epoch": 84.44,
-      "learning_rate": 5.068965517241379e-05,
-      "loss": 0.2468,
       "step": 760
     },
     {
       "epoch": 85.0,
-      "eval_loss": 0.5608753561973572,
-      "eval_runtime": 2.7731,
-      "eval_samples_per_second": 6.13,
-      "eval_steps_per_second": 1.803,
-      "eval_wer": 0.26555555555555554,
       "step": 765
     },
     {
       "epoch": 85.56,
-      "learning_rate": 4.724137931034482e-05,
-      "loss": 0.2226,
       "step": 770
     },
     {
       "epoch": 86.0,
-      "eval_loss": 0.59482342004776,
-      "eval_runtime": 2.7726,
-      "eval_samples_per_second": 6.131,
-      "eval_steps_per_second": 1.803,
-      "eval_wer": 0.26666666666666666,
       "step": 774
     },
     {
       "epoch": 86.67,
-      "learning_rate": 4.379310344827586e-05,
-      "loss": 0.2419,
       "step": 780
     },
     {
       "epoch": 87.0,
-      "eval_loss": 0.5909682512283325,
-      "eval_runtime": 2.7879,
-      "eval_samples_per_second": 6.098,
-      "eval_steps_per_second": 1.793,
-      "eval_wer": 0.2544444444444444,
       "step": 783
     },
     {
       "epoch": 87.78,
-      "learning_rate": 4.034482758620689e-05,
-      "loss": 0.2254,
       "step": 790
     },
     {
       "epoch": 88.0,
-      "eval_loss": 0.5740683078765869,
-      "eval_runtime": 2.7572,
-      "eval_samples_per_second": 6.166,
-      "eval_steps_per_second": 1.813,
-      "eval_wer": 0.26,
       "step": 792
     },
     {
       "epoch": 88.89,
-      "learning_rate": 3.689655172413793e-05,
-      "loss": 0.2083,
       "step": 800
     },
     {
       "epoch": 89.0,
-      "eval_loss": 0.498391717672348,
-      "eval_runtime": 2.7579,
-      "eval_samples_per_second": 6.164,
-      "eval_steps_per_second": 1.813,
-      "eval_wer": 0.2611111111111111,
       "step": 801
     },
     {
       "epoch": 90.0,
-      "learning_rate": 3.344827586206896e-05,
-      "loss": 0.2318,
       "step": 810
     },
     {
       "epoch": 90.0,
-      "eval_loss": 0.5093002915382385,
-      "eval_runtime": 2.7728,
-      "eval_samples_per_second": 6.131,
-      "eval_steps_per_second": 1.803,
-      "eval_wer": 0.26,
       "step": 810
     },
     {
       "epoch": 91.0,
-      "eval_loss": 0.5284357070922852,
-      "eval_runtime": 2.7447,
-      "eval_samples_per_second": 6.194,
-      "eval_steps_per_second": 1.822,
-      "eval_wer": 0.2633333333333333,
       "step": 819
     },
     {
       "epoch": 91.11,
-      "learning_rate": 2.9999999999999997e-05,
-      "loss": 0.2458,
       "step": 820
     },
     {
       "epoch": 92.0,
-      "eval_loss": 0.48846206068992615,
-      "eval_runtime": 2.7457,
-      "eval_samples_per_second": 6.192,
-      "eval_steps_per_second": 1.821,
-      "eval_wer": 0.26555555555555554,
       "step": 828
     },
     {
       "epoch": 92.22,
-      "learning_rate": 2.6551724137931032e-05,
-      "loss": 0.2394,
       "step": 830
     },
     {
       "epoch": 93.0,
-      "eval_loss": 0.4817904829978943,
-      "eval_runtime": 2.7858,
-      "eval_samples_per_second": 6.102,
-      "eval_steps_per_second": 1.795,
-      "eval_wer": 0.26222222222222225,
       "step": 837
     },
     {
       "epoch": 93.33,
-      "learning_rate": 2.3103448275862067e-05,
-      "loss": 0.2018,
       "step": 840
     },
     {
       "epoch": 94.0,
-      "eval_loss": 0.5037254691123962,
-      "eval_runtime": 2.7345,
-      "eval_samples_per_second": 6.217,
-      "eval_steps_per_second": 1.829,
-      "eval_wer": 0.26,
       "step": 846
     },
     {
       "epoch": 94.44,
-      "learning_rate": 1.9655172413793102e-05,
-      "loss": 0.235,
       "step": 850
     },
     {
       "epoch": 95.0,
-      "eval_loss": 0.5010991096496582,
-      "eval_runtime": 2.8024,
-      "eval_samples_per_second": 6.066,
-      "eval_steps_per_second": 1.784,
-      "eval_wer": 0.2577777777777778,
       "step": 855
     },
     {
       "epoch": 95.56,
-      "learning_rate": 1.6206896551724137e-05,
-      "loss": 0.2252,
       "step": 860
     },
     {
       "epoch": 96.0,
-      "eval_loss": 0.49311307072639465,
-      "eval_runtime": 2.7705,
-      "eval_samples_per_second": 6.136,
-      "eval_steps_per_second": 1.805,
-      "eval_wer": 0.2611111111111111,
       "step": 864
     },
     {
       "epoch": 96.67,
-      "learning_rate": 1.275862068965517e-05,
-      "loss": 0.2147,
       "step": 870
     },
     {
       "epoch": 97.0,
-      "eval_loss": 0.4880674481391907,
-      "eval_runtime": 2.7947,
-      "eval_samples_per_second": 6.083,
-      "eval_steps_per_second": 1.789,
-      "eval_wer": 0.2588888888888889,
       "step": 873
     },
     {
       "epoch": 97.78,
-      "learning_rate": 9.310344827586206e-06,
-      "loss": 0.2227,
       "step": 880
     },
     {
       "epoch": 98.0,
-      "eval_loss": 0.49562954902648926,
-      "eval_runtime": 2.7533,
-      "eval_samples_per_second": 6.174,
-      "eval_steps_per_second": 1.816,
-      "eval_wer": 0.2588888888888889,
       "step": 882
     },
     {
       "epoch": 98.89,
-      "learning_rate": 5.862068965517241e-06,
-      "loss": 0.2168,
       "step": 890
     },
     {
       "epoch": 99.0,
-      "eval_loss": 0.5096976161003113,
-      "eval_runtime": 2.7653,
-      "eval_samples_per_second": 6.148,
-      "eval_steps_per_second": 1.808,
-      "eval_wer": 0.2588888888888889,
       "step": 891
     },
     {
       "epoch": 100.0,
-      "learning_rate": 2.413793103448276e-06,
-      "loss": 0.2282,
       "step": 900
     },
     {
       "epoch": 100.0,
-      "eval_loss": 0.5173905491828918,
-      "eval_runtime": 2.7832,
-      "eval_samples_per_second": 6.108,
-      "eval_steps_per_second": 1.797,
-      "eval_wer": 0.26,
       "step": 900
     },
     {
       "epoch": 100.0,
       "step": 900,
       "total_flos": 1.389987159899058e+18,
-      "train_loss": 0.7617763585514492,
-      "train_runtime": 3519.9031,
-      "train_samples_per_second": 4.006,
-      "train_steps_per_second": 0.256
     }
   ],
   "max_steps": 900,

 {
+  "best_metric": 0.2793618440628052,
+  "best_model_checkpoint": "ai-light-dance_drums_ft_pretrain_wav2vec2-base-new_onset-idmt-2/checkpoint-279",
   "epoch": 100.0,
   "global_step": 900,
   "is_hyper_param_search": false,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.30894508957862854,
+      "eval_runtime": 2.673,
+      "eval_samples_per_second": 6.36,
+      "eval_steps_per_second": 1.871,
+      "eval_wer": 0.28555555555555556,
       "step": 9
     },
     {
       "epoch": 1.11,
+      "learning_rate": 9.999999999999999e-05,
+      "loss": 0.2871,
       "step": 10
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.3208143711090088,
+      "eval_runtime": 2.862,
+      "eval_samples_per_second": 5.94,
+      "eval_steps_per_second": 1.747,
+      "eval_wer": 0.28,
       "step": 18
     },
     {
       "epoch": 2.22,
+      "learning_rate": 0.00019999999999999998,
+      "loss": 0.2997,
       "step": 20
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.39483940601348877,
+      "eval_runtime": 2.7822,
+      "eval_samples_per_second": 6.11,
+      "eval_steps_per_second": 1.797,
+      "eval_wer": 0.2877777777777778,
       "step": 27
     },
     {
       "epoch": 3.33,
+      "learning_rate": 0.0003,
+      "loss": 0.299,
       "step": 30
     },
     {
       "epoch": 4.0,
+      "eval_loss": 0.3137438893318176,
+      "eval_runtime": 2.7766,
+      "eval_samples_per_second": 6.123,
+      "eval_steps_per_second": 1.801,
+      "eval_wer": 0.3011111111111111,
       "step": 36
     },
     {
       "epoch": 4.44,
+      "learning_rate": 0.00029655172413793103,
+      "loss": 0.3462,
       "step": 40
     },
     {
       "epoch": 5.0,
+      "eval_loss": 0.30665457248687744,
+      "eval_runtime": 2.8279,
+      "eval_samples_per_second": 6.012,
+      "eval_steps_per_second": 1.768,
+      "eval_wer": 0.2688888888888889,
       "step": 45
     },
     {
       "epoch": 5.56,
+      "learning_rate": 0.00029310344827586203,
+      "loss": 0.3098,
       "step": 50
     },
     {
       "epoch": 6.0,
+      "eval_loss": 0.3271433115005493,
+      "eval_runtime": 2.7609,
+      "eval_samples_per_second": 6.157,
+      "eval_steps_per_second": 1.811,
+      "eval_wer": 0.2811111111111111,
       "step": 54
     },
     {
       "epoch": 6.67,
+      "learning_rate": 0.0002896551724137931,
+      "loss": 0.2812,
       "step": 60
     },
     {
       "epoch": 7.0,
+      "eval_loss": 0.4907187819480896,
+      "eval_runtime": 2.7909,
+      "eval_samples_per_second": 6.091,
+      "eval_steps_per_second": 1.792,
+      "eval_wer": 0.26,
       "step": 63
     },
     {
       "epoch": 7.78,
+      "learning_rate": 0.0002862068965517241,
+      "loss": 0.3151,
       "step": 70
     },
     {
       "epoch": 8.0,
+      "eval_loss": 0.5852011442184448,
+      "eval_runtime": 2.7422,
+      "eval_samples_per_second": 6.199,
+      "eval_steps_per_second": 1.823,
+      "eval_wer": 0.2777777777777778,
       "step": 72
     },
     {
       "epoch": 8.89,
+      "learning_rate": 0.00028275862068965514,
+      "loss": 0.3038,
       "step": 80
     },
     {
       "epoch": 9.0,
+      "eval_loss": 0.2981448471546173,
+      "eval_runtime": 2.7964,
+      "eval_samples_per_second": 6.079,
+      "eval_steps_per_second": 1.788,
+      "eval_wer": 0.27666666666666667,
       "step": 81
     },
     {
       "epoch": 10.0,
+      "learning_rate": 0.0002793103448275862,
+      "loss": 0.3248,
       "step": 90
     },
     {
       "epoch": 10.0,
+      "eval_loss": 0.3129429519176483,
+      "eval_runtime": 2.7598,
+      "eval_samples_per_second": 6.16,
+      "eval_steps_per_second": 1.812,
+      "eval_wer": 0.2811111111111111,
       "step": 90
     },
     {
       "epoch": 11.0,
+      "eval_loss": 0.4089965522289276,
+      "eval_runtime": 2.7275,
+      "eval_samples_per_second": 6.233,
+      "eval_steps_per_second": 1.833,
+      "eval_wer": 0.27666666666666667,
       "step": 99
     },
     {
       "epoch": 11.11,
+      "learning_rate": 0.0002762068965517241,
+      "loss": 0.3106,
       "step": 100
     },
     {
       "epoch": 12.0,
+      "eval_loss": 0.5353591442108154,
+      "eval_runtime": 2.7463,
+      "eval_samples_per_second": 6.19,
+      "eval_steps_per_second": 1.821,
+      "eval_wer": 0.3,
       "step": 108
     },
     {
       "epoch": 12.22,
+      "learning_rate": 0.0002727586206896551,
+      "loss": 0.2702,
       "step": 110
     },
     {
       "epoch": 13.0,
+      "eval_loss": 0.5543289184570312,
+      "eval_runtime": 2.737,
+      "eval_samples_per_second": 6.211,
+      "eval_steps_per_second": 1.827,
+      "eval_wer": 0.3,
       "step": 117
     },
     {
       "epoch": 13.33,
+      "learning_rate": 0.00026931034482758617,
+      "loss": 0.3021,
       "step": 120
     },
     {
       "epoch": 14.0,
+      "eval_loss": 0.5436674952507019,
+      "eval_runtime": 2.6623,
+      "eval_samples_per_second": 6.386,
+      "eval_steps_per_second": 1.878,
+      "eval_wer": 0.2688888888888889,
       "step": 126
     },
     {
       "epoch": 14.44,
+      "learning_rate": 0.0002658620689655172,
+      "loss": 0.2622,
       "step": 130
     },
     {
       "epoch": 15.0,
+      "eval_loss": 0.5897889733314514,
+      "eval_runtime": 2.6886,
+      "eval_samples_per_second": 6.323,
+      "eval_steps_per_second": 1.86,
+      "eval_wer": 0.2777777777777778,
       "step": 135
     },
     {
       "epoch": 15.56,
+      "learning_rate": 0.0002624137931034483,
+      "loss": 0.2465,
       "step": 140
     },
     {
       "epoch": 16.0,
+      "eval_loss": 0.2900051176548004,
+      "eval_runtime": 2.6745,
+      "eval_samples_per_second": 6.356,
+      "eval_steps_per_second": 1.869,
+      "eval_wer": 0.2722222222222222,
       "step": 144
     },
     {
       "epoch": 16.67,
+      "learning_rate": 0.0002589655172413793,
+      "loss": 0.3077,
       "step": 150
     },
     {
       "epoch": 17.0,
+      "eval_loss": 0.44073647260665894,
+      "eval_runtime": 2.6947,
+      "eval_samples_per_second": 6.309,
+      "eval_steps_per_second": 1.855,
+      "eval_wer": 0.2544444444444444,
       "step": 153
     },
     {
       "epoch": 17.78,
+      "learning_rate": 0.00025551724137931034,
+      "loss": 0.2959,
       "step": 160
     },
     {
       "epoch": 18.0,
+      "eval_loss": 0.4078582227230072,
+      "eval_runtime": 2.6646,
+      "eval_samples_per_second": 6.38,
+      "eval_steps_per_second": 1.876,
+      "eval_wer": 0.29444444444444445,
       "step": 162
     },
     {
       "epoch": 18.89,
+      "learning_rate": 0.0002520689655172414,
+      "loss": 0.2843,
       "step": 170
     },
     {
       "epoch": 19.0,
+      "eval_loss": 0.504199743270874,
+      "eval_runtime": 2.6688,
+      "eval_samples_per_second": 6.37,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.2722222222222222,
       "step": 171
     },
     {
       "epoch": 20.0,
+      "learning_rate": 0.0002486206896551724,
+      "loss": 0.254,
       "step": 180
     },
     {
       "epoch": 20.0,
+      "eval_loss": 0.38511529564857483,
+      "eval_runtime": 2.6831,
+      "eval_samples_per_second": 6.336,
+      "eval_steps_per_second": 1.864,
+      "eval_wer": 0.2877777777777778,
       "step": 180
     },
     {
       "epoch": 21.0,
+      "eval_loss": 0.39123114943504333,
+      "eval_runtime": 2.7483,
+      "eval_samples_per_second": 6.186,
+      "eval_steps_per_second": 1.819,
+      "eval_wer": 0.2677777777777778,
       "step": 189
     },
     {
       "epoch": 21.11,
+      "learning_rate": 0.0002451724137931034,
+      "loss": 0.2532,
       "step": 190
     },
     {
       "epoch": 22.0,
+      "eval_loss": 0.4699125289916992,
+      "eval_runtime": 2.6552,
+      "eval_samples_per_second": 6.402,
+      "eval_steps_per_second": 1.883,
+      "eval_wer": 0.2577777777777778,
       "step": 198
     },
     {
       "epoch": 22.22,
+      "learning_rate": 0.00024172413793103445,
+      "loss": 0.3011,
       "step": 200
     },
     {
       "epoch": 23.0,
+      "eval_loss": 0.746636688709259,
+      "eval_runtime": 2.6717,
+      "eval_samples_per_second": 6.363,
+      "eval_steps_per_second": 1.871,
+      "eval_wer": 0.27444444444444444,
       "step": 207
     },
     {
       "epoch": 23.33,
+      "learning_rate": 0.0002382758620689655,
+      "loss": 0.2601,
       "step": 210
     },
     {
       "epoch": 24.0,
+      "eval_loss": 0.42384907603263855,
+      "eval_runtime": 2.671,
+      "eval_samples_per_second": 6.365,
+      "eval_steps_per_second": 1.872,
+      "eval_wer": 0.28,
       "step": 216
     },
     {
       "epoch": 24.44,
+      "learning_rate": 0.00023482758620689653,
+      "loss": 0.2873,
       "step": 220
     },
     {
       "epoch": 25.0,
+      "eval_loss": 0.3816550672054291,
+      "eval_runtime": 2.7122,
+      "eval_samples_per_second": 6.268,
+      "eval_steps_per_second": 1.844,
+      "eval_wer": 0.24555555555555555,
       "step": 225
     },
     {
       "epoch": 25.56,
+      "learning_rate": 0.00023137931034482756,
+      "loss": 0.2791,
       "step": 230
     },
     {
       "epoch": 26.0,
+      "eval_loss": 0.3488330543041229,
+      "eval_runtime": 2.7083,
+      "eval_samples_per_second": 6.277,
+      "eval_steps_per_second": 1.846,
+      "eval_wer": 0.24888888888888888,
       "step": 234
     },
     {
       "epoch": 26.67,
+      "learning_rate": 0.00022793103448275862,
+      "loss": 0.2399,
       "step": 240
     },
     {
       "epoch": 27.0,
+      "eval_loss": 0.29803043603897095,
+      "eval_runtime": 2.6607,
+      "eval_samples_per_second": 6.389,
+      "eval_steps_per_second": 1.879,
+      "eval_wer": 0.2611111111111111,
       "step": 243
     },
     {
       "epoch": 27.78,
+      "learning_rate": 0.00022448275862068965,
+      "loss": 0.2592,
       "step": 250
     },
     {
       "epoch": 28.0,
+      "eval_loss": 0.29419198632240295,
+      "eval_runtime": 2.6723,
+      "eval_samples_per_second": 6.361,
+      "eval_steps_per_second": 1.871,
+      "eval_wer": 0.27,
       "step": 252
     },
     {
       "epoch": 28.89,
+      "learning_rate": 0.00022103448275862065,
+      "loss": 0.2191,
       "step": 260
     },
     {
       "epoch": 29.0,
+      "eval_loss": 0.2920997440814972,
+      "eval_runtime": 2.6701,
+      "eval_samples_per_second": 6.367,
+      "eval_steps_per_second": 1.873,
+      "eval_wer": 0.2833333333333333,
       "step": 261
     },
     {
       "epoch": 30.0,
+      "learning_rate": 0.0002175862068965517,
+      "loss": 0.2285,
       "step": 270
     },
     {
       "epoch": 30.0,
+      "eval_loss": 0.2851235568523407,
+      "eval_runtime": 2.6768,
+      "eval_samples_per_second": 6.351,
+      "eval_steps_per_second": 1.868,
+      "eval_wer": 0.27444444444444444,
       "step": 270
     },
     {
       "epoch": 31.0,
+      "eval_loss": 0.2793618440628052,
+      "eval_runtime": 2.6674,
+      "eval_samples_per_second": 6.373,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.2733333333333333,
       "step": 279
     },
     {
       "epoch": 31.11,
+      "learning_rate": 0.00021413793103448273,
+      "loss": 0.2489,
       "step": 280
     },
     {
       "epoch": 32.0,
+      "eval_loss": 0.30359551310539246,
+      "eval_runtime": 2.6757,
+      "eval_samples_per_second": 6.353,
+      "eval_steps_per_second": 1.869,
+      "eval_wer": 0.2677777777777778,
       "step": 288
     },
     {
       "epoch": 32.22,
+      "learning_rate": 0.0002106896551724138,
+      "loss": 0.2445,
       "step": 290
     },
     {
       "epoch": 33.0,
+      "eval_loss": 0.28508973121643066,
+      "eval_runtime": 2.7054,
+      "eval_samples_per_second": 6.284,
+      "eval_steps_per_second": 1.848,
+      "eval_wer": 0.2677777777777778,
       "step": 297
     },
     {
       "epoch": 33.33,
+      "learning_rate": 0.00020724137931034482,
+      "loss": 0.2261,
       "step": 300
     },
     {
       "epoch": 34.0,
+      "eval_loss": 0.2863776385784149,
+      "eval_runtime": 2.7065,
+      "eval_samples_per_second": 6.281,
+      "eval_steps_per_second": 1.847,
+      "eval_wer": 0.2733333333333333,
       "step": 306
     },
     {
       "epoch": 34.44,
+      "learning_rate": 0.00020379310344827584,
+      "loss": 0.2391,
       "step": 310
     },
     {
       "epoch": 35.0,
+      "eval_loss": 0.3054599165916443,
+      "eval_runtime": 2.6546,
+      "eval_samples_per_second": 6.404,
+      "eval_steps_per_second": 1.884,
+      "eval_wer": 0.2611111111111111,
       "step": 315
     },
     {
       "epoch": 35.56,
+      "learning_rate": 0.0002006896551724138,
+      "loss": 0.3939,
       "step": 320
     },
     {
       "epoch": 36.0,
+      "eval_loss": 0.2927255928516388,
+      "eval_runtime": 2.6884,
+      "eval_samples_per_second": 6.324,
+      "eval_steps_per_second": 1.86,
+      "eval_wer": 0.26,
       "step": 324
     },
     {
       "epoch": 36.67,
+      "learning_rate": 0.00019724137931034482,
+      "loss": 0.2521,
       "step": 330
     },
     {
       "epoch": 37.0,
+      "eval_loss": 0.34698253870010376,
+      "eval_runtime": 2.673,
+      "eval_samples_per_second": 6.36,
+      "eval_steps_per_second": 1.871,
+      "eval_wer": 0.2577777777777778,
       "step": 333
     },
     {
       "epoch": 37.78,
+      "learning_rate": 0.00019379310344827584,
+      "loss": 0.2378,
       "step": 340
     },
     {
       "epoch": 38.0,
+      "eval_loss": 0.2841470539569855,
+      "eval_runtime": 2.6684,
+      "eval_samples_per_second": 6.371,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.26555555555555554,
       "step": 342
     },
     {
       "epoch": 38.89,
+      "learning_rate": 0.0001903448275862069,
+      "loss": 0.2653,
       "step": 350
     },
     {
       "epoch": 39.0,
+      "eval_loss": 0.2888979911804199,
+      "eval_runtime": 2.6688,
+      "eval_samples_per_second": 6.37,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.2388888888888889,
       "step": 351
     },
     {
       "epoch": 40.0,
+      "learning_rate": 0.0001868965517241379,
+      "loss": 0.2235,
       "step": 360
     },
     {
       "epoch": 40.0,
+      "eval_loss": 0.31759706139564514,
+      "eval_runtime": 2.6864,
+      "eval_samples_per_second": 6.328,
+      "eval_steps_per_second": 1.861,
+      "eval_wer": 0.25,
       "step": 360
     },
     {
       "epoch": 41.0,
+      "eval_loss": 0.31878939270973206,
+      "eval_runtime": 2.69,
+      "eval_samples_per_second": 6.32,
+      "eval_steps_per_second": 1.859,
+      "eval_wer": 0.26666666666666666,
       "step": 369
     },
     {
       "epoch": 41.11,
+      "learning_rate": 0.00018344827586206893,
+      "loss": 0.2474,
       "step": 370
     },
     {
       "epoch": 42.0,
+      "eval_loss": 0.37820303440093994,
+      "eval_runtime": 2.703,
+      "eval_samples_per_second": 6.289,
+      "eval_steps_per_second": 1.85,
+      "eval_wer": 0.2633333333333333,
       "step": 378
     },
     {
       "epoch": 42.22,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 0.222,
       "step": 380
     },
     {
       "epoch": 43.0,
+      "eval_loss": 0.320123553276062,
+      "eval_runtime": 2.6965,
+      "eval_samples_per_second": 6.304,
+      "eval_steps_per_second": 1.854,
+      "eval_wer": 0.27666666666666667,
       "step": 387
     },
     {
       "epoch": 43.33,
+      "learning_rate": 0.000176551724137931,
+      "loss": 0.2411,
       "step": 390
     },
     {
       "epoch": 44.0,
+      "eval_loss": 0.3416379392147064,
+      "eval_runtime": 2.672,
+      "eval_samples_per_second": 6.362,
+      "eval_steps_per_second": 1.871,
+      "eval_wer": 0.2722222222222222,
       "step": 396
     },
     {
       "epoch": 44.44,
+      "learning_rate": 0.00017310344827586207,
+      "loss": 0.2561,
       "step": 400
     },
     {
       "epoch": 45.0,
+      "eval_loss": 0.3050036132335663,
+      "eval_runtime": 2.675,
+      "eval_samples_per_second": 6.355,
+      "eval_steps_per_second": 1.869,
+      "eval_wer": 0.27111111111111114,
       "step": 405
     },
     {
       "epoch": 45.56,
+      "learning_rate": 0.0001696551724137931,
+      "loss": 0.2169,
       "step": 410
     },
     {
       "epoch": 46.0,
+      "eval_loss": 0.39679646492004395,
+      "eval_runtime": 2.6457,
+      "eval_samples_per_second": 6.425,
+      "eval_steps_per_second": 1.89,
+      "eval_wer": 0.2511111111111111,
       "step": 414
     },
     {
       "epoch": 46.67,
+      "learning_rate": 0.00016620689655172412,
+      "loss": 0.2296,
       "step": 420
     },
     {
       "epoch": 47.0,
+      "eval_loss": 0.3721458911895752,
+      "eval_runtime": 2.6664,
+      "eval_samples_per_second": 6.376,
+      "eval_steps_per_second": 1.875,
+      "eval_wer": 0.25666666666666665,
       "step": 423
     },
     {
       "epoch": 47.78,
+      "learning_rate": 0.00016275862068965518,
+      "loss": 0.1989,
       "step": 430
     },
     {
       "epoch": 48.0,
+      "eval_loss": 0.3204912543296814,
+      "eval_runtime": 2.6839,
+      "eval_samples_per_second": 6.334,
+      "eval_steps_per_second": 1.863,
+      "eval_wer": 0.26666666666666666,
       "step": 432
     },
     {
       "epoch": 48.89,
+      "learning_rate": 0.00015931034482758618,
+      "loss": 0.2408,
       "step": 440
     },
     {
       "epoch": 49.0,
+      "eval_loss": 0.4523827135562897,
+      "eval_runtime": 2.6923,
+      "eval_samples_per_second": 6.314,
+      "eval_steps_per_second": 1.857,
+      "eval_wer": 0.24888888888888888,
       "step": 441
     },
     {
       "epoch": 50.0,
+      "learning_rate": 0.0001558620689655172,
+      "loss": 0.2163,
       "step": 450
     },
     {
       "epoch": 50.0,
+      "eval_loss": 0.48503080010414124,
+      "eval_runtime": 2.7497,
+      "eval_samples_per_second": 6.183,
+      "eval_steps_per_second": 1.818,
+      "eval_wer": 0.25666666666666665,
       "step": 450
     },
     {
       "epoch": 51.0,
+      "eval_loss": 0.3777279555797577,
+      "eval_runtime": 2.6773,
+      "eval_samples_per_second": 6.35,
+      "eval_steps_per_second": 1.868,
+      "eval_wer": 0.27111111111111114,
       "step": 459
     },
     {
       "epoch": 51.11,
+      "learning_rate": 0.00015241379310344826,
+      "loss": 0.2001,
       "step": 460
     },
     {
       "epoch": 52.0,
+      "eval_loss": 0.5525699853897095,
+      "eval_runtime": 2.7459,
+      "eval_samples_per_second": 6.191,
+      "eval_steps_per_second": 1.821,
+      "eval_wer": 0.2644444444444444,
       "step": 468
     },
     {
       "epoch": 52.22,
+      "learning_rate": 0.0001489655172413793,
+      "loss": 0.2373,
       "step": 470
     },
     {
       "epoch": 53.0,
+      "eval_loss": 0.514091968536377,
+      "eval_runtime": 2.6662,
+      "eval_samples_per_second": 6.376,
+      "eval_steps_per_second": 1.875,
+      "eval_wer": 0.2588888888888889,
       "step": 477
     },
     {
       "epoch": 53.33,
+      "learning_rate": 0.00014551724137931032,
+      "loss": 0.2132,
       "step": 480
     },
     {
       "epoch": 54.0,
+      "eval_loss": 0.5407584309577942,
+      "eval_runtime": 2.6748,
+      "eval_samples_per_second": 6.356,
+      "eval_steps_per_second": 1.869,
+      "eval_wer": 0.2611111111111111,
       "step": 486
     },
     {
       "epoch": 54.44,
+      "learning_rate": 0.00014206896551724138,
+      "loss": 0.2687,
       "step": 490
     },
     {
       "epoch": 55.0,
+      "eval_loss": 0.5389086604118347,
+      "eval_runtime": 2.6621,
+      "eval_samples_per_second": 6.386,
+      "eval_steps_per_second": 1.878,
+      "eval_wer": 0.2677777777777778,
       "step": 495
     },
     {
       "epoch": 55.56,
+      "learning_rate": 0.0001386206896551724,
+      "loss": 0.2244,
       "step": 500
     },
     {
       "epoch": 56.0,
+      "eval_loss": 0.5729237794876099,
+      "eval_runtime": 2.6691,
+      "eval_samples_per_second": 6.369,
+      "eval_steps_per_second": 1.873,
+      "eval_wer": 0.2577777777777778,
       "step": 504
     },
     {
       "epoch": 56.67,
+      "learning_rate": 0.00013517241379310343,
+      "loss": 0.2102,
       "step": 510
     },
     {
       "epoch": 57.0,
+      "eval_loss": 0.6249426603317261,
+      "eval_runtime": 2.6765,
+      "eval_samples_per_second": 6.351,
+      "eval_steps_per_second": 1.868,
+      "eval_wer": 0.24888888888888888,
       "step": 513
     },
     {
       "epoch": 57.78,
+      "learning_rate": 0.00013172413793103446,
+      "loss": 0.2076,
       "step": 520
     },
     {
       "epoch": 58.0,
+      "eval_loss": 0.5538017749786377,
+      "eval_runtime": 2.6836,
+      "eval_samples_per_second": 6.335,
+      "eval_steps_per_second": 1.863,
+      "eval_wer": 0.25,
       "step": 522
     },
     {
       "epoch": 58.89,
+      "learning_rate": 0.00012827586206896552,
+      "loss": 0.208,
       "step": 530
     },
     {
       "epoch": 59.0,
+      "eval_loss": 0.549868643283844,
+      "eval_runtime": 2.7033,
+      "eval_samples_per_second": 6.289,
+      "eval_steps_per_second": 1.85,
+      "eval_wer": 0.24666666666666667,
       "step": 531
     },
     {
       "epoch": 60.0,
+      "learning_rate": 0.00012482758620689654,
+      "loss": 0.2167,
       "step": 540
     },
     {
       "epoch": 60.0,
+      "eval_loss": 0.6480904817581177,
+      "eval_runtime": 2.6966,
+      "eval_samples_per_second": 6.304,
+      "eval_steps_per_second": 1.854,
+      "eval_wer": 0.24333333333333335,
       "step": 540
     },
     {
       "epoch": 61.0,
+      "eval_loss": 0.6797173619270325,
+      "eval_runtime": 2.6683,
+      "eval_samples_per_second": 6.371,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.2588888888888889,
       "step": 549
     },
     {
       "epoch": 61.11,
+      "learning_rate": 0.00012137931034482757,
+      "loss": 0.2218,
       "step": 550
     },
     {
       "epoch": 62.0,
+      "eval_loss": 0.5400562882423401,
+      "eval_runtime": 2.6672,
+      "eval_samples_per_second": 6.374,
+      "eval_steps_per_second": 1.875,
+      "eval_wer": 0.26555555555555554,
       "step": 558
     },
     {
       "epoch": 62.22,
+      "learning_rate": 0.00011793103448275861,
+      "loss": 0.2102,
       "step": 560
     },
     {
       "epoch": 63.0,
+      "eval_loss": 0.5152256488800049,
+      "eval_runtime": 2.6712,
+      "eval_samples_per_second": 6.364,
+      "eval_steps_per_second": 1.872,
+      "eval_wer": 0.26,
       "step": 567
     },
     {
       "epoch": 63.33,
+      "learning_rate": 0.00011448275862068966,
+      "loss": 0.2176,
       "step": 570
     },
     {
       "epoch": 64.0,
+      "eval_loss": 0.5581179857254028,
+      "eval_runtime": 2.6803,
+      "eval_samples_per_second": 6.343,
+      "eval_steps_per_second": 1.865,
+      "eval_wer": 0.26,
       "step": 576
     },
     {
       "epoch": 64.44,
+      "learning_rate": 0.00011103448275862067,
+      "loss": 0.2068,
       "step": 580
     },
     {
       "epoch": 65.0,
+      "eval_loss": 0.7224693298339844,
+      "eval_runtime": 2.6758,
+      "eval_samples_per_second": 6.353,
+      "eval_steps_per_second": 1.869,
+      "eval_wer": 0.25333333333333335,
       "step": 585
     },
     {
       "epoch": 65.56,
+      "learning_rate": 0.00010758620689655171,
+      "loss": 0.2123,
       "step": 590
     },
     {
       "epoch": 66.0,
+      "eval_loss": 0.6330079436302185,
+      "eval_runtime": 2.667,
+      "eval_samples_per_second": 6.374,
+      "eval_steps_per_second": 1.875,
+      "eval_wer": 0.2633333333333333,
       "step": 594
     },
     {
       "epoch": 66.67,
+      "learning_rate": 0.00010413793103448275,
+      "loss": 0.2212,
       "step": 600
     },
     {
       "epoch": 67.0,
+      "eval_loss": 0.5943337082862854,
+      "eval_runtime": 2.6815,
+      "eval_samples_per_second": 6.34,
+      "eval_steps_per_second": 1.865,
+      "eval_wer": 0.2588888888888889,
       "step": 603
     },
     {
       "epoch": 67.78,
+      "learning_rate": 0.0001006896551724138,
+      "loss": 0.2013,
       "step": 610
     },
     {
       "epoch": 68.0,
+      "eval_loss": 0.7557083368301392,
+      "eval_runtime": 2.7707,
+      "eval_samples_per_second": 6.136,
+      "eval_steps_per_second": 1.805,
+      "eval_wer": 0.25,
       "step": 612
     },
     {
       "epoch": 68.89,
+      "learning_rate": 9.724137931034481e-05,
+      "loss": 0.2304,
       "step": 620
     },
     {
       "epoch": 69.0,
+      "eval_loss": 0.9143911004066467,
+      "eval_runtime": 2.682,
+      "eval_samples_per_second": 6.339,
+      "eval_steps_per_second": 1.864,
+      "eval_wer": 0.24666666666666667,
       "step": 621
     },
     {
       "epoch": 70.0,
+      "learning_rate": 9.379310344827585e-05,
+      "loss": 0.209,
       "step": 630
     },
     {
       "epoch": 70.0,
+      "eval_loss": 0.7790440320968628,
+      "eval_runtime": 2.6874,
+      "eval_samples_per_second": 6.326,
+      "eval_steps_per_second": 1.861,
+      "eval_wer": 0.24,
       "step": 630
     },
     {
       "epoch": 71.0,
+      "eval_loss": 0.6202754974365234,
+      "eval_runtime": 2.6775,
+      "eval_samples_per_second": 6.349,
+      "eval_steps_per_second": 1.867,
+      "eval_wer": 0.2411111111111111,
       "step": 639
     },
     {
       "epoch": 71.11,
+      "learning_rate": 9.03448275862069e-05,
+      "loss": 0.191,
       "step": 640
     },
     {
       "epoch": 72.0,
+      "eval_loss": 0.628011167049408,
+      "eval_runtime": 2.6846,
+      "eval_samples_per_second": 6.332,
+      "eval_steps_per_second": 1.862,
+      "eval_wer": 0.23222222222222222,
       "step": 648
     },
     {
       "epoch": 72.22,
+      "learning_rate": 8.689655172413794e-05,
+      "loss": 0.2313,
       "step": 650
     },
     {
       "epoch": 73.0,
+      "eval_loss": 0.5491462349891663,
+      "eval_runtime": 2.7834,
+      "eval_samples_per_second": 6.108,
+      "eval_steps_per_second": 1.796,
+      "eval_wer": 0.23777777777777778,
       "step": 657
     },
     {
       "epoch": 73.33,
+      "learning_rate": 8.344827586206895e-05,
+      "loss": 0.1869,
       "step": 660
     },
     {
       "epoch": 74.0,
+      "eval_loss": 0.465344101190567,
+      "eval_runtime": 2.6446,
+      "eval_samples_per_second": 6.428,
+      "eval_steps_per_second": 1.891,
+      "eval_wer": 0.2411111111111111,
       "step": 666
     },
     {
       "epoch": 74.44,
+      "learning_rate": 7.999999999999999e-05,
+      "loss": 0.2313,
       "step": 670
     },
     {
       "epoch": 75.0,
+      "eval_loss": 0.6015957593917847,
+      "eval_runtime": 2.6596,
+      "eval_samples_per_second": 6.392,
+      "eval_steps_per_second": 1.88,
+      "eval_wer": 0.24888888888888888,
       "step": 675
     },
     {
       "epoch": 75.56,
+      "learning_rate": 7.655172413793103e-05,
+      "loss": 0.1806,
       "step": 680
     },
     {
       "epoch": 76.0,
+      "eval_loss": 0.6491662859916687,
+      "eval_runtime": 2.7026,
+      "eval_samples_per_second": 6.29,
+      "eval_steps_per_second": 1.85,
+      "eval_wer": 0.2477777777777778,
       "step": 684
     },
     {
       "epoch": 76.67,
+      "learning_rate": 7.310344827586206e-05,
+      "loss": 0.1934,
       "step": 690
     },
     {
       "epoch": 77.0,
+      "eval_loss": 0.6185407042503357,
+      "eval_runtime": 2.7206,
+      "eval_samples_per_second": 6.249,
+      "eval_steps_per_second": 1.838,
+      "eval_wer": 0.2477777777777778,
       "step": 693
     },
     {
       "epoch": 77.78,
+      "learning_rate": 6.96551724137931e-05,
+      "loss": 0.1954,
       "step": 700
     },
     {
       "epoch": 78.0,
+      "eval_loss": 0.5618109703063965,
+      "eval_runtime": 2.6904,
+      "eval_samples_per_second": 6.319,
+      "eval_steps_per_second": 1.858,
+      "eval_wer": 0.24888888888888888,
       "step": 702
     },
     {
       "epoch": 78.89,
+      "learning_rate": 6.620689655172413e-05,
+      "loss": 0.2077,
       "step": 710
     },
     {
       "epoch": 79.0,
+      "eval_loss": 0.5759626030921936,
+      "eval_runtime": 2.6815,
+      "eval_samples_per_second": 6.34,
+      "eval_steps_per_second": 1.865,
+      "eval_wer": 0.25222222222222224,
       "step": 711
     },
     {
       "epoch": 80.0,
+      "learning_rate": 6.275862068965517e-05,
+      "loss": 0.2052,
       "step": 720
     },
     {
       "epoch": 80.0,
+      "eval_loss": 0.6171647310256958,
+      "eval_runtime": 2.6846,
+      "eval_samples_per_second": 6.332,
+      "eval_steps_per_second": 1.862,
+      "eval_wer": 0.25,
       "step": 720
     },
     {
       "epoch": 81.0,
+      "eval_loss": 0.6858766078948975,
+      "eval_runtime": 2.7081,
+      "eval_samples_per_second": 6.278,
+      "eval_steps_per_second": 1.846,
+      "eval_wer": 0.24666666666666667,
       "step": 729
     },
     {
       "epoch": 81.11,
+      "learning_rate": 5.93103448275862e-05,
+      "loss": 0.1804,
       "step": 730
     },
     {
       "epoch": 82.0,
+      "eval_loss": 0.7642585039138794,
+      "eval_runtime": 2.6849,
+      "eval_samples_per_second": 6.332,
+      "eval_steps_per_second": 1.862,
+      "eval_wer": 0.24222222222222223,
       "step": 738
     },
     {
       "epoch": 82.22,
+      "learning_rate": 5.586206896551724e-05,
+      "loss": 0.1995,
       "step": 740
     },
     {
       "epoch": 83.0,
+      "eval_loss": 0.8360317349433899,
+      "eval_runtime": 2.6914,
+      "eval_samples_per_second": 6.316,
+      "eval_steps_per_second": 1.858,
+      "eval_wer": 0.23666666666666666,
       "step": 747
     },
     {
       "epoch": 83.33,
+      "learning_rate": 5.241379310344827e-05,
+      "loss": 0.1869,
       "step": 750
     },
     {
       "epoch": 84.0,
+      "eval_loss": 0.6984127759933472,
+      "eval_runtime": 2.6921,
+      "eval_samples_per_second": 6.315,
+      "eval_steps_per_second": 1.857,
+      "eval_wer": 0.24888888888888888,
       "step": 756
     },
     {
       "epoch": 84.44,
+      "learning_rate": 4.896551724137931e-05,
+      "loss": 0.2135,
       "step": 760
     },
     {
       "epoch": 85.0,
+      "eval_loss": 0.6759489178657532,
+      "eval_runtime": 2.6874,
+      "eval_samples_per_second": 6.326,
+      "eval_steps_per_second": 1.861,
+      "eval_wer": 0.24222222222222223,
       "step": 765
     },
     {
       "epoch": 85.56,
+      "learning_rate": 4.551724137931034e-05,
+      "loss": 0.178,
       "step": 770
     },
     {
       "epoch": 86.0,
+      "eval_loss": 0.6790638566017151,
+      "eval_runtime": 2.6812,
+      "eval_samples_per_second": 6.34,
+      "eval_steps_per_second": 1.865,
+      "eval_wer": 0.24444444444444444,
       "step": 774
     },
     {
       "epoch": 86.67,
+      "learning_rate": 4.206896551724138e-05,
+      "loss": 0.1734,
       "step": 780
     },
     {
       "epoch": 87.0,
+      "eval_loss": 0.7283732891082764,
+      "eval_runtime": 2.6818,
+      "eval_samples_per_second": 6.339,
+      "eval_steps_per_second": 1.864,
+      "eval_wer": 0.2411111111111111,
       "step": 783
     },
     {
       "epoch": 87.78,
+      "learning_rate": 3.862068965517241e-05,
+      "loss": 0.1881,
       "step": 790
     },
     {
       "epoch": 88.0,
+      "eval_loss": 0.8172265291213989,
+      "eval_runtime": 2.6717,
+      "eval_samples_per_second": 6.363,
+      "eval_steps_per_second": 1.871,
+      "eval_wer": 0.23444444444444446,
       "step": 792
     },
     {
       "epoch": 88.89,
+      "learning_rate": 3.517241379310344e-05,
+      "loss": 0.1625,
       "step": 800
     },
     {
       "epoch": 89.0,
+      "eval_loss": 0.8061416745185852,
+      "eval_runtime": 2.719,
+      "eval_samples_per_second": 6.252,
+      "eval_steps_per_second": 1.839,
+      "eval_wer": 0.23555555555555555,
       "step": 801
     },
     {
       "epoch": 90.0,
+      "learning_rate": 3.1724137931034476e-05,
+      "loss": 0.181,
       "step": 810
     },
     {
       "epoch": 90.0,
+      "eval_loss": 0.7644045948982239,
+      "eval_runtime": 2.7,
+      "eval_samples_per_second": 6.296,
+      "eval_steps_per_second": 1.852,
+      "eval_wer": 0.2388888888888889,
       "step": 810
     },
     {
       "epoch": 91.0,
+      "eval_loss": 0.7413058876991272,
+      "eval_runtime": 2.6915,
+      "eval_samples_per_second": 6.316,
+      "eval_steps_per_second": 1.858,
+      "eval_wer": 0.24,
       "step": 819
     },
     {
       "epoch": 91.11,
+      "learning_rate": 2.8275862068965515e-05,
+      "loss": 0.1942,
       "step": 820
     },
     {
       "epoch": 92.0,
+      "eval_loss": 0.6439424157142639,
+      "eval_runtime": 2.668,
+      "eval_samples_per_second": 6.372,
+      "eval_steps_per_second": 1.874,
+      "eval_wer": 0.24333333333333335,
       "step": 828
     },
     {
       "epoch": 92.22,
+      "learning_rate": 2.482758620689655e-05,
+      "loss": 0.1806,
       "step": 830
     },
     {
       "epoch": 93.0,
+      "eval_loss": 0.6250465512275696,
+      "eval_runtime": 2.7104,
+      "eval_samples_per_second": 6.272,
+      "eval_steps_per_second": 1.845,
+      "eval_wer": 0.24666666666666667,
       "step": 837
     },
     {
       "epoch": 93.33,
+      "learning_rate": 2.1379310344827585e-05,
+      "loss": 0.1651,
       "step": 840
     },
     {
       "epoch": 94.0,
+      "eval_loss": 0.6516769528388977,
+      "eval_runtime": 2.6556,
+      "eval_samples_per_second": 6.402,
+      "eval_steps_per_second": 1.883,
+      "eval_wer": 0.24333333333333335,
       "step": 846
     },
     {
       "epoch": 94.44,
+      "learning_rate": 1.793103448275862e-05,
+      "loss": 0.1833,
       "step": 850
     },
     {
       "epoch": 95.0,
+      "eval_loss": 0.6628164052963257,
+      "eval_runtime": 2.7043,
+      "eval_samples_per_second": 6.286,
+      "eval_steps_per_second": 1.849,
+      "eval_wer": 0.2388888888888889,
       "step": 855
     },
     {
       "epoch": 95.56,
+      "learning_rate": 1.4482758620689653e-05,
+      "loss": 0.1873,
       "step": 860
     },
     {
       "epoch": 96.0,
+      "eval_loss": 0.6581894159317017,
+      "eval_runtime": 2.6489,
+      "eval_samples_per_second": 6.418,
+      "eval_steps_per_second": 1.888,
+      "eval_wer": 0.23777777777777778,
       "step": 864
     },
     {
       "epoch": 96.67,
+      "learning_rate": 1.1034482758620688e-05,
+      "loss": 0.1672,
       "step": 870
     },
     {
       "epoch": 97.0,
+      "eval_loss": 0.6548393964767456,
+      "eval_runtime": 2.6503,
+      "eval_samples_per_second": 6.414,
+      "eval_steps_per_second": 1.887,
+      "eval_wer": 0.2388888888888889,
       "step": 873
     },
     {
       "epoch": 97.78,
+      "learning_rate": 7.586206896551723e-06,
+      "loss": 0.1871,
       "step": 880
     },
     {
       "epoch": 98.0,
+      "eval_loss": 0.6655335426330566,
+      "eval_runtime": 2.6305,
+      "eval_samples_per_second": 6.463,
+      "eval_steps_per_second": 1.901,
+      "eval_wer": 0.24,
       "step": 882
     },
     {
       "epoch": 98.89,
+      "learning_rate": 4.137931034482758e-06,
+      "loss": 0.2429,
       "step": 890
     },
     {
       "epoch": 99.0,
+      "eval_loss": 0.6694830060005188,
+      "eval_runtime": 2.6212,
+      "eval_samples_per_second": 6.486,
+      "eval_steps_per_second": 1.908,
+      "eval_wer": 0.24,
       "step": 891
     },
     {
       "epoch": 100.0,
+      "learning_rate": 6.89655172413793e-07,
+      "loss": 0.1832,
       "step": 900
     },
     {
       "epoch": 100.0,
+      "eval_loss": 0.6699547171592712,
+      "eval_runtime": 2.7031,
+      "eval_samples_per_second": 6.289,
+      "eval_steps_per_second": 1.85,
+      "eval_wer": 0.2388888888888889,
       "step": 900
     },
     {
       "epoch": 100.0,
       "step": 900,
       "total_flos": 1.389987159899058e+18,
+      "train_loss": 0.2346874083413018,
+      "train_runtime": 3461.7851,
+      "train_samples_per_second": 4.073,
+      "train_steps_per_second": 0.26
     }
   ],
   "max_steps": 900,