{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 1.5127448755767339,
  "eval_steps": 200,
  "global_step": 10000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.001512744875576734,
      "grad_norm": 0.8282566070556641,
      "learning_rate": 0.00019996,
      "loss": 3.4576,
      "step": 10
    },
    {
      "epoch": 0.003025489751153468,
      "grad_norm": 0.1628154069185257,
      "learning_rate": 0.00019992000000000002,
      "loss": 0.0992,
      "step": 20
    },
    {
      "epoch": 0.004538234626730202,
      "grad_norm": 0.17421123385429382,
      "learning_rate": 0.00019988,
      "loss": 0.0666,
      "step": 30
    },
    {
      "epoch": 0.006050979502306936,
      "grad_norm": 0.08850277960300446,
      "learning_rate": 0.00019984,
      "loss": 0.0661,
      "step": 40
    },
    {
      "epoch": 0.00756372437788367,
      "grad_norm": 0.11368270963430405,
      "learning_rate": 0.0001998,
      "loss": 0.0639,
      "step": 50
    },
    {
      "epoch": 0.009076469253460404,
      "grad_norm": 0.12990300357341766,
      "learning_rate": 0.00019976000000000003,
      "loss": 0.0617,
      "step": 60
    },
    {
      "epoch": 0.010589214129037138,
      "grad_norm": 0.08885369449853897,
      "learning_rate": 0.00019972000000000002,
      "loss": 0.0643,
      "step": 70
    },
    {
      "epoch": 0.012101959004613872,
      "grad_norm": 0.07073435187339783,
      "learning_rate": 0.00019968,
      "loss": 0.0629,
      "step": 80
    },
    {
      "epoch": 0.013614703880190605,
      "grad_norm": 0.061856113374233246,
      "learning_rate": 0.00019964,
      "loss": 0.061,
      "step": 90
    },
    {
      "epoch": 0.01512744875576734,
      "grad_norm": 0.06827201694250107,
      "learning_rate": 0.0001996,
      "loss": 0.0586,
      "step": 100
    },
    {
      "epoch": 0.016640193631344075,
      "grad_norm": 0.07220456004142761,
      "learning_rate": 0.00019956000000000002,
      "loss": 0.055,
      "step": 110
    },
    {
      "epoch": 0.018152938506920808,
      "grad_norm": 0.06632555276155472,
      "learning_rate": 0.00019952000000000001,
      "loss": 0.0586,
      "step": 120
    },
    {
      "epoch": 0.01966568338249754,
      "grad_norm": 0.09966724365949631,
      "learning_rate": 0.00019948,
      "loss": 0.0621,
      "step": 130
    },
    {
      "epoch": 0.021178428258074276,
      "grad_norm": 0.0833888053894043,
      "learning_rate": 0.00019944,
      "loss": 0.0591,
      "step": 140
    },
    {
      "epoch": 0.02269117313365101,
      "grad_norm": 0.08170727640390396,
      "learning_rate": 0.00019940000000000002,
      "loss": 0.055,
      "step": 150
    },
    {
      "epoch": 0.024203918009227745,
      "grad_norm": 0.07089231163263321,
      "learning_rate": 0.00019936000000000002,
      "loss": 0.0582,
      "step": 160
    },
    {
      "epoch": 0.025716662884804477,
      "grad_norm": 0.09390200674533844,
      "learning_rate": 0.00019932,
      "loss": 0.0628,
      "step": 170
    },
    {
      "epoch": 0.02722940776038121,
      "grad_norm": 0.06722863018512726,
      "learning_rate": 0.00019928,
      "loss": 0.0591,
      "step": 180
    },
    {
      "epoch": 0.028742152635957946,
      "grad_norm": 0.0743609368801117,
      "learning_rate": 0.00019924,
      "loss": 0.0626,
      "step": 190
    },
    {
      "epoch": 0.03025489751153468,
      "grad_norm": 0.08125407248735428,
      "learning_rate": 0.00019920000000000002,
      "loss": 0.0601,
      "step": 200
    },
    {
      "epoch": 0.03025489751153468,
      "eval_cer": 0.5356160728183765,
      "eval_loss": 0.05078176036477089,
      "eval_runtime": 10281.8657,
      "eval_samples_per_second": 2.047,
      "eval_steps_per_second": 0.256,
      "step": 200
    },
    {
      "epoch": 0.03176764238711141,
      "grad_norm": 0.07030890136957169,
      "learning_rate": 0.00019916,
      "loss": 0.0597,
      "step": 210
    },
    {
      "epoch": 0.03328038726268815,
      "grad_norm": 0.05290469154715538,
      "learning_rate": 0.00019912,
      "loss": 0.0587,
      "step": 220
    },
    {
      "epoch": 0.03479313213826488,
      "grad_norm": 0.07339277863502502,
      "learning_rate": 0.00019908,
      "loss": 0.0529,
      "step": 230
    },
    {
      "epoch": 0.036305877013841616,
      "grad_norm": 0.0727711170911789,
      "learning_rate": 0.00019904,
      "loss": 0.0539,
      "step": 240
    },
    {
      "epoch": 0.03781862188941835,
      "grad_norm": 0.07383541762828827,
      "learning_rate": 0.000199,
      "loss": 0.0532,
      "step": 250
    },
    {
      "epoch": 0.03933136676499508,
      "grad_norm": 0.07042526453733444,
      "learning_rate": 0.00019896,
      "loss": 0.0571,
      "step": 260
    },
    {
      "epoch": 0.04084411164057182,
      "grad_norm": 0.08188482373952866,
      "learning_rate": 0.00019892000000000003,
      "loss": 0.0521,
      "step": 270
    },
    {
      "epoch": 0.04235685651614855,
      "grad_norm": 0.07334589958190918,
      "learning_rate": 0.00019888,
      "loss": 0.0532,
      "step": 280
    },
    {
      "epoch": 0.043869601391725285,
      "grad_norm": 0.06326377391815186,
      "learning_rate": 0.00019884000000000001,
      "loss": 0.0528,
      "step": 290
    },
    {
      "epoch": 0.04538234626730202,
      "grad_norm": 0.05303795263171196,
      "learning_rate": 0.0001988,
      "loss": 0.0539,
      "step": 300
    },
    {
      "epoch": 0.04689509114287875,
      "grad_norm": 0.058723289519548416,
      "learning_rate": 0.00019876,
      "loss": 0.0469,
      "step": 310
    },
    {
      "epoch": 0.04840783601845549,
      "grad_norm": 0.08683237433433533,
      "learning_rate": 0.00019872000000000002,
      "loss": 0.0601,
      "step": 320
    },
    {
      "epoch": 0.04992058089403222,
      "grad_norm": 0.07650341093540192,
      "learning_rate": 0.00019868,
      "loss": 0.0582,
      "step": 330
    },
    {
      "epoch": 0.051433325769608955,
      "grad_norm": 0.054965659976005554,
      "learning_rate": 0.00019864,
      "loss": 0.0548,
      "step": 340
    },
    {
      "epoch": 0.05294607064518569,
      "grad_norm": 0.06949716061353683,
      "learning_rate": 0.0001986,
      "loss": 0.0581,
      "step": 350
    },
    {
      "epoch": 0.05445881552076242,
      "grad_norm": 0.10514732450246811,
      "learning_rate": 0.00019856000000000002,
      "loss": 0.0587,
      "step": 360
    },
    {
      "epoch": 0.05597156039633916,
      "grad_norm": 0.06586117297410965,
      "learning_rate": 0.00019852000000000002,
      "loss": 0.0561,
      "step": 370
    },
    {
      "epoch": 0.05748430527191589,
      "grad_norm": 0.09821395576000214,
      "learning_rate": 0.00019848,
      "loss": 0.0556,
      "step": 380
    },
    {
      "epoch": 0.058997050147492625,
      "grad_norm": 0.06488014757633209,
      "learning_rate": 0.00019844,
      "loss": 0.0634,
      "step": 390
    },
    {
      "epoch": 0.06050979502306936,
      "grad_norm": 0.06910958141088486,
      "learning_rate": 0.0001984,
      "loss": 0.052,
      "step": 400
    },
    {
      "epoch": 0.06050979502306936,
      "eval_cer": 0.2714758865721352,
      "eval_loss": 0.04847713187336922,
      "eval_runtime": 10484.76,
      "eval_samples_per_second": 2.008,
      "eval_steps_per_second": 0.251,
      "step": 400
    },
    {
      "epoch": 0.0620225398986461,
      "grad_norm": 0.048563435673713684,
      "learning_rate": 0.00019836000000000002,
      "loss": 0.0565,
      "step": 410
    },
    {
      "epoch": 0.06353528477422282,
      "grad_norm": 0.055841896682977676,
      "learning_rate": 0.00019832,
      "loss": 0.0547,
      "step": 420
    },
    {
      "epoch": 0.06504802964979955,
      "grad_norm": 0.05644605681300163,
      "learning_rate": 0.00019828,
      "loss": 0.0575,
      "step": 430
    },
    {
      "epoch": 0.0665607745253763,
      "grad_norm": 0.05617703124880791,
      "learning_rate": 0.00019824,
      "loss": 0.0514,
      "step": 440
    },
    {
      "epoch": 0.06807351940095303,
      "grad_norm": 0.11480820178985596,
      "learning_rate": 0.00019820000000000002,
      "loss": 0.0562,
      "step": 450
    },
    {
      "epoch": 0.06958626427652977,
      "grad_norm": 0.06004955247044563,
      "learning_rate": 0.00019816000000000001,
      "loss": 0.0575,
      "step": 460
    },
    {
      "epoch": 0.0710990091521065,
      "grad_norm": 0.07830873131752014,
      "learning_rate": 0.00019812,
      "loss": 0.0621,
      "step": 470
    },
    {
      "epoch": 0.07261175402768323,
      "grad_norm": 0.052650969475507736,
      "learning_rate": 0.00019808,
      "loss": 0.0599,
      "step": 480
    },
    {
      "epoch": 0.07412449890325996,
      "grad_norm": 0.09298545122146606,
      "learning_rate": 0.00019804,
      "loss": 0.0559,
      "step": 490
    },
    {
      "epoch": 0.0756372437788367,
      "grad_norm": 0.06198689714074135,
      "learning_rate": 0.00019800000000000002,
      "loss": 0.047,
      "step": 500
    },
    {
      "epoch": 0.07714998865441343,
      "grad_norm": 0.06688915193080902,
      "learning_rate": 0.00019796,
      "loss": 0.0523,
      "step": 510
    },
    {
      "epoch": 0.07866273352999016,
      "grad_norm": 0.06676903367042542,
      "learning_rate": 0.00019792000000000003,
      "loss": 0.0509,
      "step": 520
    },
    {
      "epoch": 0.08017547840556691,
      "grad_norm": 0.06219707056879997,
      "learning_rate": 0.00019788,
      "loss": 0.0553,
      "step": 530
    },
    {
      "epoch": 0.08168822328114364,
      "grad_norm": 0.07905440032482147,
      "learning_rate": 0.00019784,
      "loss": 0.0506,
      "step": 540
    },
    {
      "epoch": 0.08320096815672037,
      "grad_norm": 0.08591905236244202,
      "learning_rate": 0.0001978,
      "loss": 0.0603,
      "step": 550
    },
    {
      "epoch": 0.0847137130322971,
      "grad_norm": 0.05921874940395355,
      "learning_rate": 0.00019776,
      "loss": 0.0562,
      "step": 560
    },
    {
      "epoch": 0.08622645790787384,
      "grad_norm": 0.058868613094091415,
      "learning_rate": 0.00019772000000000002,
      "loss": 0.0517,
      "step": 570
    },
    {
      "epoch": 0.08773920278345057,
      "grad_norm": 0.06818246096372604,
      "learning_rate": 0.00019768,
      "loss": 0.0478,
      "step": 580
    },
    {
      "epoch": 0.0892519476590273,
      "grad_norm": 0.07364825904369354,
      "learning_rate": 0.00019764,
      "loss": 0.0553,
      "step": 590
    },
    {
      "epoch": 0.09076469253460404,
      "grad_norm": 0.07647281885147095,
      "learning_rate": 0.0001976,
      "loss": 0.0527,
      "step": 600
    },
    {
      "epoch": 0.09076469253460404,
      "eval_cer": 0.282631389088609,
      "eval_loss": 0.047340717166662216,
      "eval_runtime": 10466.4392,
      "eval_samples_per_second": 2.011,
      "eval_steps_per_second": 0.251,
      "step": 600
    },
    {
      "epoch": 0.09227743741018077,
      "grad_norm": 0.0819125548005104,
      "learning_rate": 0.00019756,
      "loss": 0.0509,
      "step": 610
    },
    {
      "epoch": 0.0937901822857575,
      "grad_norm": 0.06566735357046127,
      "learning_rate": 0.00019752000000000002,
      "loss": 0.0583,
      "step": 620
    },
    {
      "epoch": 0.09530292716133425,
      "grad_norm": 0.06856215745210648,
      "learning_rate": 0.00019748,
      "loss": 0.0465,
      "step": 630
    },
    {
      "epoch": 0.09681567203691098,
      "grad_norm": 0.06130633130669594,
      "learning_rate": 0.00019744,
      "loss": 0.0509,
      "step": 640
    },
    {
      "epoch": 0.09832841691248771,
      "grad_norm": 0.08208902925252914,
      "learning_rate": 0.0001974,
      "loss": 0.0549,
      "step": 650
    },
    {
      "epoch": 0.09984116178806444,
      "grad_norm": 0.08106379210948944,
      "learning_rate": 0.00019736000000000002,
      "loss": 0.0584,
      "step": 660
    },
    {
      "epoch": 0.10135390666364118,
      "grad_norm": 0.08364614844322205,
      "learning_rate": 0.00019732000000000001,
      "loss": 0.0543,
      "step": 670
    },
    {
      "epoch": 0.10286665153921791,
      "grad_norm": 0.06432674080133438,
      "learning_rate": 0.00019728,
      "loss": 0.0535,
      "step": 680
    },
    {
      "epoch": 0.10437939641479464,
      "grad_norm": 0.07217614352703094,
      "learning_rate": 0.00019724,
      "loss": 0.0521,
      "step": 690
    },
    {
      "epoch": 0.10589214129037137,
      "grad_norm": 0.06074230372905731,
      "learning_rate": 0.0001972,
      "loss": 0.0545,
      "step": 700
    },
    {
      "epoch": 0.10740488616594811,
      "grad_norm": 0.04888018220663071,
      "learning_rate": 0.00019716000000000002,
      "loss": 0.0445,
      "step": 710
    },
    {
      "epoch": 0.10891763104152484,
      "grad_norm": 0.07705683261156082,
      "learning_rate": 0.00019712,
      "loss": 0.0491,
      "step": 720
    },
    {
      "epoch": 0.11043037591710159,
      "grad_norm": 0.06741231679916382,
      "learning_rate": 0.00019708000000000003,
      "loss": 0.053,
      "step": 730
    },
    {
      "epoch": 0.11194312079267832,
      "grad_norm": 0.0673738569021225,
      "learning_rate": 0.00019704,
      "loss": 0.0473,
      "step": 740
    },
    {
      "epoch": 0.11345586566825505,
      "grad_norm": 0.06236235797405243,
      "learning_rate": 0.00019700000000000002,
      "loss": 0.0538,
      "step": 750
    },
    {
      "epoch": 0.11496861054383178,
      "grad_norm": 0.0538531057536602,
      "learning_rate": 0.00019696,
      "loss": 0.0414,
      "step": 760
    },
    {
      "epoch": 0.11648135541940852,
      "grad_norm": 0.09818791598081589,
      "learning_rate": 0.00019692,
      "loss": 0.0551,
      "step": 770
    },
    {
      "epoch": 0.11799410029498525,
      "grad_norm": 0.06459952145814896,
      "learning_rate": 0.00019688000000000003,
      "loss": 0.0543,
      "step": 780
    },
    {
      "epoch": 0.11950684517056198,
      "grad_norm": 0.09495878219604492,
      "learning_rate": 0.00019684,
      "loss": 0.0566,
      "step": 790
    },
    {
      "epoch": 0.12101959004613871,
      "grad_norm": 0.06249309703707695,
      "learning_rate": 0.0001968,
      "loss": 0.0492,
      "step": 800
    },
    {
      "epoch": 0.12101959004613871,
      "eval_cer": 0.0030890735373690806,
      "eval_loss": 0.046879783272743225,
      "eval_runtime": 10443.0859,
      "eval_samples_per_second": 2.016,
      "eval_steps_per_second": 0.252,
      "step": 800
    },
    {
      "epoch": 0.12253233492171545,
      "grad_norm": 0.06483816355466843,
      "learning_rate": 0.00019676,
      "loss": 0.048,
      "step": 810
    },
    {
      "epoch": 0.1240450797972922,
      "grad_norm": 0.05618014931678772,
      "learning_rate": 0.00019672000000000003,
      "loss": 0.0484,
      "step": 820
    },
    {
      "epoch": 0.1255578246728689,
      "grad_norm": 0.07441507279872894,
      "learning_rate": 0.00019668000000000002,
      "loss": 0.0548,
      "step": 830
    },
    {
      "epoch": 0.12707056954844564,
      "grad_norm": 0.05274181067943573,
      "learning_rate": 0.00019664000000000001,
      "loss": 0.0619,
      "step": 840
    },
    {
      "epoch": 0.12858331442402238,
      "grad_norm": 0.06264190375804901,
      "learning_rate": 0.0001966,
      "loss": 0.0525,
      "step": 850
    },
    {
      "epoch": 0.1300960592995991,
      "grad_norm": 0.07662319391965866,
      "learning_rate": 0.00019656,
      "loss": 0.0532,
      "step": 860
    },
    {
      "epoch": 0.13160880417517587,
      "grad_norm": 0.06203316152095795,
      "learning_rate": 0.00019652000000000002,
      "loss": 0.0525,
      "step": 870
    },
    {
      "epoch": 0.1331215490507526,
      "grad_norm": 0.1326906681060791,
      "learning_rate": 0.00019648000000000002,
      "loss": 0.0539,
      "step": 880
    },
    {
      "epoch": 0.13463429392632933,
      "grad_norm": 0.10350421816110611,
      "learning_rate": 0.00019644,
      "loss": 0.0556,
      "step": 890
    },
    {
      "epoch": 0.13614703880190607,
      "grad_norm": 0.049543242901563644,
      "learning_rate": 0.0001964,
      "loss": 0.0482,
      "step": 900
    },
    {
      "epoch": 0.1376597836774828,
      "grad_norm": 0.11776097118854523,
      "learning_rate": 0.00019636000000000002,
      "loss": 0.0538,
      "step": 910
    },
    {
      "epoch": 0.13917252855305953,
      "grad_norm": 0.05535553768277168,
      "learning_rate": 0.00019632000000000002,
      "loss": 0.052,
      "step": 920
    },
    {
      "epoch": 0.14068527342863626,
      "grad_norm": 0.05945896357297897,
      "learning_rate": 0.00019628,
      "loss": 0.0491,
      "step": 930
    },
    {
      "epoch": 0.142198018304213,
      "grad_norm": 0.1228972002863884,
      "learning_rate": 0.00019624,
      "loss": 0.0511,
      "step": 940
    },
    {
      "epoch": 0.14371076317978973,
      "grad_norm": 0.08868791162967682,
      "learning_rate": 0.0001962,
      "loss": 0.057,
      "step": 950
    },
    {
      "epoch": 0.14522350805536646,
      "grad_norm": 0.07960449159145355,
      "learning_rate": 0.00019616000000000002,
      "loss": 0.0514,
      "step": 960
    },
    {
      "epoch": 0.1467362529309432,
      "grad_norm": 0.06392108649015427,
      "learning_rate": 0.00019612,
      "loss": 0.0558,
      "step": 970
    },
    {
      "epoch": 0.14824899780651993,
      "grad_norm": 0.07048727571964264,
      "learning_rate": 0.00019608,
      "loss": 0.053,
      "step": 980
    },
    {
      "epoch": 0.14976174268209666,
      "grad_norm": 0.10491488873958588,
      "learning_rate": 0.00019604,
      "loss": 0.0489,
      "step": 990
    },
    {
      "epoch": 0.1512744875576734,
      "grad_norm": 0.059835776686668396,
      "learning_rate": 0.000196,
      "loss": 0.0474,
      "step": 1000
    },
    {
      "epoch": 0.1512744875576734,
      "eval_cer": 0.4367181574025345,
      "eval_loss": 0.04569260776042938,
      "eval_runtime": 10457.5718,
      "eval_samples_per_second": 2.013,
      "eval_steps_per_second": 0.252,
      "step": 1000
    },
    {
      "epoch": 0.15278723243325013,
      "grad_norm": 0.07570289075374603,
      "learning_rate": 0.00019596000000000001,
      "loss": 0.0522,
      "step": 1010
    },
    {
      "epoch": 0.15429997730882686,
      "grad_norm": 0.09082864969968796,
      "learning_rate": 0.00019592,
      "loss": 0.0516,
      "step": 1020
    },
    {
      "epoch": 0.1558127221844036,
      "grad_norm": 0.06894449889659882,
      "learning_rate": 0.00019588000000000003,
      "loss": 0.0489,
      "step": 1030
    },
    {
      "epoch": 0.15732546705998032,
      "grad_norm": 0.05989064276218414,
      "learning_rate": 0.00019584,
      "loss": 0.0514,
      "step": 1040
    },
    {
      "epoch": 0.15883821193555706,
      "grad_norm": 0.060047443956136703,
      "learning_rate": 0.00019580000000000002,
      "loss": 0.047,
      "step": 1050
    },
    {
      "epoch": 0.16035095681113382,
      "grad_norm": 0.06459174305200577,
      "learning_rate": 0.00019576,
      "loss": 0.0532,
      "step": 1060
    },
    {
      "epoch": 0.16186370168671055,
      "grad_norm": 0.061583805829286575,
      "learning_rate": 0.00019572,
      "loss": 0.0485,
      "step": 1070
    },
    {
      "epoch": 0.16337644656228728,
      "grad_norm": 0.060534268617630005,
      "learning_rate": 0.00019568000000000002,
      "loss": 0.0468,
      "step": 1080
    },
    {
      "epoch": 0.164889191437864,
      "grad_norm": 0.06731607764959335,
      "learning_rate": 0.00019564,
      "loss": 0.0481,
      "step": 1090
    },
    {
      "epoch": 0.16640193631344075,
      "grad_norm": 0.0757998675107956,
      "learning_rate": 0.0001956,
      "loss": 0.056,
      "step": 1100
    },
    {
      "epoch": 0.16791468118901748,
      "grad_norm": 0.08009450882673264,
      "learning_rate": 0.00019556,
      "loss": 0.0523,
      "step": 1110
    },
    {
      "epoch": 0.1694274260645942,
      "grad_norm": 2.663090944290161,
      "learning_rate": 0.00019552000000000003,
      "loss": 0.1404,
      "step": 1120
    },
    {
      "epoch": 0.17094017094017094,
      "grad_norm": 14.877944946289062,
      "learning_rate": 0.00019548000000000002,
      "loss": 0.1442,
      "step": 1130
    },
    {
      "epoch": 0.17245291581574768,
      "grad_norm": 2.8173887729644775,
      "learning_rate": 0.000195448,
      "loss": 0.5461,
      "step": 1140
    },
    {
      "epoch": 0.1739656606913244,
      "grad_norm": 9.367515563964844,
      "learning_rate": 0.00019540800000000002,
      "loss": 0.2832,
      "step": 1150
    },
    {
      "epoch": 0.17547840556690114,
      "grad_norm": 0.34991636872291565,
      "learning_rate": 0.00019536800000000002,
      "loss": 0.1497,
      "step": 1160
    },
    {
      "epoch": 0.17699115044247787,
      "grad_norm": 0.10464385151863098,
      "learning_rate": 0.000195328,
      "loss": 0.0686,
      "step": 1170
    },
    {
      "epoch": 0.1785038953180546,
      "grad_norm": 0.8961012363433838,
      "learning_rate": 0.000195288,
      "loss": 0.0822,
      "step": 1180
    },
    {
      "epoch": 0.18001664019363134,
      "grad_norm": 8.467473983764648,
      "learning_rate": 0.000195248,
      "loss": 0.0949,
      "step": 1190
    },
    {
      "epoch": 0.18152938506920807,
      "grad_norm": 0.08059060573577881,
      "learning_rate": 0.00019520800000000002,
      "loss": 0.0552,
      "step": 1200
    },
    {
      "epoch": 0.18152938506920807,
      "eval_cer": 0.0833932493767496,
      "eval_loss": 0.04637393727898598,
      "eval_runtime": 10459.5021,
      "eval_samples_per_second": 2.013,
      "eval_steps_per_second": 0.252,
      "step": 1200
    },
    {
      "epoch": 0.1830421299447848,
      "grad_norm": 0.08795847743749619,
      "learning_rate": 0.000195168,
      "loss": 0.055,
      "step": 1210
    },
    {
      "epoch": 0.18455487482036154,
      "grad_norm": 0.10272721946239471,
      "learning_rate": 0.000195128,
      "loss": 0.0557,
      "step": 1220
    },
    {
      "epoch": 0.18606761969593827,
      "grad_norm": 0.23404774069786072,
      "learning_rate": 0.000195088,
      "loss": 0.0611,
      "step": 1230
    },
    {
      "epoch": 0.187580364571515,
      "grad_norm": 0.2968621253967285,
      "learning_rate": 0.00019504800000000002,
      "loss": 0.0817,
      "step": 1240
    },
    {
      "epoch": 0.18909310944709176,
      "grad_norm": 0.08634278923273087,
      "learning_rate": 0.00019500800000000001,
      "loss": 0.0685,
      "step": 1250
    },
    {
      "epoch": 0.1906058543226685,
      "grad_norm": 0.11241244524717331,
      "learning_rate": 0.000194968,
      "loss": 0.0563,
      "step": 1260
    },
    {
      "epoch": 0.19211859919824523,
      "grad_norm": 0.17380298674106598,
      "learning_rate": 0.000194928,
      "loss": 0.065,
      "step": 1270
    },
    {
      "epoch": 0.19363134407382196,
      "grad_norm": 0.13615791499614716,
      "learning_rate": 0.000194888,
      "loss": 0.0667,
      "step": 1280
    },
    {
      "epoch": 0.1951440889493987,
      "grad_norm": 0.0854301005601883,
      "learning_rate": 0.00019484800000000002,
      "loss": 0.0507,
      "step": 1290
    },
    {
      "epoch": 0.19665683382497542,
      "grad_norm": 0.08915933966636658,
      "learning_rate": 0.000194808,
      "loss": 0.0561,
      "step": 1300
    },
    {
      "epoch": 0.19816957870055216,
      "grad_norm": 0.09583040326833725,
      "learning_rate": 0.00019476800000000003,
      "loss": 0.0514,
      "step": 1310
    },
    {
      "epoch": 0.1996823235761289,
      "grad_norm": 0.09624961763620377,
      "learning_rate": 0.000194728,
      "loss": 0.052,
      "step": 1320
    },
    {
      "epoch": 0.20119506845170562,
      "grad_norm": 0.05612370744347572,
      "learning_rate": 0.00019468800000000002,
      "loss": 0.0471,
      "step": 1330
    },
    {
      "epoch": 0.20270781332728235,
      "grad_norm": 0.0653730109333992,
      "learning_rate": 0.000194648,
      "loss": 0.0521,
      "step": 1340
    },
    {
      "epoch": 0.2042205582028591,
      "grad_norm": 0.07432978600263596,
      "learning_rate": 0.000194608,
      "loss": 0.0577,
      "step": 1350
    },
    {
      "epoch": 0.20573330307843582,
      "grad_norm": 0.05863150209188461,
      "learning_rate": 0.00019456800000000003,
      "loss": 0.0435,
      "step": 1360
    },
    {
      "epoch": 0.20724604795401255,
      "grad_norm": 0.056969739496707916,
      "learning_rate": 0.000194528,
      "loss": 0.0502,
      "step": 1370
    },
    {
      "epoch": 0.20875879282958928,
      "grad_norm": 0.10658754408359528,
      "learning_rate": 0.000194488,
      "loss": 0.0469,
      "step": 1380
    },
    {
      "epoch": 0.21027153770516602,
      "grad_norm": 0.06535681337118149,
      "learning_rate": 0.000194448,
      "loss": 0.0519,
      "step": 1390
    },
    {
      "epoch": 0.21178428258074275,
      "grad_norm": 0.08987314254045486,
      "learning_rate": 0.000194408,
      "loss": 0.0482,
      "step": 1400
    },
    {
      "epoch": 0.21178428258074275,
      "eval_cer": 0.14607469615771385,
      "eval_loss": 0.04351452365517616,
      "eval_runtime": 10473.9712,
      "eval_samples_per_second": 2.01,
      "eval_steps_per_second": 0.251,
      "step": 1400
    },
    {
      "epoch": 0.21329702745631948,
      "grad_norm": 0.09238473325967789,
      "learning_rate": 0.00019436800000000002,
      "loss": 0.0483,
      "step": 1410
    },
    {
      "epoch": 0.21480977233189621,
      "grad_norm": 0.10443761199712753,
      "learning_rate": 0.000194328,
      "loss": 0.054,
      "step": 1420
    },
    {
      "epoch": 0.21632251720747295,
      "grad_norm": 0.0742131844162941,
      "learning_rate": 0.000194288,
      "loss": 0.0507,
      "step": 1430
    },
    {
      "epoch": 0.21783526208304968,
      "grad_norm": 0.09358492493629456,
      "learning_rate": 0.000194248,
      "loss": 0.0496,
      "step": 1440
    },
    {
      "epoch": 0.21934800695862644,
      "grad_norm": 0.07695715129375458,
      "learning_rate": 0.00019420800000000002,
      "loss": 0.046,
      "step": 1450
    },
    {
      "epoch": 0.22086075183420317,
      "grad_norm": 0.07772234827280045,
      "learning_rate": 0.00019416800000000002,
      "loss": 0.0468,
      "step": 1460
    },
    {
      "epoch": 0.2223734967097799,
      "grad_norm": 0.04500894993543625,
      "learning_rate": 0.000194128,
      "loss": 0.0428,
      "step": 1470
    },
    {
      "epoch": 0.22388624158535664,
      "grad_norm": 0.08258084207773209,
      "learning_rate": 0.000194088,
      "loss": 0.0542,
      "step": 1480
    },
    {
      "epoch": 0.22539898646093337,
      "grad_norm": 0.06530752032995224,
      "learning_rate": 0.000194048,
      "loss": 0.0477,
      "step": 1490
    },
    {
      "epoch": 0.2269117313365101,
      "grad_norm": 0.06770725548267365,
      "learning_rate": 0.00019400800000000002,
      "loss": 0.052,
      "step": 1500
    },
    {
      "epoch": 0.22842447621208684,
      "grad_norm": 0.04499737173318863,
      "learning_rate": 0.000193968,
      "loss": 0.0392,
      "step": 1510
    },
    {
      "epoch": 0.22993722108766357,
      "grad_norm": 0.0594199039041996,
      "learning_rate": 0.000193928,
      "loss": 0.0469,
      "step": 1520
    },
    {
      "epoch": 0.2314499659632403,
      "grad_norm": 0.05143499746918678,
      "learning_rate": 0.000193888,
      "loss": 0.0384,
      "step": 1530
    },
    {
      "epoch": 0.23296271083881703,
      "grad_norm": 0.05464276298880577,
      "learning_rate": 0.00019384800000000002,
      "loss": 0.0479,
      "step": 1540
    },
    {
      "epoch": 0.23447545571439377,
      "grad_norm": 0.0698809027671814,
      "learning_rate": 0.000193808,
      "loss": 0.0493,
      "step": 1550
    },
    {
      "epoch": 0.2359882005899705,
      "grad_norm": 0.059237249195575714,
      "learning_rate": 0.000193768,
      "loss": 0.0493,
      "step": 1560
    },
    {
      "epoch": 0.23750094546554723,
      "grad_norm": 0.08654357492923737,
      "learning_rate": 0.000193728,
      "loss": 0.0481,
      "step": 1570
    },
    {
      "epoch": 0.23901369034112396,
      "grad_norm": 0.19063305854797363,
      "learning_rate": 0.000193688,
      "loss": 0.051,
      "step": 1580
    },
    {
      "epoch": 0.2405264352167007,
      "grad_norm": 0.08095410466194153,
      "learning_rate": 0.000193648,
      "loss": 0.0447,
      "step": 1590
    },
    {
      "epoch": 0.24203918009227743,
      "grad_norm": 0.056007932871580124,
      "learning_rate": 0.000193608,
      "loss": 0.0431,
      "step": 1600
    },
    {
      "epoch": 0.24203918009227743,
      "eval_cer": 0.1667197881072213,
      "eval_loss": 0.04373455420136452,
      "eval_runtime": 10595.1515,
      "eval_samples_per_second": 1.987,
      "eval_steps_per_second": 0.248,
      "step": 1600
    },
    {
      "epoch": 0.24355192496785416,
      "grad_norm": 0.06981740891933441,
      "learning_rate": 0.00019356800000000003,
      "loss": 0.0442,
      "step": 1610
    },
    {
      "epoch": 0.2450646698434309,
      "grad_norm": 0.10189545899629593,
      "learning_rate": 0.000193528,
      "loss": 0.0477,
      "step": 1620
    },
    {
      "epoch": 0.24657741471900763,
      "grad_norm": 0.06565351039171219,
      "learning_rate": 0.00019348800000000002,
      "loss": 0.0532,
      "step": 1630
    },
    {
      "epoch": 0.2480901595945844,
      "grad_norm": 0.06872796267271042,
      "learning_rate": 0.000193448,
      "loss": 0.0472,
      "step": 1640
    },
    {
      "epoch": 0.24960290447016112,
      "grad_norm": 0.06040889397263527,
      "learning_rate": 0.000193408,
      "loss": 0.0463,
      "step": 1650
    },
    {
      "epoch": 0.2511156493457378,
      "grad_norm": 0.08789139986038208,
      "learning_rate": 0.00019336800000000002,
      "loss": 0.0495,
      "step": 1660
    },
    {
      "epoch": 0.25262839422131456,
      "grad_norm": 0.0869157686829567,
      "learning_rate": 0.00019332800000000002,
      "loss": 0.0491,
      "step": 1670
    },
    {
      "epoch": 0.2541411390968913,
      "grad_norm": 0.06886725127696991,
      "learning_rate": 0.000193288,
      "loss": 0.0508,
      "step": 1680
    },
    {
      "epoch": 0.255653883972468,
      "grad_norm": 0.06138046458363533,
      "learning_rate": 0.000193248,
      "loss": 0.0435,
      "step": 1690
    },
    {
      "epoch": 0.25716662884804475,
      "grad_norm": 0.05554139241576195,
      "learning_rate": 0.00019320800000000002,
      "loss": 0.0483,
      "step": 1700
    },
    {
      "epoch": 0.2586793737236215,
      "grad_norm": 0.06712419539690018,
      "learning_rate": 0.00019316800000000002,
      "loss": 0.0545,
      "step": 1710
    },
    {
      "epoch": 0.2601921185991982,
      "grad_norm": 0.07289120554924011,
      "learning_rate": 0.000193128,
      "loss": 0.0481,
      "step": 1720
    },
    {
      "epoch": 0.261704863474775,
      "grad_norm": 0.07003842294216156,
      "learning_rate": 0.000193088,
      "loss": 0.0493,
      "step": 1730
    },
    {
      "epoch": 0.26321760835035174,
      "grad_norm": 0.06333723664283752,
      "learning_rate": 0.000193048,
      "loss": 0.0536,
      "step": 1740
    },
    {
      "epoch": 0.26473035322592847,
      "grad_norm": 0.0609460324048996,
      "learning_rate": 0.00019300800000000002,
      "loss": 0.0516,
      "step": 1750
    },
    {
      "epoch": 0.2662430981015052,
      "grad_norm": 0.14176234602928162,
      "learning_rate": 0.000192968,
      "loss": 0.0522,
      "step": 1760
    },
    {
      "epoch": 0.26775584297708194,
      "grad_norm": 0.09526730328798294,
      "learning_rate": 0.000192928,
      "loss": 0.0468,
      "step": 1770
    },
    {
      "epoch": 0.26926858785265867,
      "grad_norm": 0.05794398859143257,
      "learning_rate": 0.000192888,
      "loss": 0.051,
      "step": 1780
    },
    {
      "epoch": 0.2707813327282354,
      "grad_norm": 0.07408788055181503,
      "learning_rate": 0.000192848,
      "loss": 0.0482,
      "step": 1790
    },
    {
      "epoch": 0.27229407760381213,
      "grad_norm": 0.07873456180095673,
      "learning_rate": 0.00019280800000000001,
      "loss": 0.0576,
      "step": 1800
    },
    {
      "epoch": 0.27229407760381213,
      "eval_cer": 0.28151275038111545,
      "eval_loss": 0.042666129767894745,
      "eval_runtime": 10460.0372,
      "eval_samples_per_second": 2.013,
      "eval_steps_per_second": 0.252,
      "step": 1800
    },
    {
      "epoch": 0.27380682247938887,
      "grad_norm": 0.06786733120679855,
      "learning_rate": 0.000192768,
      "loss": 0.0505,
      "step": 1810
    },
    {
      "epoch": 0.2753195673549656,
      "grad_norm": 0.090096116065979,
      "learning_rate": 0.00019272800000000003,
      "loss": 0.0458,
      "step": 1820
    },
    {
      "epoch": 0.27683231223054233,
      "grad_norm": 0.058033574372529984,
      "learning_rate": 0.000192688,
      "loss": 0.0415,
      "step": 1830
    },
    {
      "epoch": 0.27834505710611906,
      "grad_norm": 0.09522871673107147,
      "learning_rate": 0.00019264800000000002,
      "loss": 0.0456,
      "step": 1840
    },
    {
      "epoch": 0.2798578019816958,
      "grad_norm": 0.06533698737621307,
      "learning_rate": 0.000192608,
      "loss": 0.045,
      "step": 1850
    },
    {
      "epoch": 0.28137054685727253,
      "grad_norm": 0.07162319868803024,
      "learning_rate": 0.000192568,
      "loss": 0.0511,
      "step": 1860
    },
    {
      "epoch": 0.28288329173284926,
      "grad_norm": 0.06015852093696594,
      "learning_rate": 0.00019252800000000002,
      "loss": 0.0453,
      "step": 1870
    },
    {
      "epoch": 0.284396036608426,
      "grad_norm": 0.0789792612195015,
      "learning_rate": 0.000192488,
      "loss": 0.0498,
      "step": 1880
    },
    {
      "epoch": 0.2859087814840027,
      "grad_norm": 0.05619093030691147,
      "learning_rate": 0.000192448,
      "loss": 0.0454,
      "step": 1890
    },
    {
      "epoch": 0.28742152635957946,
      "grad_norm": 0.061943668872117996,
      "learning_rate": 0.000192408,
      "loss": 0.0496,
      "step": 1900
    },
    {
      "epoch": 0.2889342712351562,
      "grad_norm": 0.07192958891391754,
      "learning_rate": 0.00019236800000000003,
      "loss": 0.05,
      "step": 1910
    },
    {
      "epoch": 0.2904470161107329,
      "grad_norm": 0.07053862512111664,
      "learning_rate": 0.00019232800000000002,
      "loss": 0.0504,
      "step": 1920
    },
    {
      "epoch": 0.29195976098630966,
      "grad_norm": 0.06491555273532867,
      "learning_rate": 0.000192288,
      "loss": 0.0478,
      "step": 1930
    },
    {
      "epoch": 0.2934725058618864,
      "grad_norm": 0.06389233469963074,
      "learning_rate": 0.000192248,
      "loss": 0.0469,
      "step": 1940
    },
    {
      "epoch": 0.2949852507374631,
      "grad_norm": 0.06336333602666855,
      "learning_rate": 0.000192208,
      "loss": 0.0472,
      "step": 1950
    },
    {
      "epoch": 0.29649799561303986,
      "grad_norm": 0.06351201981306076,
      "learning_rate": 0.00019216800000000002,
      "loss": 0.0459,
      "step": 1960
    },
    {
      "epoch": 0.2980107404886166,
      "grad_norm": 0.0773550271987915,
      "learning_rate": 0.00019212800000000001,
      "loss": 0.0435,
      "step": 1970
    },
    {
      "epoch": 0.2995234853641933,
      "grad_norm": 0.07999245822429657,
      "learning_rate": 0.000192088,
      "loss": 0.051,
      "step": 1980
    },
    {
      "epoch": 0.30103623023977005,
      "grad_norm": 0.05664638802409172,
      "learning_rate": 0.000192048,
      "loss": 0.0493,
      "step": 1990
    },
    {
      "epoch": 0.3025489751153468,
      "grad_norm": 0.050149012356996536,
      "learning_rate": 0.00019200800000000002,
      "loss": 0.0491,
      "step": 2000
    },
    {
      "epoch": 0.3025489751153468,
      "eval_cer": 0.10787543886957575,
      "eval_loss": 0.042158011347055435,
      "eval_runtime": 10458.1763,
      "eval_samples_per_second": 2.013,
      "eval_steps_per_second": 0.252,
      "step": 2000
    },
    {
      "epoch": 0.3040617199909235,
      "grad_norm": 0.06383787840604782,
      "learning_rate": 0.00019196800000000002,
      "loss": 0.0421,
      "step": 2010
    },
    {
      "epoch": 0.30557446486650025,
      "grad_norm": 0.05740641430020332,
      "learning_rate": 0.000191928,
      "loss": 0.0499,
      "step": 2020
    },
    {
      "epoch": 0.307087209742077,
      "grad_norm": 0.07163075357675552,
      "learning_rate": 0.000191888,
      "loss": 0.0431,
      "step": 2030
    },
    {
      "epoch": 0.3085999546176537,
      "grad_norm": 0.05976075306534767,
      "learning_rate": 0.000191848,
      "loss": 0.0476,
      "step": 2040
    },
    {
      "epoch": 0.31011269949323045,
      "grad_norm": 0.0871894434094429,
      "learning_rate": 0.00019180800000000002,
      "loss": 0.0449,
      "step": 2050
    },
    {
      "epoch": 0.3116254443688072,
      "grad_norm": 0.07474277913570404,
      "learning_rate": 0.000191768,
      "loss": 0.0422,
      "step": 2060
    },
    {
      "epoch": 0.3131381892443839,
      "grad_norm": 0.05594407767057419,
      "learning_rate": 0.00019172800000000003,
      "loss": 0.0479,
      "step": 2070
    },
    {
      "epoch": 0.31465093411996065,
      "grad_norm": 0.06565164029598236,
      "learning_rate": 0.000191688,
      "loss": 0.0501,
      "step": 2080
    },
    {
      "epoch": 0.3161636789955374,
      "grad_norm": 0.07224603742361069,
      "learning_rate": 0.000191648,
      "loss": 0.0474,
      "step": 2090
    },
    {
      "epoch": 0.3176764238711141,
      "grad_norm": 0.07781083881855011,
      "learning_rate": 0.000191608,
      "loss": 0.0401,
      "step": 2100
    },
    {
      "epoch": 0.31918916874669084,
      "grad_norm": 0.08147955685853958,
      "learning_rate": 0.000191568,
      "loss": 0.0486,
      "step": 2110
    },
    {
      "epoch": 0.32070191362226763,
      "grad_norm": 0.05572337657213211,
      "learning_rate": 0.00019152800000000003,
      "loss": 0.0488,
      "step": 2120
    },
    {
      "epoch": 0.32221465849784436,
      "grad_norm": 0.06601813435554504,
      "learning_rate": 0.000191488,
      "loss": 0.0466,
      "step": 2130
    },
    {
      "epoch": 0.3237274033734211,
      "grad_norm": 0.057904861867427826,
      "learning_rate": 0.00019144800000000001,
      "loss": 0.0479,
      "step": 2140
    },
    {
      "epoch": 0.32524014824899783,
      "grad_norm": 0.057231709361076355,
      "learning_rate": 0.000191408,
      "loss": 0.0522,
      "step": 2150
    },
    {
      "epoch": 0.32675289312457456,
      "grad_norm": 0.08306867629289627,
      "learning_rate": 0.000191368,
      "loss": 0.0439,
      "step": 2160
    },
    {
      "epoch": 0.3282656380001513,
      "grad_norm": 0.0742512047290802,
      "learning_rate": 0.00019132800000000002,
      "loss": 0.0434,
      "step": 2170
    },
    {
      "epoch": 0.329778382875728,
      "grad_norm": 0.07260335236787796,
      "learning_rate": 0.000191288,
      "loss": 0.0505,
      "step": 2180
    },
    {
      "epoch": 0.33129112775130476,
      "grad_norm": 0.07398936152458191,
      "learning_rate": 0.000191248,
      "loss": 0.0519,
      "step": 2190
    },
    {
      "epoch": 0.3328038726268815,
      "grad_norm": 0.069728784263134,
      "learning_rate": 0.000191208,
      "loss": 0.0501,
      "step": 2200
    },
    {
      "epoch": 0.3328038726268815,
      "eval_cer": 0.07287520414693144,
      "eval_loss": 0.041937489062547684,
      "eval_runtime": 10449.7877,
      "eval_samples_per_second": 2.015,
      "eval_steps_per_second": 0.252,
      "step": 2200
    },
    {
      "epoch": 0.3343166175024582,
      "grad_norm": 0.07778773456811905,
      "learning_rate": 0.00019116800000000002,
      "loss": 0.0485,
      "step": 2210
    },
    {
      "epoch": 0.33582936237803496,
      "grad_norm": 0.08489017933607101,
      "learning_rate": 0.00019112800000000002,
      "loss": 0.047,
      "step": 2220
    },
    {
      "epoch": 0.3373421072536117,
      "grad_norm": 0.0746629610657692,
      "learning_rate": 0.000191088,
      "loss": 0.0444,
      "step": 2230
    },
    {
      "epoch": 0.3388548521291884,
      "grad_norm": 0.07858649641275406,
      "learning_rate": 0.000191048,
      "loss": 0.0537,
      "step": 2240
    },
    {
      "epoch": 0.34036759700476515,
      "grad_norm": 0.08357574045658112,
      "learning_rate": 0.000191008,
      "loss": 0.054,
      "step": 2250
    },
    {
      "epoch": 0.3418803418803419,
      "grad_norm": 0.05976574867963791,
      "learning_rate": 0.00019096800000000002,
      "loss": 0.0465,
      "step": 2260
    },
    {
      "epoch": 0.3433930867559186,
      "grad_norm": 0.07549616694450378,
      "learning_rate": 0.000190928,
      "loss": 0.0479,
      "step": 2270
    },
    {
      "epoch": 0.34490583163149535,
      "grad_norm": 0.07128783315420151,
      "learning_rate": 0.000190888,
      "loss": 0.0481,
      "step": 2280
    },
    {
      "epoch": 0.3464185765070721,
      "grad_norm": 0.05093182995915413,
      "learning_rate": 0.000190848,
      "loss": 0.039,
      "step": 2290
    },
    {
      "epoch": 0.3479313213826488,
      "grad_norm": 0.07213055342435837,
      "learning_rate": 0.00019080800000000002,
      "loss": 0.0486,
      "step": 2300
    },
    {
      "epoch": 0.34944406625822555,
      "grad_norm": 0.08296896517276764,
      "learning_rate": 0.00019076800000000001,
      "loss": 0.0436,
      "step": 2310
    },
    {
      "epoch": 0.3509568111338023,
      "grad_norm": 0.05904708430171013,
      "learning_rate": 0.000190728,
      "loss": 0.0457,
      "step": 2320
    },
    {
      "epoch": 0.352469556009379,
      "grad_norm": 0.07709085941314697,
      "learning_rate": 0.000190688,
      "loss": 0.0456,
      "step": 2330
    },
    {
      "epoch": 0.35398230088495575,
      "grad_norm": 0.061139535158872604,
      "learning_rate": 0.000190648,
      "loss": 0.0484,
      "step": 2340
    },
    {
      "epoch": 0.3554950457605325,
      "grad_norm": 0.11013538390398026,
      "learning_rate": 0.00019060800000000002,
      "loss": 0.0463,
      "step": 2350
    },
    {
      "epoch": 0.3570077906361092,
      "grad_norm": 0.04920123890042305,
      "learning_rate": 0.000190568,
      "loss": 0.0404,
      "step": 2360
    },
    {
      "epoch": 0.35852053551168594,
      "grad_norm": 0.05916327238082886,
      "learning_rate": 0.00019052800000000003,
      "loss": 0.0506,
      "step": 2370
    },
    {
      "epoch": 0.3600332803872627,
      "grad_norm": 0.08169171214103699,
      "learning_rate": 0.000190488,
      "loss": 0.0422,
      "step": 2380
    },
    {
      "epoch": 0.3615460252628394,
      "grad_norm": 0.07195686548948288,
      "learning_rate": 0.00019044800000000002,
      "loss": 0.0476,
      "step": 2390
    },
    {
      "epoch": 0.36305877013841614,
      "grad_norm": 0.06132512912154198,
      "learning_rate": 0.000190408,
      "loss": 0.0451,
      "step": 2400
    },
    {
      "epoch": 0.36305877013841614,
      "eval_cer": 0.22885396051223894,
      "eval_loss": 0.04164993762969971,
      "eval_runtime": 10444.7845,
      "eval_samples_per_second": 2.016,
      "eval_steps_per_second": 0.252,
      "step": 2400
    },
    {
      "epoch": 0.3645715150139929,
      "grad_norm": 0.06889329850673676,
      "learning_rate": 0.000190368,
      "loss": 0.0536,
      "step": 2410
    },
    {
      "epoch": 0.3660842598895696,
      "grad_norm": 0.06513672322034836,
      "learning_rate": 0.00019032800000000002,
      "loss": 0.0472,
      "step": 2420
    },
    {
      "epoch": 0.36759700476514634,
      "grad_norm": 0.06588304787874222,
      "learning_rate": 0.000190288,
      "loss": 0.046,
      "step": 2430
    },
    {
      "epoch": 0.3691097496407231,
      "grad_norm": 0.07162468135356903,
      "learning_rate": 0.000190248,
      "loss": 0.0444,
      "step": 2440
    },
    {
      "epoch": 0.3706224945162998,
      "grad_norm": 0.05831474810838699,
      "learning_rate": 0.000190208,
      "loss": 0.0448,
      "step": 2450
    },
    {
      "epoch": 0.37213523939187654,
      "grad_norm": 0.11214031279087067,
      "learning_rate": 0.000190168,
      "loss": 0.0491,
      "step": 2460
    },
    {
      "epoch": 0.37364798426745327,
      "grad_norm": 0.07672178000211716,
      "learning_rate": 0.00019012800000000002,
      "loss": 0.0489,
      "step": 2470
    },
    {
      "epoch": 0.37516072914303,
      "grad_norm": 0.07850979268550873,
      "learning_rate": 0.000190088,
      "loss": 0.047,
      "step": 2480
    },
    {
      "epoch": 0.37667347401860674,
      "grad_norm": 0.0473526194691658,
      "learning_rate": 0.000190048,
      "loss": 0.0436,
      "step": 2490
    },
    {
      "epoch": 0.3781862188941835,
      "grad_norm": 0.08313214778900146,
      "learning_rate": 0.000190008,
      "loss": 0.0457,
      "step": 2500
    },
    {
      "epoch": 0.37969896376976026,
      "grad_norm": 0.07851678878068924,
      "learning_rate": 0.00018996800000000002,
      "loss": 0.0399,
      "step": 2510
    },
    {
      "epoch": 0.381211708645337,
      "grad_norm": 0.06067463755607605,
      "learning_rate": 0.00018992800000000002,
      "loss": 0.0406,
      "step": 2520
    },
    {
      "epoch": 0.3827244535209137,
      "grad_norm": 0.07291869819164276,
      "learning_rate": 0.000189888,
      "loss": 0.0411,
      "step": 2530
    },
    {
      "epoch": 0.38423719839649045,
      "grad_norm": 0.05576318874955177,
      "learning_rate": 0.000189848,
      "loss": 0.0412,
      "step": 2540
    },
    {
      "epoch": 0.3857499432720672,
      "grad_norm": 0.05669853091239929,
      "learning_rate": 0.000189808,
      "loss": 0.0462,
      "step": 2550
    },
    {
      "epoch": 0.3872626881476439,
      "grad_norm": 0.0653596743941307,
      "learning_rate": 0.00018976800000000002,
      "loss": 0.0504,
      "step": 2560
    },
    {
      "epoch": 0.38877543302322065,
      "grad_norm": 0.07938168197870255,
      "learning_rate": 0.000189728,
      "loss": 0.0423,
      "step": 2570
    },
    {
      "epoch": 0.3902881778987974,
      "grad_norm": 0.19600598514080048,
      "learning_rate": 0.000189688,
      "loss": 0.0422,
      "step": 2580
    },
    {
      "epoch": 0.3918009227743741,
      "grad_norm": 0.08753781765699387,
      "learning_rate": 0.000189648,
      "loss": 0.0485,
      "step": 2590
    },
    {
      "epoch": 0.39331366764995085,
      "grad_norm": 0.07059615105390549,
      "learning_rate": 0.00018960800000000002,
      "loss": 0.0441,
      "step": 2600
    },
    {
      "epoch": 0.39331366764995085,
      "eval_cer": 0.12797016798729038,
      "eval_loss": 0.040877681225538254,
      "eval_runtime": 10426.9488,
      "eval_samples_per_second": 2.019,
      "eval_steps_per_second": 0.252,
      "step": 2600
    },
    {
      "epoch": 0.3948264125255276,
      "grad_norm": 0.07426866888999939,
      "learning_rate": 0.000189568,
      "loss": 0.0456,
      "step": 2610
    },
    {
      "epoch": 0.3963391574011043,
      "grad_norm": 0.05869770795106888,
      "learning_rate": 0.000189528,
      "loss": 0.047,
      "step": 2620
    },
    {
      "epoch": 0.39785190227668105,
      "grad_norm": 0.09353045374155045,
      "learning_rate": 0.000189488,
      "loss": 0.0457,
      "step": 2630
    },
    {
      "epoch": 0.3993646471522578,
      "grad_norm": 0.083396315574646,
      "learning_rate": 0.000189448,
      "loss": 0.0441,
      "step": 2640
    },
    {
      "epoch": 0.4008773920278345,
      "grad_norm": 0.0698527917265892,
      "learning_rate": 0.000189408,
      "loss": 0.0469,
      "step": 2650
    },
    {
      "epoch": 0.40239013690341124,
      "grad_norm": 0.07554033398628235,
      "learning_rate": 0.000189368,
      "loss": 0.0523,
      "step": 2660
    },
    {
      "epoch": 0.403902881778988,
      "grad_norm": 0.08026187121868134,
      "learning_rate": 0.00018932800000000003,
      "loss": 0.0492,
      "step": 2670
    },
    {
      "epoch": 0.4054156266545647,
      "grad_norm": 0.0758117213845253,
      "learning_rate": 0.000189288,
      "loss": 0.0471,
      "step": 2680
    },
    {
      "epoch": 0.40692837153014144,
      "grad_norm": 0.0716470330953598,
      "learning_rate": 0.00018924800000000001,
      "loss": 0.0401,
      "step": 2690
    },
    {
      "epoch": 0.4084411164057182,
      "grad_norm": 0.07114976644515991,
      "learning_rate": 0.000189208,
      "loss": 0.0483,
      "step": 2700
    },
    {
      "epoch": 0.4099538612812949,
      "grad_norm": 0.059242133051157,
      "learning_rate": 0.000189168,
      "loss": 0.0416,
      "step": 2710
    },
    {
      "epoch": 0.41146660615687164,
      "grad_norm": 0.07214327901601791,
      "learning_rate": 0.00018912800000000002,
      "loss": 0.0446,
      "step": 2720
    },
    {
      "epoch": 0.41297935103244837,
      "grad_norm": 0.0404672808945179,
      "learning_rate": 0.000189088,
      "loss": 0.0445,
      "step": 2730
    },
    {
      "epoch": 0.4144920959080251,
      "grad_norm": 0.06663410365581512,
      "learning_rate": 0.000189048,
      "loss": 0.0435,
      "step": 2740
    },
    {
      "epoch": 0.41600484078360184,
      "grad_norm": 0.0690486952662468,
      "learning_rate": 0.000189008,
      "loss": 0.048,
      "step": 2750
    },
    {
      "epoch": 0.41751758565917857,
      "grad_norm": 0.07034830003976822,
      "learning_rate": 0.00018896800000000002,
      "loss": 0.0423,
      "step": 2760
    },
    {
      "epoch": 0.4190303305347553,
      "grad_norm": 0.08420894294977188,
      "learning_rate": 0.00018892800000000002,
      "loss": 0.0525,
      "step": 2770
    },
    {
      "epoch": 0.42054307541033203,
      "grad_norm": 0.07617480307817459,
      "learning_rate": 0.000188888,
      "loss": 0.0492,
      "step": 2780
    },
    {
      "epoch": 0.42205582028590877,
      "grad_norm": 0.06841789186000824,
      "learning_rate": 0.000188848,
      "loss": 0.0427,
      "step": 2790
    },
    {
      "epoch": 0.4235685651614855,
      "grad_norm": 0.07013357430696487,
      "learning_rate": 0.000188808,
      "loss": 0.04,
      "step": 2800
    },
    {
      "epoch": 0.4235685651614855,
      "eval_cer": 0.26005539454405746,
      "eval_loss": 0.04089580848813057,
      "eval_runtime": 10530.3682,
      "eval_samples_per_second": 1.999,
      "eval_steps_per_second": 0.25,
      "step": 2800
    },
    {
      "epoch": 0.42508131003706223,
      "grad_norm": 0.06432001292705536,
      "learning_rate": 0.00018876800000000002,
      "loss": 0.0402,
      "step": 2810
    },
    {
      "epoch": 0.42659405491263896,
      "grad_norm": 0.06437406688928604,
      "learning_rate": 0.000188728,
      "loss": 0.0397,
      "step": 2820
    },
    {
      "epoch": 0.4281067997882157,
      "grad_norm": 0.0579422190785408,
      "learning_rate": 0.000188688,
      "loss": 0.0431,
      "step": 2830
    },
    {
      "epoch": 0.42961954466379243,
      "grad_norm": 0.0628400593996048,
      "learning_rate": 0.000188648,
      "loss": 0.0426,
      "step": 2840
    },
    {
      "epoch": 0.43113228953936916,
      "grad_norm": 0.04976367950439453,
      "learning_rate": 0.000188608,
      "loss": 0.0448,
      "step": 2850
    },
    {
      "epoch": 0.4326450344149459,
      "grad_norm": 0.07479149103164673,
      "learning_rate": 0.00018856800000000001,
      "loss": 0.0458,
      "step": 2860
    },
    {
      "epoch": 0.4341577792905226,
      "grad_norm": 0.06853318214416504,
      "learning_rate": 0.000188528,
      "loss": 0.045,
      "step": 2870
    },
    {
      "epoch": 0.43567052416609936,
      "grad_norm": 0.08534535765647888,
      "learning_rate": 0.00018848800000000003,
      "loss": 0.044,
      "step": 2880
    },
    {
      "epoch": 0.43718326904167615,
      "grad_norm": 0.05148012563586235,
      "learning_rate": 0.000188448,
      "loss": 0.0448,
      "step": 2890
    },
    {
      "epoch": 0.4386960139172529,
      "grad_norm": 0.073714479804039,
      "learning_rate": 0.00018840800000000002,
      "loss": 0.0388,
      "step": 2900
    },
    {
      "epoch": 0.4402087587928296,
      "grad_norm": 0.06875050067901611,
      "learning_rate": 0.000188368,
      "loss": 0.0476,
      "step": 2910
    },
    {
      "epoch": 0.44172150366840635,
      "grad_norm": 0.07048488408327103,
      "learning_rate": 0.000188328,
      "loss": 0.0537,
      "step": 2920
    },
    {
      "epoch": 0.4432342485439831,
      "grad_norm": 0.06159156188368797,
      "learning_rate": 0.00018828800000000002,
      "loss": 0.0523,
      "step": 2930
    },
    {
      "epoch": 0.4447469934195598,
      "grad_norm": 0.0851297378540039,
      "learning_rate": 0.000188248,
      "loss": 0.0466,
      "step": 2940
    },
    {
      "epoch": 0.44625973829513654,
      "grad_norm": 0.07920840382575989,
      "learning_rate": 0.000188208,
      "loss": 0.0434,
      "step": 2950
    },
    {
      "epoch": 0.4477724831707133,
      "grad_norm": 0.06767392158508301,
      "learning_rate": 0.000188168,
      "loss": 0.0446,
      "step": 2960
    },
    {
      "epoch": 0.44928522804629,
      "grad_norm": 0.0621979758143425,
      "learning_rate": 0.00018812800000000003,
      "loss": 0.0514,
      "step": 2970
    },
    {
      "epoch": 0.45079797292186674,
      "grad_norm": 0.06485885381698608,
      "learning_rate": 0.00018808800000000002,
      "loss": 0.0403,
      "step": 2980
    },
    {
      "epoch": 0.4523107177974435,
      "grad_norm": 0.07618974149227142,
      "learning_rate": 0.000188048,
      "loss": 0.046,
      "step": 2990
    },
    {
      "epoch": 0.4538234626730202,
      "grad_norm": 0.050627488642930984,
      "learning_rate": 0.000188008,
      "loss": 0.04,
      "step": 3000
    },
    {
      "epoch": 0.4538234626730202,
      "eval_cer": 0.027385337988253985,
      "eval_loss": 0.0410909466445446,
      "eval_runtime": 11737.0194,
      "eval_samples_per_second": 1.794,
      "eval_steps_per_second": 0.224,
      "step": 3000
    },
    {
      "epoch": 0.45533620754859694,
      "grad_norm": 0.07569224387407303,
      "learning_rate": 0.000187968,
      "loss": 0.0453,
      "step": 3010
    },
    {
      "epoch": 0.45684895242417367,
      "grad_norm": 0.06267885118722916,
      "learning_rate": 0.00018792800000000002,
      "loss": 0.0519,
      "step": 3020
    },
    {
      "epoch": 0.4583616972997504,
      "grad_norm": 0.0801217257976532,
      "learning_rate": 0.00018788800000000001,
      "loss": 0.0452,
      "step": 3030
    },
    {
      "epoch": 0.45987444217532714,
      "grad_norm": 0.06966337561607361,
      "learning_rate": 0.000187848,
      "loss": 0.0459,
      "step": 3040
    },
    {
      "epoch": 0.46138718705090387,
      "grad_norm": 0.05708028003573418,
      "learning_rate": 0.000187808,
      "loss": 0.0462,
      "step": 3050
    },
    {
      "epoch": 0.4628999319264806,
      "grad_norm": 0.06033516675233841,
      "learning_rate": 0.00018776800000000002,
      "loss": 0.0459,
      "step": 3060
    },
    {
      "epoch": 0.46441267680205733,
      "grad_norm": 0.06908197700977325,
      "learning_rate": 0.00018772800000000002,
      "loss": 0.048,
      "step": 3070
    },
    {
      "epoch": 0.46592542167763407,
      "grad_norm": 0.0723978653550148,
      "learning_rate": 0.000187688,
      "loss": 0.047,
      "step": 3080
    },
    {
      "epoch": 0.4674381665532108,
      "grad_norm": 0.06268727034330368,
      "learning_rate": 0.000187648,
      "loss": 0.0387,
      "step": 3090
    },
    {
      "epoch": 0.46895091142878753,
      "grad_norm": 0.06796183437108994,
      "learning_rate": 0.000187608,
      "loss": 0.0379,
      "step": 3100
    },
    {
      "epoch": 0.47046365630436426,
      "grad_norm": 0.08227751404047012,
      "learning_rate": 0.00018756800000000002,
      "loss": 0.0497,
      "step": 3110
    },
    {
      "epoch": 0.471976401179941,
      "grad_norm": 0.06391087174415588,
      "learning_rate": 0.000187528,
      "loss": 0.045,
      "step": 3120
    },
    {
      "epoch": 0.47348914605551773,
      "grad_norm": 0.09645809978246689,
      "learning_rate": 0.00018748800000000003,
      "loss": 0.0479,
      "step": 3130
    },
    {
      "epoch": 0.47500189093109446,
      "grad_norm": 0.07187838107347488,
      "learning_rate": 0.000187448,
      "loss": 0.0438,
      "step": 3140
    },
    {
      "epoch": 0.4765146358066712,
      "grad_norm": 0.06578271836042404,
      "learning_rate": 0.00018740800000000002,
      "loss": 0.0471,
      "step": 3150
    },
    {
      "epoch": 0.4780273806822479,
      "grad_norm": 0.06598031520843506,
      "learning_rate": 0.000187368,
      "loss": 0.0463,
      "step": 3160
    },
    {
      "epoch": 0.47954012555782466,
      "grad_norm": 0.06380560249090195,
      "learning_rate": 0.000187328,
      "loss": 0.0439,
      "step": 3170
    },
    {
      "epoch": 0.4810528704334014,
      "grad_norm": 0.05300907790660858,
      "learning_rate": 0.00018728800000000003,
      "loss": 0.0385,
      "step": 3180
    },
    {
      "epoch": 0.4825656153089781,
      "grad_norm": 0.08515879511833191,
      "learning_rate": 0.000187248,
      "loss": 0.0444,
      "step": 3190
    },
    {
      "epoch": 0.48407836018455486,
      "grad_norm": 0.0779171735048294,
      "learning_rate": 0.00018720800000000001,
      "loss": 0.0453,
      "step": 3200
    },
    {
      "epoch": 0.48407836018455486,
      "eval_cer": 0.010036246117811001,
      "eval_loss": 0.04116720333695412,
      "eval_runtime": 10575.268,
      "eval_samples_per_second": 1.991,
      "eval_steps_per_second": 0.249,
      "step": 3200
    },
    {
      "epoch": 0.4855911050601316,
      "grad_norm": 0.07719563692808151,
      "learning_rate": 0.000187168,
      "loss": 0.0516,
      "step": 3210
    },
    {
      "epoch": 0.4871038499357083,
      "grad_norm": 0.0623527429997921,
      "learning_rate": 0.000187128,
      "loss": 0.0412,
      "step": 3220
    },
    {
      "epoch": 0.48861659481128505,
      "grad_norm": 0.05286158621311188,
      "learning_rate": 0.00018708800000000002,
      "loss": 0.0433,
      "step": 3230
    },
    {
      "epoch": 0.4901293396868618,
      "grad_norm": 0.05317120626568794,
      "learning_rate": 0.000187048,
      "loss": 0.0451,
      "step": 3240
    },
    {
      "epoch": 0.4916420845624385,
      "grad_norm": 0.06447257846593857,
      "learning_rate": 0.000187008,
      "loss": 0.0552,
      "step": 3250
    },
    {
      "epoch": 0.49315482943801525,
      "grad_norm": 0.05432993173599243,
      "learning_rate": 0.000186968,
      "loss": 0.0454,
      "step": 3260
    },
    {
      "epoch": 0.49466757431359204,
      "grad_norm": 0.07853369414806366,
      "learning_rate": 0.00018692800000000002,
      "loss": 0.0513,
      "step": 3270
    },
    {
      "epoch": 0.4961803191891688,
      "grad_norm": 0.07532196491956711,
      "learning_rate": 0.00018688800000000002,
      "loss": 0.0494,
      "step": 3280
    },
    {
      "epoch": 0.4976930640647455,
      "grad_norm": 0.0591423436999321,
      "learning_rate": 0.000186848,
      "loss": 0.0406,
      "step": 3290
    },
    {
      "epoch": 0.49920580894032224,
      "grad_norm": 0.05588558688759804,
      "learning_rate": 0.000186808,
      "loss": 0.0454,
      "step": 3300
    },
    {
      "epoch": 0.5007185538158989,
      "grad_norm": 0.06208329647779465,
      "learning_rate": 0.000186768,
      "loss": 0.0379,
      "step": 3310
    },
    {
      "epoch": 0.5022312986914756,
      "grad_norm": 0.09954684972763062,
      "learning_rate": 0.00018672800000000002,
      "loss": 0.0441,
      "step": 3320
    },
    {
      "epoch": 0.5037440435670524,
      "grad_norm": 0.06522241979837418,
      "learning_rate": 0.000186688,
      "loss": 0.0435,
      "step": 3330
    },
    {
      "epoch": 0.5052567884426291,
      "grad_norm": 0.06771814823150635,
      "learning_rate": 0.000186648,
      "loss": 0.0407,
      "step": 3340
    },
    {
      "epoch": 0.5067695333182058,
      "grad_norm": 0.09186646342277527,
      "learning_rate": 0.000186608,
      "loss": 0.0468,
      "step": 3350
    },
    {
      "epoch": 0.5082822781937826,
      "grad_norm": 0.05741488188505173,
      "learning_rate": 0.00018656800000000002,
      "loss": 0.0427,
      "step": 3360
    },
    {
      "epoch": 0.5097950230693593,
      "grad_norm": 0.078957200050354,
      "learning_rate": 0.00018652800000000001,
      "loss": 0.0524,
      "step": 3370
    },
    {
      "epoch": 0.511307767944936,
      "grad_norm": 0.06480754166841507,
      "learning_rate": 0.000186488,
      "loss": 0.0491,
      "step": 3380
    },
    {
      "epoch": 0.5128205128205128,
      "grad_norm": 0.07016266882419586,
      "learning_rate": 0.000186448,
      "loss": 0.0455,
      "step": 3390
    },
    {
      "epoch": 0.5143332576960895,
      "grad_norm": 0.09549427777528763,
      "learning_rate": 0.000186408,
      "loss": 0.0435,
      "step": 3400
    },
    {
      "epoch": 0.5143332576960895,
      "eval_cer": 0.06014582453123417,
      "eval_loss": 0.040756821632385254,
      "eval_runtime": 10458.365,
      "eval_samples_per_second": 2.013,
      "eval_steps_per_second": 0.252,
      "step": 3400
    },
    {
      "epoch": 0.5158460025716662,
      "grad_norm": 0.06771855056285858,
      "learning_rate": 0.00018636800000000002,
      "loss": 0.0496,
      "step": 3410
    },
    {
      "epoch": 0.517358747447243,
      "grad_norm": 0.051270436495542526,
      "learning_rate": 0.000186328,
      "loss": 0.0376,
      "step": 3420
    },
    {
      "epoch": 0.5188714923228197,
      "grad_norm": 0.05424557998776436,
      "learning_rate": 0.00018628800000000003,
      "loss": 0.0455,
      "step": 3430
    },
    {
      "epoch": 0.5203842371983964,
      "grad_norm": 0.07000952959060669,
      "learning_rate": 0.000186248,
      "loss": 0.0494,
      "step": 3440
    },
    {
      "epoch": 0.5218969820739732,
      "grad_norm": 0.06696450710296631,
      "learning_rate": 0.00018620800000000002,
      "loss": 0.0449,
      "step": 3450
    },
    {
      "epoch": 0.52340972694955,
      "grad_norm": 0.07243742048740387,
      "learning_rate": 0.000186168,
      "loss": 0.0481,
      "step": 3460
    },
    {
      "epoch": 0.5249224718251267,
      "grad_norm": 0.07457748800516129,
      "learning_rate": 0.000186128,
      "loss": 0.0413,
      "step": 3470
    },
    {
      "epoch": 0.5264352167007035,
      "grad_norm": 0.05373325198888779,
      "learning_rate": 0.00018608800000000002,
      "loss": 0.046,
      "step": 3480
    },
    {
      "epoch": 0.5279479615762802,
      "grad_norm": 0.07769589871168137,
      "learning_rate": 0.000186048,
      "loss": 0.0443,
      "step": 3490
    },
    {
      "epoch": 0.5294607064518569,
      "grad_norm": 0.05949350818991661,
      "learning_rate": 0.000186008,
      "loss": 0.0426,
      "step": 3500
    },
    {
      "epoch": 0.5309734513274337,
      "grad_norm": 0.08557622879743576,
      "learning_rate": 0.000185968,
      "loss": 0.0436,
      "step": 3510
    },
    {
      "epoch": 0.5324861962030104,
      "grad_norm": 0.07504332065582275,
      "learning_rate": 0.00018592800000000003,
      "loss": 0.045,
      "step": 3520
    },
    {
      "epoch": 0.5339989410785871,
      "grad_norm": 0.08510497957468033,
      "learning_rate": 0.00018588800000000002,
      "loss": 0.0451,
      "step": 3530
    },
    {
      "epoch": 0.5355116859541639,
      "grad_norm": 0.06645802408456802,
      "learning_rate": 0.000185848,
      "loss": 0.0459,
      "step": 3540
    },
    {
      "epoch": 0.5370244308297406,
      "grad_norm": 0.05905970185995102,
      "learning_rate": 0.000185808,
      "loss": 0.0431,
      "step": 3550
    },
    {
      "epoch": 0.5385371757053173,
      "grad_norm": 0.059341125190258026,
      "learning_rate": 0.000185768,
      "loss": 0.0521,
      "step": 3560
    },
    {
      "epoch": 0.5400499205808941,
      "grad_norm": 0.07676515728235245,
      "learning_rate": 0.00018572800000000002,
      "loss": 0.0446,
      "step": 3570
    },
    {
      "epoch": 0.5415626654564708,
      "grad_norm": 0.05860384181141853,
      "learning_rate": 0.00018568800000000002,
      "loss": 0.041,
      "step": 3580
    },
    {
      "epoch": 0.5430754103320475,
      "grad_norm": 0.07133147865533829,
      "learning_rate": 0.000185648,
      "loss": 0.0479,
      "step": 3590
    },
    {
      "epoch": 0.5445881552076243,
      "grad_norm": 0.058478474617004395,
      "learning_rate": 0.000185608,
      "loss": 0.0447,
      "step": 3600
    },
    {
      "epoch": 0.5445881552076243,
      "eval_cer": 0.16368877753976077,
      "eval_loss": 0.04047335311770439,
      "eval_runtime": 10446.0422,
      "eval_samples_per_second": 2.015,
      "eval_steps_per_second": 0.252,
      "step": 3600
    },
    {
      "epoch": 0.546100900083201,
      "grad_norm": 0.06725309789180756,
      "learning_rate": 0.000185568,
      "loss": 0.053,
      "step": 3610
    },
    {
      "epoch": 0.5476136449587777,
      "grad_norm": 0.06334862858057022,
      "learning_rate": 0.00018552800000000002,
      "loss": 0.0451,
      "step": 3620
    },
    {
      "epoch": 0.5491263898343545,
      "grad_norm": 0.12283937633037567,
      "learning_rate": 0.000185488,
      "loss": 0.0437,
      "step": 3630
    },
    {
      "epoch": 0.5506391347099312,
      "grad_norm": 0.05931037664413452,
      "learning_rate": 0.000185448,
      "loss": 0.0431,
      "step": 3640
    },
    {
      "epoch": 0.5521518795855079,
      "grad_norm": 0.05501909554004669,
      "learning_rate": 0.000185408,
      "loss": 0.0398,
      "step": 3650
    },
    {
      "epoch": 0.5536646244610847,
      "grad_norm": 0.06066635251045227,
      "learning_rate": 0.00018536800000000002,
      "loss": 0.0497,
      "step": 3660
    },
    {
      "epoch": 0.5551773693366614,
      "grad_norm": 0.1352480947971344,
      "learning_rate": 0.000185328,
      "loss": 0.0445,
      "step": 3670
    },
    {
      "epoch": 0.5566901142122381,
      "grad_norm": 0.08712221682071686,
      "learning_rate": 0.000185288,
      "loss": 0.0485,
      "step": 3680
    },
    {
      "epoch": 0.5582028590878149,
      "grad_norm": 0.06511665135622025,
      "learning_rate": 0.000185248,
      "loss": 0.0464,
      "step": 3690
    },
    {
      "epoch": 0.5597156039633916,
      "grad_norm": 0.052760981023311615,
      "learning_rate": 0.000185208,
      "loss": 0.0417,
      "step": 3700
    },
    {
      "epoch": 0.5612283488389683,
      "grad_norm": 0.05113260820508003,
      "learning_rate": 0.000185168,
      "loss": 0.0426,
      "step": 3710
    },
    {
      "epoch": 0.5627410937145451,
      "grad_norm": 0.06565012037754059,
      "learning_rate": 0.000185128,
      "loss": 0.0397,
      "step": 3720
    },
    {
      "epoch": 0.5642538385901218,
      "grad_norm": 0.0608823299407959,
      "learning_rate": 0.00018508800000000003,
      "loss": 0.0411,
      "step": 3730
    },
    {
      "epoch": 0.5657665834656985,
      "grad_norm": 0.0670706033706665,
      "learning_rate": 0.000185048,
      "loss": 0.0495,
      "step": 3740
    },
    {
      "epoch": 0.5672793283412753,
      "grad_norm": 0.07000606507062912,
      "learning_rate": 0.00018500800000000001,
      "loss": 0.0457,
      "step": 3750
    },
    {
      "epoch": 0.568792073216852,
      "grad_norm": 0.08072007447481155,
      "learning_rate": 0.000184968,
      "loss": 0.0484,
      "step": 3760
    },
    {
      "epoch": 0.5703048180924287,
      "grad_norm": 0.06795356422662735,
      "learning_rate": 0.000184928,
      "loss": 0.0495,
      "step": 3770
    },
    {
      "epoch": 0.5718175629680055,
      "grad_norm": 0.3031274974346161,
      "learning_rate": 0.00018488800000000002,
      "loss": 0.0504,
      "step": 3780
    },
    {
      "epoch": 0.5733303078435822,
      "grad_norm": 0.05166814848780632,
      "learning_rate": 0.000184848,
      "loss": 0.0442,
      "step": 3790
    },
    {
      "epoch": 0.5748430527191589,
      "grad_norm": 0.08816450089216232,
      "learning_rate": 0.000184808,
      "loss": 0.0525,
      "step": 3800
    },
    {
      "epoch": 0.5748430527191589,
      "eval_cer": 0.09852050611143642,
      "eval_loss": 0.041136305779218674,
      "eval_runtime": 10432.1011,
      "eval_samples_per_second": 2.018,
      "eval_steps_per_second": 0.252,
      "step": 3800
    },
    {
      "epoch": 0.5763557975947357,
      "grad_norm": 0.06531400233507156,
      "learning_rate": 0.000184768,
      "loss": 0.0459,
      "step": 3810
    },
    {
      "epoch": 0.5778685424703124,
      "grad_norm": 0.07049426436424255,
      "learning_rate": 0.00018472800000000002,
      "loss": 0.0386,
      "step": 3820
    },
    {
      "epoch": 0.5793812873458891,
      "grad_norm": 0.07954803854227066,
      "learning_rate": 0.00018468800000000002,
      "loss": 0.0451,
      "step": 3830
    },
    {
      "epoch": 0.5808940322214659,
      "grad_norm": 0.07543455064296722,
      "learning_rate": 0.000184648,
      "loss": 0.0406,
      "step": 3840
    },
    {
      "epoch": 0.5824067770970426,
      "grad_norm": 0.08292882144451141,
      "learning_rate": 0.000184608,
      "loss": 0.0544,
      "step": 3850
    },
    {
      "epoch": 0.5839195219726193,
      "grad_norm": 0.05814971402287483,
      "learning_rate": 0.000184568,
      "loss": 0.0441,
      "step": 3860
    },
    {
      "epoch": 0.585432266848196,
      "grad_norm": 0.06112606078386307,
      "learning_rate": 0.00018452800000000002,
      "loss": 0.0482,
      "step": 3870
    },
    {
      "epoch": 0.5869450117237728,
      "grad_norm": 0.08487452566623688,
      "learning_rate": 0.000184488,
      "loss": 0.0446,
      "step": 3880
    },
    {
      "epoch": 0.5884577565993495,
      "grad_norm": 0.05025780200958252,
      "learning_rate": 0.000184448,
      "loss": 0.0453,
      "step": 3890
    },
    {
      "epoch": 0.5899705014749262,
      "grad_norm": 0.10276935994625092,
      "learning_rate": 0.000184408,
      "loss": 0.0427,
      "step": 3900
    },
    {
      "epoch": 0.591483246350503,
      "grad_norm": 0.11926810443401337,
      "learning_rate": 0.000184368,
      "loss": 0.0472,
      "step": 3910
    },
    {
      "epoch": 0.5929959912260797,
      "grad_norm": 0.08615875244140625,
      "learning_rate": 0.00018432800000000001,
      "loss": 0.0504,
      "step": 3920
    },
    {
      "epoch": 0.5945087361016564,
      "grad_norm": 0.05418393015861511,
      "learning_rate": 0.000184288,
      "loss": 0.0397,
      "step": 3930
    },
    {
      "epoch": 0.5960214809772332,
      "grad_norm": 0.06980731338262558,
      "learning_rate": 0.000184248,
      "loss": 0.0407,
      "step": 3940
    },
    {
      "epoch": 0.5975342258528099,
      "grad_norm": 0.07121722400188446,
      "learning_rate": 0.000184208,
      "loss": 0.0441,
      "step": 3950
    },
    {
      "epoch": 0.5990469707283866,
      "grad_norm": 0.05750627815723419,
      "learning_rate": 0.00018416800000000002,
      "loss": 0.049,
      "step": 3960
    },
    {
      "epoch": 0.6005597156039634,
      "grad_norm": 0.08207126706838608,
      "learning_rate": 0.000184128,
      "loss": 0.0475,
      "step": 3970
    },
    {
      "epoch": 0.6020724604795401,
      "grad_norm": 0.07319646328687668,
      "learning_rate": 0.000184088,
      "loss": 0.0517,
      "step": 3980
    },
    {
      "epoch": 0.6035852053551168,
      "grad_norm": 0.06762152910232544,
      "learning_rate": 0.000184048,
      "loss": 0.042,
      "step": 3990
    },
    {
      "epoch": 0.6050979502306936,
      "grad_norm": 0.05603775382041931,
      "learning_rate": 0.000184008,
      "loss": 0.0434,
      "step": 4000
    },
    {
      "epoch": 0.6050979502306936,
      "eval_cer": 0.2283245991802003,
      "eval_loss": 0.03986261412501335,
      "eval_runtime": 10464.7689,
      "eval_samples_per_second": 2.012,
      "eval_steps_per_second": 0.252,
      "step": 4000
    },
    {
      "epoch": 0.6066106951062703,
      "grad_norm": 0.05094938725233078,
      "learning_rate": 0.000183968,
      "loss": 0.0493,
      "step": 4010
    },
    {
      "epoch": 0.608123439981847,
      "grad_norm": 0.08996951580047607,
      "learning_rate": 0.000183928,
      "loss": 0.0475,
      "step": 4020
    },
    {
      "epoch": 0.6096361848574238,
      "grad_norm": 0.07369961589574814,
      "learning_rate": 0.00018388800000000003,
      "loss": 0.0441,
      "step": 4030
    },
    {
      "epoch": 0.6111489297330005,
      "grad_norm": 0.06135983020067215,
      "learning_rate": 0.000183848,
      "loss": 0.0421,
      "step": 4040
    },
    {
      "epoch": 0.6126616746085772,
      "grad_norm": 0.04601254314184189,
      "learning_rate": 0.000183808,
      "loss": 0.037,
      "step": 4050
    },
    {
      "epoch": 0.614174419484154,
      "grad_norm": 0.04949349910020828,
      "learning_rate": 0.000183768,
      "loss": 0.0424,
      "step": 4060
    },
    {
      "epoch": 0.6156871643597307,
      "grad_norm": 0.08714490383863449,
      "learning_rate": 0.000183728,
      "loss": 0.0459,
      "step": 4070
    },
    {
      "epoch": 0.6171999092353074,
      "grad_norm": 0.07733121514320374,
      "learning_rate": 0.00018368800000000002,
      "loss": 0.0423,
      "step": 4080
    },
    {
      "epoch": 0.6187126541108842,
      "grad_norm": 0.070652537047863,
      "learning_rate": 0.000183648,
      "loss": 0.0417,
      "step": 4090
    },
    {
      "epoch": 0.6202253989864609,
      "grad_norm": 0.08538975566625595,
      "learning_rate": 0.000183608,
      "loss": 0.045,
      "step": 4100
    },
    {
      "epoch": 0.6217381438620376,
      "grad_norm": 0.07866961508989334,
      "learning_rate": 0.000183568,
      "loss": 0.0435,
      "step": 4110
    },
    {
      "epoch": 0.6232508887376144,
      "grad_norm": 0.052214980125427246,
      "learning_rate": 0.00018352800000000002,
      "loss": 0.0389,
      "step": 4120
    },
    {
      "epoch": 0.6247636336131911,
      "grad_norm": 0.07548975199460983,
      "learning_rate": 0.00018348800000000002,
      "loss": 0.0406,
      "step": 4130
    },
    {
      "epoch": 0.6262763784887678,
      "grad_norm": 0.06064745783805847,
      "learning_rate": 0.000183448,
      "loss": 0.0405,
      "step": 4140
    },
    {
      "epoch": 0.6277891233643446,
      "grad_norm": 0.06255548447370529,
      "learning_rate": 0.000183408,
      "loss": 0.0426,
      "step": 4150
    },
    {
      "epoch": 0.6293018682399213,
      "grad_norm": 0.05550558492541313,
      "learning_rate": 0.000183368,
      "loss": 0.0432,
      "step": 4160
    },
    {
      "epoch": 0.630814613115498,
      "grad_norm": 0.06224781274795532,
      "learning_rate": 0.00018332800000000002,
      "loss": 0.0489,
      "step": 4170
    },
    {
      "epoch": 0.6323273579910748,
      "grad_norm": 0.04567689448595047,
      "learning_rate": 0.000183288,
      "loss": 0.0392,
      "step": 4180
    },
    {
      "epoch": 0.6338401028666515,
      "grad_norm": 0.08686509728431702,
      "learning_rate": 0.00018324800000000003,
      "loss": 0.0503,
      "step": 4190
    },
    {
      "epoch": 0.6353528477422282,
      "grad_norm": 0.039897847920656204,
      "learning_rate": 0.000183208,
      "loss": 0.0437,
      "step": 4200
    },
    {
      "epoch": 0.6353528477422282,
      "eval_cer": 0.0028697931722888917,
      "eval_loss": 0.03980256989598274,
      "eval_runtime": 10439.5254,
      "eval_samples_per_second": 2.017,
      "eval_steps_per_second": 0.252,
      "step": 4200
    },
    {
      "epoch": 0.636865592617805,
      "grad_norm": 0.07222657650709152,
      "learning_rate": 0.00018316800000000002,
      "loss": 0.0445,
      "step": 4210
    },
    {
      "epoch": 0.6383783374933817,
      "grad_norm": 0.06796406954526901,
      "learning_rate": 0.000183128,
      "loss": 0.0452,
      "step": 4220
    },
    {
      "epoch": 0.6398910823689585,
      "grad_norm": 0.07380914688110352,
      "learning_rate": 0.000183088,
      "loss": 0.0456,
      "step": 4230
    },
    {
      "epoch": 0.6414038272445353,
      "grad_norm": 0.05780802294611931,
      "learning_rate": 0.00018304800000000003,
      "loss": 0.043,
      "step": 4240
    },
    {
      "epoch": 0.642916572120112,
      "grad_norm": 0.07155787944793701,
      "learning_rate": 0.000183008,
      "loss": 0.0422,
      "step": 4250
    },
    {
      "epoch": 0.6444293169956887,
      "grad_norm": 0.06419336050748825,
      "learning_rate": 0.00018296800000000001,
      "loss": 0.0453,
      "step": 4260
    },
    {
      "epoch": 0.6459420618712655,
      "grad_norm": 0.06702402234077454,
      "learning_rate": 0.000182928,
      "loss": 0.0416,
      "step": 4270
    },
    {
      "epoch": 0.6474548067468422,
      "grad_norm": 0.062247395515441895,
      "learning_rate": 0.00018288800000000003,
      "loss": 0.0431,
      "step": 4280
    },
    {
      "epoch": 0.6489675516224189,
      "grad_norm": 0.05556045100092888,
      "learning_rate": 0.00018284800000000002,
      "loss": 0.0542,
      "step": 4290
    },
    {
      "epoch": 0.6504802964979957,
      "grad_norm": 0.07586701959371567,
      "learning_rate": 0.000182808,
      "loss": 0.0476,
      "step": 4300
    },
    {
      "epoch": 0.6519930413735724,
      "grad_norm": 0.056563302874565125,
      "learning_rate": 0.000182768,
      "loss": 0.0441,
      "step": 4310
    },
    {
      "epoch": 0.6535057862491491,
      "grad_norm": 0.08210831135511398,
      "learning_rate": 0.000182728,
      "loss": 0.0428,
      "step": 4320
    },
    {
      "epoch": 0.6550185311247259,
      "grad_norm": 0.06154036149382591,
      "learning_rate": 0.00018268800000000002,
      "loss": 0.0437,
      "step": 4330
    },
    {
      "epoch": 0.6565312760003026,
      "grad_norm": 0.06387040764093399,
      "learning_rate": 0.00018264800000000002,
      "loss": 0.0503,
      "step": 4340
    },
    {
      "epoch": 0.6580440208758793,
      "grad_norm": 0.07460694015026093,
      "learning_rate": 0.000182608,
      "loss": 0.0388,
      "step": 4350
    },
    {
      "epoch": 0.659556765751456,
      "grad_norm": 0.05871427804231644,
      "learning_rate": 0.000182568,
      "loss": 0.0409,
      "step": 4360
    },
    {
      "epoch": 0.6610695106270328,
      "grad_norm": 0.05525946244597435,
      "learning_rate": 0.000182528,
      "loss": 0.0403,
      "step": 4370
    },
    {
      "epoch": 0.6625822555026095,
      "grad_norm": 0.07400190085172653,
      "learning_rate": 0.00018248800000000002,
      "loss": 0.0544,
      "step": 4380
    },
    {
      "epoch": 0.6640950003781863,
      "grad_norm": 0.05236358568072319,
      "learning_rate": 0.000182448,
      "loss": 0.0424,
      "step": 4390
    },
    {
      "epoch": 0.665607745253763,
      "grad_norm": 0.07223962247371674,
      "learning_rate": 0.000182408,
      "loss": 0.0427,
      "step": 4400
    },
    {
      "epoch": 0.665607745253763,
      "eval_cer": 0.22895526186399429,
      "eval_loss": 0.039881668984889984,
      "eval_runtime": 10486.5948,
      "eval_samples_per_second": 2.008,
      "eval_steps_per_second": 0.251,
      "step": 4400
    },
    {
      "epoch": 0.6671204901293397,
      "grad_norm": 0.04777299240231514,
      "learning_rate": 0.000182368,
      "loss": 0.0365,
      "step": 4410
    },
    {
      "epoch": 0.6686332350049164,
      "grad_norm": 0.06789238750934601,
      "learning_rate": 0.00018232800000000002,
      "loss": 0.041,
      "step": 4420
    },
    {
      "epoch": 0.6701459798804932,
      "grad_norm": 0.07556366920471191,
      "learning_rate": 0.00018228800000000001,
      "loss": 0.0454,
      "step": 4430
    },
    {
      "epoch": 0.6716587247560699,
      "grad_norm": 0.05699057877063751,
      "learning_rate": 0.000182248,
      "loss": 0.0412,
      "step": 4440
    },
    {
      "epoch": 0.6731714696316466,
      "grad_norm": 0.06115678697824478,
      "learning_rate": 0.000182208,
      "loss": 0.0494,
      "step": 4450
    },
    {
      "epoch": 0.6746842145072234,
      "grad_norm": 0.16907750070095062,
      "learning_rate": 0.000182168,
      "loss": 0.0457,
      "step": 4460
    },
    {
      "epoch": 0.6761969593828001,
      "grad_norm": 0.23710806667804718,
      "learning_rate": 0.00018212800000000002,
      "loss": 0.0491,
      "step": 4470
    },
    {
      "epoch": 0.6777097042583768,
      "grad_norm": 0.13006287813186646,
      "learning_rate": 0.000182088,
      "loss": 0.0528,
      "step": 4480
    },
    {
      "epoch": 0.6792224491339536,
      "grad_norm": 0.24661995470523834,
      "learning_rate": 0.00018204800000000003,
      "loss": 0.043,
      "step": 4490
    },
    {
      "epoch": 0.6807351940095303,
      "grad_norm": 0.2757125198841095,
      "learning_rate": 0.000182008,
      "loss": 0.0477,
      "step": 4500
    },
    {
      "epoch": 0.682247938885107,
      "grad_norm": 0.27585530281066895,
      "learning_rate": 0.00018196800000000002,
      "loss": 0.0486,
      "step": 4510
    },
    {
      "epoch": 0.6837606837606838,
      "grad_norm": 0.10548703372478485,
      "learning_rate": 0.000181928,
      "loss": 0.0448,
      "step": 4520
    },
    {
      "epoch": 0.6852734286362605,
      "grad_norm": 0.1989259272813797,
      "learning_rate": 0.000181888,
      "loss": 0.0508,
      "step": 4530
    },
    {
      "epoch": 0.6867861735118372,
      "grad_norm": 0.10586623847484589,
      "learning_rate": 0.00018184800000000002,
      "loss": 0.0486,
      "step": 4540
    },
    {
      "epoch": 0.688298918387414,
      "grad_norm": 0.09687965363264084,
      "learning_rate": 0.000181808,
      "loss": 0.0463,
      "step": 4550
    },
    {
      "epoch": 0.6898116632629907,
      "grad_norm": 0.13362692296504974,
      "learning_rate": 0.000181768,
      "loss": 0.0441,
      "step": 4560
    },
    {
      "epoch": 0.6913244081385674,
      "grad_norm": 0.07124081254005432,
      "learning_rate": 0.000181728,
      "loss": 0.0479,
      "step": 4570
    },
    {
      "epoch": 0.6928371530141442,
      "grad_norm": 0.060886889696121216,
      "learning_rate": 0.00018168800000000003,
      "loss": 0.0425,
      "step": 4580
    },
    {
      "epoch": 0.6943498978897209,
      "grad_norm": 0.09697773307561874,
      "learning_rate": 0.00018164800000000002,
      "loss": 0.0466,
      "step": 4590
    },
    {
      "epoch": 0.6958626427652976,
      "grad_norm": 0.09655246883630753,
      "learning_rate": 0.00018160800000000001,
      "loss": 0.0423,
      "step": 4600
    },
    {
      "epoch": 0.6958626427652976,
      "eval_cer": 0.3264485475609846,
      "eval_loss": 0.04431215673685074,
      "eval_runtime": 9966.6677,
      "eval_samples_per_second": 2.112,
      "eval_steps_per_second": 0.264,
      "step": 4600
    },
    {
      "epoch": 0.6973753876408744,
      "grad_norm": 0.6920335292816162,
      "learning_rate": 0.000181568,
      "loss": 0.0612,
      "step": 4610
    },
    {
      "epoch": 0.6988881325164511,
      "grad_norm": 21.773630142211914,
      "learning_rate": 0.00018153600000000002,
      "loss": 0.3452,
      "step": 4620
    },
    {
      "epoch": 0.7004008773920278,
      "grad_norm": 0.6047945022583008,
      "learning_rate": 0.0001815,
      "loss": 0.8043,
      "step": 4630
    },
    {
      "epoch": 0.7019136222676046,
      "grad_norm": 0.30588680505752563,
      "learning_rate": 0.00018146000000000001,
      "loss": 0.094,
      "step": 4640
    },
    {
      "epoch": 0.7034263671431813,
      "grad_norm": 2.5436811447143555,
      "learning_rate": 0.00018142,
      "loss": 0.1421,
      "step": 4650
    },
    {
      "epoch": 0.704939112018758,
      "grad_norm": 3.3921713829040527,
      "learning_rate": 0.00018138000000000003,
      "loss": 0.2285,
      "step": 4660
    },
    {
      "epoch": 0.7064518568943348,
      "grad_norm": 6.751514434814453,
      "learning_rate": 0.00018134,
      "loss": 0.1609,
      "step": 4670
    },
    {
      "epoch": 0.7079646017699115,
      "grad_norm": 0.2919982075691223,
      "learning_rate": 0.00018130000000000002,
      "loss": 0.0731,
      "step": 4680
    },
    {
      "epoch": 0.7094773466454882,
      "grad_norm": 0.2757503092288971,
      "learning_rate": 0.00018126,
      "loss": 0.0553,
      "step": 4690
    },
    {
      "epoch": 0.710990091521065,
      "grad_norm": 0.12121643126010895,
      "learning_rate": 0.00018122,
      "loss": 0.0637,
      "step": 4700
    },
    {
      "epoch": 0.7125028363966417,
      "grad_norm": 0.6880851984024048,
      "learning_rate": 0.00018118000000000002,
      "loss": 0.0556,
      "step": 4710
    },
    {
      "epoch": 0.7140155812722184,
      "grad_norm": 0.17397326231002808,
      "learning_rate": 0.00018114,
      "loss": 0.0619,
      "step": 4720
    },
    {
      "epoch": 0.7155283261477952,
      "grad_norm": 0.4361652433872223,
      "learning_rate": 0.0001811,
      "loss": 0.052,
      "step": 4730
    },
    {
      "epoch": 0.7170410710233719,
      "grad_norm": 0.08802498877048492,
      "learning_rate": 0.00018106,
      "loss": 0.0531,
      "step": 4740
    },
    {
      "epoch": 0.7185538158989486,
      "grad_norm": 0.16508696973323822,
      "learning_rate": 0.00018102000000000003,
      "loss": 0.0519,
      "step": 4750
    },
    {
      "epoch": 0.7200665607745254,
      "grad_norm": 0.1359723061323166,
      "learning_rate": 0.00018098000000000002,
      "loss": 0.0559,
      "step": 4760
    },
    {
      "epoch": 0.7215793056501021,
      "grad_norm": 0.12716355919837952,
      "learning_rate": 0.00018093999999999999,
      "loss": 0.0478,
      "step": 4770
    },
    {
      "epoch": 0.7230920505256788,
      "grad_norm": 0.24563723802566528,
      "learning_rate": 0.0001809,
      "loss": 0.0508,
      "step": 4780
    },
    {
      "epoch": 0.7246047954012556,
      "grad_norm": 0.15526343882083893,
      "learning_rate": 0.00018086,
      "loss": 0.053,
      "step": 4790
    },
    {
      "epoch": 0.7261175402768323,
      "grad_norm": 0.39961257576942444,
      "learning_rate": 0.00018082000000000002,
      "loss": 0.0543,
      "step": 4800
    },
    {
      "epoch": 0.7261175402768323,
      "eval_cer": 0.8969592299120654,
      "eval_loss": 0.04724743589758873,
      "eval_runtime": 9508.4862,
      "eval_samples_per_second": 2.214,
      "eval_steps_per_second": 0.277,
      "step": 4800
    },
    {
      "epoch": 0.727630285152409,
      "grad_norm": 0.11674599349498749,
      "learning_rate": 0.00018078000000000001,
      "loss": 0.045,
      "step": 4810
    },
    {
      "epoch": 0.7291430300279858,
      "grad_norm": 0.12775878608226776,
      "learning_rate": 0.00018074,
      "loss": 0.0507,
      "step": 4820
    },
    {
      "epoch": 0.7306557749035625,
      "grad_norm": 0.21720856428146362,
      "learning_rate": 0.0001807,
      "loss": 0.0507,
      "step": 4830
    },
    {
      "epoch": 0.7321685197791392,
      "grad_norm": 0.09953787177801132,
      "learning_rate": 0.00018066,
      "loss": 0.0455,
      "step": 4840
    },
    {
      "epoch": 0.733681264654716,
      "grad_norm": 0.1652969866991043,
      "learning_rate": 0.00018062000000000002,
      "loss": 0.058,
      "step": 4850
    },
    {
      "epoch": 0.7351940095302927,
      "grad_norm": 0.15136420726776123,
      "learning_rate": 0.00018058,
      "loss": 0.0403,
      "step": 4860
    },
    {
      "epoch": 0.7367067544058694,
      "grad_norm": 0.09294873476028442,
      "learning_rate": 0.00018054,
      "loss": 0.0454,
      "step": 4870
    },
    {
      "epoch": 0.7382194992814461,
      "grad_norm": 0.06313528120517731,
      "learning_rate": 0.0001805,
      "loss": 0.0486,
      "step": 4880
    },
    {
      "epoch": 0.7397322441570229,
      "grad_norm": 0.10854914039373398,
      "learning_rate": 0.00018046000000000002,
      "loss": 0.0419,
      "step": 4890
    },
    {
      "epoch": 0.7412449890325996,
      "grad_norm": 0.08302963525056839,
      "learning_rate": 0.00018042,
      "loss": 0.0447,
      "step": 4900
    },
    {
      "epoch": 0.7427577339081763,
      "grad_norm": 0.0761631429195404,
      "learning_rate": 0.00018038,
      "loss": 0.0446,
      "step": 4910
    },
    {
      "epoch": 0.7442704787837531,
      "grad_norm": 0.10130470246076584,
      "learning_rate": 0.00018034,
      "loss": 0.045,
      "step": 4920
    },
    {
      "epoch": 0.7457832236593298,
      "grad_norm": 0.18436622619628906,
      "learning_rate": 0.0001803,
      "loss": 0.0429,
      "step": 4930
    },
    {
      "epoch": 0.7472959685349065,
      "grad_norm": 0.08756496757268906,
      "learning_rate": 0.00018026,
      "loss": 0.0444,
      "step": 4940
    },
    {
      "epoch": 0.7488087134104833,
      "grad_norm": 0.0750514343380928,
      "learning_rate": 0.00018022,
      "loss": 0.0507,
      "step": 4950
    },
    {
      "epoch": 0.75032145828606,
      "grad_norm": 0.07460404187440872,
      "learning_rate": 0.00018018000000000003,
      "loss": 0.0397,
      "step": 4960
    },
    {
      "epoch": 0.7518342031616367,
      "grad_norm": 0.12696300446987152,
      "learning_rate": 0.00018014,
      "loss": 0.0412,
      "step": 4970
    },
    {
      "epoch": 0.7533469480372135,
      "grad_norm": 0.09411120414733887,
      "learning_rate": 0.00018010000000000001,
      "loss": 0.0431,
      "step": 4980
    },
    {
      "epoch": 0.7548596929127902,
      "grad_norm": 0.08611701428890228,
      "learning_rate": 0.00018006,
      "loss": 0.041,
      "step": 4990
    },
    {
      "epoch": 0.756372437788367,
      "grad_norm": 0.07411106675863266,
      "learning_rate": 0.00018002,
      "loss": 0.0448,
      "step": 5000
    },
    {
      "epoch": 0.756372437788367,
      "eval_cer": 0.9283299113242558,
      "eval_loss": 0.0398402214050293,
      "eval_runtime": 9972.2961,
      "eval_samples_per_second": 2.111,
      "eval_steps_per_second": 0.264,
      "step": 5000
    },
    {
      "epoch": 0.7578851826639438,
      "grad_norm": 0.06552145630121231,
      "learning_rate": 0.00017998000000000002,
      "loss": 0.0411,
      "step": 5010
    },
    {
      "epoch": 0.7593979275395205,
      "grad_norm": 0.14544987678527832,
      "learning_rate": 0.00017994000000000002,
      "loss": 0.0401,
      "step": 5020
    },
    {
      "epoch": 0.7609106724150972,
      "grad_norm": 0.06693132221698761,
      "learning_rate": 0.0001799,
      "loss": 0.045,
      "step": 5030
    },
    {
      "epoch": 0.762423417290674,
      "grad_norm": 0.08100226521492004,
      "learning_rate": 0.00017986,
      "loss": 0.0478,
      "step": 5040
    },
    {
      "epoch": 0.7639361621662507,
      "grad_norm": 0.10020666569471359,
      "learning_rate": 0.00017982000000000002,
      "loss": 0.0484,
      "step": 5050
    },
    {
      "epoch": 0.7654489070418274,
      "grad_norm": 0.055785536766052246,
      "learning_rate": 0.00017978000000000002,
      "loss": 0.0423,
      "step": 5060
    },
    {
      "epoch": 0.7669616519174042,
      "grad_norm": 0.08791428059339523,
      "learning_rate": 0.00017974,
      "loss": 0.0433,
      "step": 5070
    },
    {
      "epoch": 0.7684743967929809,
      "grad_norm": 0.10156507045030594,
      "learning_rate": 0.0001797,
      "loss": 0.0447,
      "step": 5080
    },
    {
      "epoch": 0.7699871416685576,
      "grad_norm": 0.1160702183842659,
      "learning_rate": 0.00017966,
      "loss": 0.0388,
      "step": 5090
    },
    {
      "epoch": 0.7714998865441344,
      "grad_norm": 0.08716849237680435,
      "learning_rate": 0.00017962000000000002,
      "loss": 0.0492,
      "step": 5100
    },
    {
      "epoch": 0.7730126314197111,
      "grad_norm": 0.046968474984169006,
      "learning_rate": 0.00017958,
      "loss": 0.0434,
      "step": 5110
    },
    {
      "epoch": 0.7745253762952878,
      "grad_norm": 0.06234806030988693,
      "learning_rate": 0.00017954000000000003,
      "loss": 0.0504,
      "step": 5120
    },
    {
      "epoch": 0.7760381211708646,
      "grad_norm": 0.102174311876297,
      "learning_rate": 0.0001795,
      "loss": 0.044,
      "step": 5130
    },
    {
      "epoch": 0.7775508660464413,
      "grad_norm": 0.0620570033788681,
      "learning_rate": 0.00017946,
      "loss": 0.0386,
      "step": 5140
    },
    {
      "epoch": 0.779063610922018,
      "grad_norm": 0.057656314224004745,
      "learning_rate": 0.00017942,
      "loss": 0.043,
      "step": 5150
    },
    {
      "epoch": 0.7805763557975948,
      "grad_norm": 0.08451346307992935,
      "learning_rate": 0.00017938,
      "loss": 0.0452,
      "step": 5160
    },
    {
      "epoch": 0.7820891006731715,
      "grad_norm": 0.09557165950536728,
      "learning_rate": 0.00017934000000000003,
      "loss": 0.0437,
      "step": 5170
    },
    {
      "epoch": 0.7836018455487482,
      "grad_norm": 0.12275496870279312,
      "learning_rate": 0.0001793,
      "loss": 0.0427,
      "step": 5180
    },
    {
      "epoch": 0.785114590424325,
      "grad_norm": 0.3277435600757599,
      "learning_rate": 0.00017926000000000002,
      "loss": 0.045,
      "step": 5190
    },
    {
      "epoch": 0.7866273352999017,
      "grad_norm": 0.12806734442710876,
      "learning_rate": 0.00017922,
      "loss": 0.0383,
      "step": 5200
    },
    {
      "epoch": 0.7866273352999017,
      "eval_cer": 0.8426215554451947,
      "eval_loss": 0.03898792341351509,
      "eval_runtime": 10404.4584,
      "eval_samples_per_second": 2.023,
      "eval_steps_per_second": 0.253,
      "step": 5200
    },
    {
      "epoch": 0.7881400801754784,
      "grad_norm": 0.07969816774129868,
      "learning_rate": 0.00017918,
      "loss": 0.0474,
      "step": 5210
    },
    {
      "epoch": 0.7896528250510552,
      "grad_norm": 0.20492368936538696,
      "learning_rate": 0.00017914000000000002,
      "loss": 0.0423,
      "step": 5220
    },
    {
      "epoch": 0.7911655699266319,
      "grad_norm": 0.0960281640291214,
      "learning_rate": 0.0001791,
      "loss": 0.0392,
      "step": 5230
    },
    {
      "epoch": 0.7926783148022086,
      "grad_norm": 0.16566351056098938,
      "learning_rate": 0.00017906,
      "loss": 0.0415,
      "step": 5240
    },
    {
      "epoch": 0.7941910596777854,
      "grad_norm": 0.12343327701091766,
      "learning_rate": 0.00017902,
      "loss": 0.0439,
      "step": 5250
    },
    {
      "epoch": 0.7957038045533621,
      "grad_norm": 0.0732201486825943,
      "learning_rate": 0.00017898000000000002,
      "loss": 0.0462,
      "step": 5260
    },
    {
      "epoch": 0.7972165494289388,
      "grad_norm": 0.07991164177656174,
      "learning_rate": 0.00017894000000000002,
      "loss": 0.0412,
      "step": 5270
    },
    {
      "epoch": 0.7987292943045156,
      "grad_norm": 0.07868771255016327,
      "learning_rate": 0.0001789,
      "loss": 0.0458,
      "step": 5280
    },
    {
      "epoch": 0.8002420391800923,
      "grad_norm": 0.07392987608909607,
      "learning_rate": 0.00017886,
      "loss": 0.0489,
      "step": 5290
    },
    {
      "epoch": 0.801754784055669,
      "grad_norm": 0.08330372720956802,
      "learning_rate": 0.00017882,
      "loss": 0.0448,
      "step": 5300
    },
    {
      "epoch": 0.8032675289312458,
      "grad_norm": 0.06118497997522354,
      "learning_rate": 0.00017878000000000002,
      "loss": 0.0406,
      "step": 5310
    },
    {
      "epoch": 0.8047802738068225,
      "grad_norm": 0.14288772642612457,
      "learning_rate": 0.00017874,
      "loss": 0.0439,
      "step": 5320
    },
    {
      "epoch": 0.8062930186823992,
      "grad_norm": 0.06868502497673035,
      "learning_rate": 0.0001787,
      "loss": 0.0439,
      "step": 5330
    },
    {
      "epoch": 0.807805763557976,
      "grad_norm": 0.08165542781352997,
      "learning_rate": 0.00017866,
      "loss": 0.0449,
      "step": 5340
    },
    {
      "epoch": 0.8093185084335527,
      "grad_norm": 0.08748511224985123,
      "learning_rate": 0.00017862000000000002,
      "loss": 0.0455,
      "step": 5350
    },
    {
      "epoch": 0.8108312533091294,
      "grad_norm": 0.0799604058265686,
      "learning_rate": 0.00017858000000000001,
      "loss": 0.0466,
      "step": 5360
    },
    {
      "epoch": 0.8123439981847062,
      "grad_norm": 0.09606848657131195,
      "learning_rate": 0.00017854,
      "loss": 0.0452,
      "step": 5370
    },
    {
      "epoch": 0.8138567430602829,
      "grad_norm": 0.07232715934515,
      "learning_rate": 0.0001785,
      "loss": 0.0426,
      "step": 5380
    },
    {
      "epoch": 0.8153694879358596,
      "grad_norm": 0.07278240472078323,
      "learning_rate": 0.00017846,
      "loss": 0.0468,
      "step": 5390
    },
    {
      "epoch": 0.8168822328114363,
      "grad_norm": 0.06568820029497147,
      "learning_rate": 0.00017842000000000002,
      "loss": 0.0407,
      "step": 5400
    },
    {
      "epoch": 0.8168822328114363,
      "eval_cer": 0.9304918304165957,
      "eval_loss": 0.039248276501894,
      "eval_runtime": 10433.9841,
      "eval_samples_per_second": 2.018,
      "eval_steps_per_second": 0.252,
      "step": 5400
    },
    {
      "epoch": 0.8183949776870131,
      "grad_norm": 0.08667409420013428,
      "learning_rate": 0.00017838,
      "loss": 0.0504,
      "step": 5410
    },
    {
      "epoch": 0.8199077225625898,
      "grad_norm": 0.0701778307557106,
      "learning_rate": 0.00017834000000000003,
      "loss": 0.0425,
      "step": 5420
    },
    {
      "epoch": 0.8214204674381665,
      "grad_norm": 0.07078663259744644,
      "learning_rate": 0.0001783,
      "loss": 0.0456,
      "step": 5430
    },
    {
      "epoch": 0.8229332123137433,
      "grad_norm": 0.08540530502796173,
      "learning_rate": 0.00017826000000000002,
      "loss": 0.0437,
      "step": 5440
    },
    {
      "epoch": 0.82444595718932,
      "grad_norm": 0.044258490204811096,
      "learning_rate": 0.00017822,
      "loss": 0.0373,
      "step": 5450
    },
    {
      "epoch": 0.8259587020648967,
      "grad_norm": 0.08837467432022095,
      "learning_rate": 0.00017818,
      "loss": 0.0418,
      "step": 5460
    },
    {
      "epoch": 0.8274714469404735,
      "grad_norm": 0.06399261206388474,
      "learning_rate": 0.00017814000000000003,
      "loss": 0.0461,
      "step": 5470
    },
    {
      "epoch": 0.8289841918160502,
      "grad_norm": 0.07160426676273346,
      "learning_rate": 0.0001781,
      "loss": 0.0384,
      "step": 5480
    },
    {
      "epoch": 0.8304969366916269,
      "grad_norm": 0.06335125118494034,
      "learning_rate": 0.00017806,
      "loss": 0.04,
      "step": 5490
    },
    {
      "epoch": 0.8320096815672037,
      "grad_norm": 0.10239727795124054,
      "learning_rate": 0.00017802,
      "loss": 0.0396,
      "step": 5500
    },
    {
      "epoch": 0.8335224264427804,
      "grad_norm": 0.06797724217176437,
      "learning_rate": 0.00017798,
      "loss": 0.0406,
      "step": 5510
    },
    {
      "epoch": 0.8350351713183571,
      "grad_norm": 0.08448281139135361,
      "learning_rate": 0.00017794000000000002,
      "loss": 0.0489,
      "step": 5520
    },
    {
      "epoch": 0.8365479161939339,
      "grad_norm": 0.0817868560552597,
      "learning_rate": 0.0001779,
      "loss": 0.0437,
      "step": 5530
    },
    {
      "epoch": 0.8380606610695106,
      "grad_norm": 0.12232506275177002,
      "learning_rate": 0.00017786,
      "loss": 0.0475,
      "step": 5540
    },
    {
      "epoch": 0.8395734059450873,
      "grad_norm": 0.0839553102850914,
      "learning_rate": 0.00017782,
      "loss": 0.0447,
      "step": 5550
    },
    {
      "epoch": 0.8410861508206641,
      "grad_norm": 0.07315023243427277,
      "learning_rate": 0.00017778000000000002,
      "loss": 0.0441,
      "step": 5560
    },
    {
      "epoch": 0.8425988956962408,
      "grad_norm": 0.07943390309810638,
      "learning_rate": 0.00017774000000000002,
      "loss": 0.0457,
      "step": 5570
    },
    {
      "epoch": 0.8441116405718175,
      "grad_norm": 0.07185439020395279,
      "learning_rate": 0.0001777,
      "loss": 0.0429,
      "step": 5580
    },
    {
      "epoch": 0.8456243854473943,
      "grad_norm": 0.06304585933685303,
      "learning_rate": 0.00017766,
      "loss": 0.046,
      "step": 5590
    },
    {
      "epoch": 0.847137130322971,
      "grad_norm": 0.07005342841148376,
      "learning_rate": 0.00017762,
      "loss": 0.0359,
      "step": 5600
    },
    {
      "epoch": 0.847137130322971,
      "eval_cer": 0.5003496132017898,
      "eval_loss": 0.038213107734918594,
      "eval_runtime": 10454.3437,
      "eval_samples_per_second": 2.014,
      "eval_steps_per_second": 0.252,
      "step": 5600
    },
    {
      "epoch": 0.8486498751985477,
      "grad_norm": 0.08005109429359436,
      "learning_rate": 0.00017758000000000002,
      "loss": 0.0491,
      "step": 5610
    },
    {
      "epoch": 0.8501626200741245,
      "grad_norm": 0.07554598152637482,
      "learning_rate": 0.00017754,
      "loss": 0.0384,
      "step": 5620
    },
    {
      "epoch": 0.8516753649497012,
      "grad_norm": 0.08396964520215988,
      "learning_rate": 0.0001775,
      "loss": 0.0439,
      "step": 5630
    },
    {
      "epoch": 0.8531881098252779,
      "grad_norm": 0.08719771355390549,
      "learning_rate": 0.00017746,
      "loss": 0.0417,
      "step": 5640
    },
    {
      "epoch": 0.8547008547008547,
      "grad_norm": 0.09563528001308441,
      "learning_rate": 0.00017742000000000002,
      "loss": 0.0456,
      "step": 5650
    },
    {
      "epoch": 0.8562135995764314,
      "grad_norm": 0.07019315659999847,
      "learning_rate": 0.00017738,
      "loss": 0.0394,
      "step": 5660
    },
    {
      "epoch": 0.8577263444520081,
      "grad_norm": 0.06756678968667984,
      "learning_rate": 0.00017734,
      "loss": 0.046,
      "step": 5670
    },
    {
      "epoch": 0.8592390893275849,
      "grad_norm": 0.06660816073417664,
      "learning_rate": 0.0001773,
      "loss": 0.0415,
      "step": 5680
    },
    {
      "epoch": 0.8607518342031616,
      "grad_norm": 0.10737419873476028,
      "learning_rate": 0.00017726,
      "loss": 0.0402,
      "step": 5690
    },
    {
      "epoch": 0.8622645790787383,
      "grad_norm": 0.06818167865276337,
      "learning_rate": 0.00017722000000000001,
      "loss": 0.039,
      "step": 5700
    },
    {
      "epoch": 0.8637773239543151,
      "grad_norm": 0.05077315866947174,
      "learning_rate": 0.00017718,
      "loss": 0.0376,
      "step": 5710
    },
    {
      "epoch": 0.8652900688298918,
      "grad_norm": 0.08248795568943024,
      "learning_rate": 0.00017714000000000003,
      "loss": 0.0427,
      "step": 5720
    },
    {
      "epoch": 0.8668028137054685,
      "grad_norm": 0.06273633241653442,
      "learning_rate": 0.0001771,
      "loss": 0.0405,
      "step": 5730
    },
    {
      "epoch": 0.8683155585810453,
      "grad_norm": 0.11920665949583054,
      "learning_rate": 0.00017706000000000002,
      "loss": 0.0416,
      "step": 5740
    },
    {
      "epoch": 0.869828303456622,
      "grad_norm": 0.061835162341594696,
      "learning_rate": 0.00017702,
      "loss": 0.0456,
      "step": 5750
    },
    {
      "epoch": 0.8713410483321987,
      "grad_norm": 0.06891065835952759,
      "learning_rate": 0.00017698,
      "loss": 0.0435,
      "step": 5760
    },
    {
      "epoch": 0.8728537932077756,
      "grad_norm": 0.06323794275522232,
      "learning_rate": 0.00017694000000000002,
      "loss": 0.0424,
      "step": 5770
    },
    {
      "epoch": 0.8743665380833523,
      "grad_norm": 0.08218410611152649,
      "learning_rate": 0.0001769,
      "loss": 0.0428,
      "step": 5780
    },
    {
      "epoch": 0.875879282958929,
      "grad_norm": 0.05943075567483902,
      "learning_rate": 0.00017686,
      "loss": 0.0373,
      "step": 5790
    },
    {
      "epoch": 0.8773920278345058,
      "grad_norm": 0.09316141158342361,
      "learning_rate": 0.00017682,
      "loss": 0.0436,
      "step": 5800
    },
    {
      "epoch": 0.8773920278345058,
      "eval_cer": 0.5988355286077488,
      "eval_loss": 0.0380551740527153,
      "eval_runtime": 10439.6932,
      "eval_samples_per_second": 2.017,
      "eval_steps_per_second": 0.252,
      "step": 5800
    },
    {
      "epoch": 0.8789047727100825,
      "grad_norm": 0.06791754812002182,
      "learning_rate": 0.00017678000000000003,
      "loss": 0.0424,
      "step": 5810
    },
    {
      "epoch": 0.8804175175856592,
      "grad_norm": 0.06572896242141724,
      "learning_rate": 0.00017674000000000002,
      "loss": 0.0446,
      "step": 5820
    },
    {
      "epoch": 0.881930262461236,
      "grad_norm": 0.07208286970853806,
      "learning_rate": 0.00017669999999999999,
      "loss": 0.0438,
      "step": 5830
    },
    {
      "epoch": 0.8834430073368127,
      "grad_norm": 0.08518756181001663,
      "learning_rate": 0.00017666,
      "loss": 0.0401,
      "step": 5840
    },
    {
      "epoch": 0.8849557522123894,
      "grad_norm": 0.060736026614904404,
      "learning_rate": 0.00017662,
      "loss": 0.0393,
      "step": 5850
    },
    {
      "epoch": 0.8864684970879662,
      "grad_norm": 0.0627061128616333,
      "learning_rate": 0.00017658000000000002,
      "loss": 0.0358,
      "step": 5860
    },
    {
      "epoch": 0.8879812419635429,
      "grad_norm": 0.06178157031536102,
      "learning_rate": 0.00017654000000000001,
      "loss": 0.0467,
      "step": 5870
    },
    {
      "epoch": 0.8894939868391196,
      "grad_norm": 0.0688227042555809,
      "learning_rate": 0.0001765,
      "loss": 0.0415,
      "step": 5880
    },
    {
      "epoch": 0.8910067317146964,
      "grad_norm": 0.06773985177278519,
      "learning_rate": 0.00017646,
      "loss": 0.0354,
      "step": 5890
    },
    {
      "epoch": 0.8925194765902731,
      "grad_norm": 0.09130257368087769,
      "learning_rate": 0.00017642,
      "loss": 0.0414,
      "step": 5900
    },
    {
      "epoch": 0.8940322214658498,
      "grad_norm": 0.06815651059150696,
      "learning_rate": 0.00017638000000000002,
      "loss": 0.0495,
      "step": 5910
    },
    {
      "epoch": 0.8955449663414266,
      "grad_norm": 0.07239062339067459,
      "learning_rate": 0.00017634,
      "loss": 0.0459,
      "step": 5920
    },
    {
      "epoch": 0.8970577112170033,
      "grad_norm": 0.08951979130506516,
      "learning_rate": 0.0001763,
      "loss": 0.047,
      "step": 5930
    },
    {
      "epoch": 0.89857045609258,
      "grad_norm": 0.07267329841852188,
      "learning_rate": 0.00017626,
      "loss": 0.0384,
      "step": 5940
    },
    {
      "epoch": 0.9000832009681567,
      "grad_norm": 0.06272245943546295,
      "learning_rate": 0.00017622000000000002,
      "loss": 0.0373,
      "step": 5950
    },
    {
      "epoch": 0.9015959458437335,
      "grad_norm": 0.07484642416238785,
      "learning_rate": 0.00017618,
      "loss": 0.0445,
      "step": 5960
    },
    {
      "epoch": 0.9031086907193102,
      "grad_norm": 0.06894571334123611,
      "learning_rate": 0.00017614,
      "loss": 0.0418,
      "step": 5970
    },
    {
      "epoch": 0.904621435594887,
      "grad_norm": 0.07352825254201889,
      "learning_rate": 0.0001761,
      "loss": 0.0361,
      "step": 5980
    },
    {
      "epoch": 0.9061341804704637,
      "grad_norm": 0.07955580949783325,
      "learning_rate": 0.00017606,
      "loss": 0.0418,
      "step": 5990
    },
    {
      "epoch": 0.9076469253460404,
      "grad_norm": 0.057830698788166046,
      "learning_rate": 0.00017602,
      "loss": 0.0359,
      "step": 6000
    },
    {
      "epoch": 0.9076469253460404,
      "eval_cer": 0.5058427407698408,
      "eval_loss": 0.038296379148960114,
      "eval_runtime": 10426.1739,
      "eval_samples_per_second": 2.019,
      "eval_steps_per_second": 0.252,
      "step": 6000
    },
    {
      "epoch": 0.9091596702216171,
      "grad_norm": 0.08560307323932648,
      "learning_rate": 0.00017598,
      "loss": 0.0465,
      "step": 6010
    },
    {
      "epoch": 0.9106724150971939,
      "grad_norm": 0.06908106803894043,
      "learning_rate": 0.00017594000000000003,
      "loss": 0.0469,
      "step": 6020
    },
    {
      "epoch": 0.9121851599727706,
      "grad_norm": 0.058405641466379166,
      "learning_rate": 0.0001759,
      "loss": 0.0459,
      "step": 6030
    },
    {
      "epoch": 0.9136979048483473,
      "grad_norm": 0.06696103513240814,
      "learning_rate": 0.00017586000000000001,
      "loss": 0.0389,
      "step": 6040
    },
    {
      "epoch": 0.9152106497239241,
      "grad_norm": 0.06927672773599625,
      "learning_rate": 0.00017582,
      "loss": 0.0369,
      "step": 6050
    },
    {
      "epoch": 0.9167233945995008,
      "grad_norm": 0.11847919970750809,
      "learning_rate": 0.00017578,
      "loss": 0.0379,
      "step": 6060
    },
    {
      "epoch": 0.9182361394750775,
      "grad_norm": 0.06731213629245758,
      "learning_rate": 0.00017574000000000002,
      "loss": 0.0492,
      "step": 6070
    },
    {
      "epoch": 0.9197488843506543,
      "grad_norm": 0.06238566339015961,
      "learning_rate": 0.0001757,
      "loss": 0.0351,
      "step": 6080
    },
    {
      "epoch": 0.921261629226231,
      "grad_norm": 0.07023432850837708,
      "learning_rate": 0.00017566,
      "loss": 0.0418,
      "step": 6090
    },
    {
      "epoch": 0.9227743741018077,
      "grad_norm": 0.07269687950611115,
      "learning_rate": 0.00017562,
      "loss": 0.0473,
      "step": 6100
    },
    {
      "epoch": 0.9242871189773845,
      "grad_norm": 0.0714830756187439,
      "learning_rate": 0.00017558000000000002,
      "loss": 0.0419,
      "step": 6110
    },
    {
      "epoch": 0.9257998638529612,
      "grad_norm": 0.06455916166305542,
      "learning_rate": 0.00017554000000000002,
      "loss": 0.0386,
      "step": 6120
    },
    {
      "epoch": 0.9273126087285379,
      "grad_norm": 0.0797223374247551,
      "learning_rate": 0.0001755,
      "loss": 0.0425,
      "step": 6130
    },
    {
      "epoch": 0.9288253536041147,
      "grad_norm": 0.08360251039266586,
      "learning_rate": 0.00017546,
      "loss": 0.0414,
      "step": 6140
    },
    {
      "epoch": 0.9303380984796914,
      "grad_norm": 0.06491956114768982,
      "learning_rate": 0.00017542,
      "loss": 0.0367,
      "step": 6150
    },
    {
      "epoch": 0.9318508433552681,
      "grad_norm": 0.06236764043569565,
      "learning_rate": 0.00017538000000000002,
      "loss": 0.0514,
      "step": 6160
    },
    {
      "epoch": 0.9333635882308449,
      "grad_norm": 0.08555632829666138,
      "learning_rate": 0.00017534,
      "loss": 0.041,
      "step": 6170
    },
    {
      "epoch": 0.9348763331064216,
      "grad_norm": 0.08949322998523712,
      "learning_rate": 0.0001753,
      "loss": 0.0462,
      "step": 6180
    },
    {
      "epoch": 0.9363890779819983,
      "grad_norm": 0.07832244038581848,
      "learning_rate": 0.00017526,
      "loss": 0.0471,
      "step": 6190
    },
    {
      "epoch": 0.9379018228575751,
      "grad_norm": 0.06077546253800392,
      "learning_rate": 0.00017522000000000002,
      "loss": 0.0457,
      "step": 6200
    },
    {
      "epoch": 0.9379018228575751,
      "eval_cer": 0.3344013213649492,
      "eval_loss": 0.03830147907137871,
      "eval_runtime": 10461.8882,
      "eval_samples_per_second": 2.012,
      "eval_steps_per_second": 0.252,
      "step": 6200
    },
    {
      "epoch": 0.9394145677331518,
      "grad_norm": 0.048287175595760345,
      "learning_rate": 0.00017518,
      "loss": 0.0393,
      "step": 6210
    },
    {
      "epoch": 0.9409273126087285,
      "grad_norm": 0.08072841167449951,
      "learning_rate": 0.00017514,
      "loss": 0.0447,
      "step": 6220
    },
    {
      "epoch": 0.9424400574843053,
      "grad_norm": 0.07255307585000992,
      "learning_rate": 0.0001751,
      "loss": 0.0492,
      "step": 6230
    },
    {
      "epoch": 0.943952802359882,
      "grad_norm": 0.05136171355843544,
      "learning_rate": 0.00017506,
      "loss": 0.0438,
      "step": 6240
    },
    {
      "epoch": 0.9454655472354587,
      "grad_norm": 0.079404316842556,
      "learning_rate": 0.00017502000000000001,
      "loss": 0.0383,
      "step": 6250
    },
    {
      "epoch": 0.9469782921110355,
      "grad_norm": 0.10744167119264603,
      "learning_rate": 0.00017498,
      "loss": 0.0406,
      "step": 6260
    },
    {
      "epoch": 0.9484910369866122,
      "grad_norm": 0.09439695626497269,
      "learning_rate": 0.00017494,
      "loss": 0.0448,
      "step": 6270
    },
    {
      "epoch": 0.9500037818621889,
      "grad_norm": 0.07746788114309311,
      "learning_rate": 0.00017490000000000002,
      "loss": 0.0425,
      "step": 6280
    },
    {
      "epoch": 0.9515165267377657,
      "grad_norm": 0.161416694521904,
      "learning_rate": 0.00017486,
      "loss": 0.04,
      "step": 6290
    },
    {
      "epoch": 0.9530292716133424,
      "grad_norm": 0.05279407650232315,
      "learning_rate": 0.00017482,
      "loss": 0.0387,
      "step": 6300
    },
    {
      "epoch": 0.9545420164889191,
      "grad_norm": 0.06324402987957001,
      "learning_rate": 0.00017478,
      "loss": 0.0425,
      "step": 6310
    },
    {
      "epoch": 0.9560547613644959,
      "grad_norm": 0.08716294914484024,
      "learning_rate": 0.00017474000000000002,
      "loss": 0.0436,
      "step": 6320
    },
    {
      "epoch": 0.9575675062400726,
      "grad_norm": 0.08212625980377197,
      "learning_rate": 0.00017470000000000002,
      "loss": 0.0445,
      "step": 6330
    },
    {
      "epoch": 0.9590802511156493,
      "grad_norm": 0.08856002241373062,
      "learning_rate": 0.00017466,
      "loss": 0.0385,
      "step": 6340
    },
    {
      "epoch": 0.960592995991226,
      "grad_norm": 0.08907803148031235,
      "learning_rate": 0.00017462,
      "loss": 0.0451,
      "step": 6350
    },
    {
      "epoch": 0.9621057408668028,
      "grad_norm": 0.053175825625658035,
      "learning_rate": 0.00017458,
      "loss": 0.0428,
      "step": 6360
    },
    {
      "epoch": 0.9636184857423795,
      "grad_norm": 0.055600494146347046,
      "learning_rate": 0.00017454000000000002,
      "loss": 0.047,
      "step": 6370
    },
    {
      "epoch": 0.9651312306179562,
      "grad_norm": 0.10455228388309479,
      "learning_rate": 0.0001745,
      "loss": 0.0517,
      "step": 6380
    },
    {
      "epoch": 0.966643975493533,
      "grad_norm": 0.11780910938978195,
      "learning_rate": 0.00017446,
      "loss": 0.0414,
      "step": 6390
    },
    {
      "epoch": 0.9681567203691097,
      "grad_norm": 0.12388743460178375,
      "learning_rate": 0.00017442,
      "loss": 0.0438,
      "step": 6400
    },
    {
      "epoch": 0.9681567203691097,
      "eval_cer": 0.5869913004375724,
      "eval_loss": 0.03873522952198982,
      "eval_runtime": 10437.6142,
      "eval_samples_per_second": 2.017,
      "eval_steps_per_second": 0.252,
      "step": 6400
    },
    {
      "epoch": 0.9696694652446864,
      "grad_norm": 0.07916050404310226,
      "learning_rate": 0.00017438000000000002,
      "loss": 0.0402,
      "step": 6410
    },
    {
      "epoch": 0.9711822101202632,
      "grad_norm": 0.05646761879324913,
      "learning_rate": 0.00017434000000000001,
      "loss": 0.0425,
      "step": 6420
    },
    {
      "epoch": 0.9726949549958399,
      "grad_norm": 0.08374381810426712,
      "learning_rate": 0.0001743,
      "loss": 0.041,
      "step": 6430
    },
    {
      "epoch": 0.9742076998714166,
      "grad_norm": 0.06789222359657288,
      "learning_rate": 0.00017426,
      "loss": 0.0391,
      "step": 6440
    },
    {
      "epoch": 0.9757204447469934,
      "grad_norm": 0.0788172036409378,
      "learning_rate": 0.00017422,
      "loss": 0.0449,
      "step": 6450
    },
    {
      "epoch": 0.9772331896225701,
      "grad_norm": 0.1257173717021942,
      "learning_rate": 0.00017418000000000002,
      "loss": 0.0484,
      "step": 6460
    },
    {
      "epoch": 0.9787459344981468,
      "grad_norm": 0.05888710170984268,
      "learning_rate": 0.00017414,
      "loss": 0.0387,
      "step": 6470
    },
    {
      "epoch": 0.9802586793737236,
      "grad_norm": 0.07102910429239273,
      "learning_rate": 0.00017410000000000003,
      "loss": 0.0386,
      "step": 6480
    },
    {
      "epoch": 0.9817714242493003,
      "grad_norm": 0.058048397302627563,
      "learning_rate": 0.00017406,
      "loss": 0.0415,
      "step": 6490
    },
    {
      "epoch": 0.983284169124877,
      "grad_norm": 0.07222626358270645,
      "learning_rate": 0.00017402000000000002,
      "loss": 0.0378,
      "step": 6500
    },
    {
      "epoch": 0.9847969140004538,
      "grad_norm": 0.06445878744125366,
      "learning_rate": 0.00017398,
      "loss": 0.0409,
      "step": 6510
    },
    {
      "epoch": 0.9863096588760305,
      "grad_norm": 0.09191201627254486,
      "learning_rate": 0.00017394,
      "loss": 0.0414,
      "step": 6520
    },
    {
      "epoch": 0.9878224037516072,
      "grad_norm": 0.08073204010725021,
      "learning_rate": 0.00017390000000000003,
      "loss": 0.0404,
      "step": 6530
    },
    {
      "epoch": 0.9893351486271841,
      "grad_norm": 0.08427068591117859,
      "learning_rate": 0.00017386,
      "loss": 0.0398,
      "step": 6540
    },
    {
      "epoch": 0.9908478935027608,
      "grad_norm": 0.19870494306087494,
      "learning_rate": 0.00017382,
      "loss": 0.0388,
      "step": 6550
    },
    {
      "epoch": 0.9923606383783375,
      "grad_norm": 0.34985288977622986,
      "learning_rate": 0.00017378,
      "loss": 0.051,
      "step": 6560
    },
    {
      "epoch": 0.9938733832539143,
      "grad_norm": 0.12121633440256119,
      "learning_rate": 0.00017374000000000003,
      "loss": 0.0385,
      "step": 6570
    },
    {
      "epoch": 0.995386128129491,
      "grad_norm": 0.140520840883255,
      "learning_rate": 0.00017370000000000002,
      "loss": 0.0417,
      "step": 6580
    },
    {
      "epoch": 0.9968988730050677,
      "grad_norm": 0.06655796617269516,
      "learning_rate": 0.00017366,
      "loss": 0.0394,
      "step": 6590
    },
    {
      "epoch": 0.9984116178806445,
      "grad_norm": 0.07498542964458466,
      "learning_rate": 0.00017362,
      "loss": 0.0419,
      "step": 6600
    },
    {
      "epoch": 0.9984116178806445,
      "eval_cer": 0.25282902555511905,
      "eval_loss": 0.038411665707826614,
      "eval_runtime": 10433.3935,
      "eval_samples_per_second": 2.018,
      "eval_steps_per_second": 0.252,
      "step": 6600
    },
    {
      "epoch": 0.9999243627562212,
      "grad_norm": 0.25646254420280457,
      "learning_rate": 0.00017358,
      "loss": 0.039,
      "step": 6610
    },
    {
      "epoch": 1.0014371076317978,
      "grad_norm": 0.07744245231151581,
      "learning_rate": 0.00017354000000000002,
      "loss": 0.0371,
      "step": 6620
    },
    {
      "epoch": 1.0029498525073746,
      "grad_norm": 0.11968632787466049,
      "learning_rate": 0.00017350000000000002,
      "loss": 0.0303,
      "step": 6630
    },
    {
      "epoch": 1.0044625973829513,
      "grad_norm": 0.07235859334468842,
      "learning_rate": 0.00017346,
      "loss": 0.0387,
      "step": 6640
    },
    {
      "epoch": 1.005975342258528,
      "grad_norm": 0.12598702311515808,
      "learning_rate": 0.00017342,
      "loss": 0.0355,
      "step": 6650
    },
    {
      "epoch": 1.0074880871341048,
      "grad_norm": 0.10832694917917252,
      "learning_rate": 0.00017338,
      "loss": 0.0297,
      "step": 6660
    },
    {
      "epoch": 1.0090008320096815,
      "grad_norm": 0.13988302648067474,
      "learning_rate": 0.00017334000000000002,
      "loss": 0.0352,
      "step": 6670
    },
    {
      "epoch": 1.0105135768852582,
      "grad_norm": 0.09534142911434174,
      "learning_rate": 0.0001733,
      "loss": 0.0308,
      "step": 6680
    },
    {
      "epoch": 1.012026321760835,
      "grad_norm": 0.05622931197285652,
      "learning_rate": 0.00017326,
      "loss": 0.0311,
      "step": 6690
    },
    {
      "epoch": 1.0135390666364117,
      "grad_norm": 0.06480368971824646,
      "learning_rate": 0.00017322,
      "loss": 0.033,
      "step": 6700
    },
    {
      "epoch": 1.0150518115119884,
      "grad_norm": 0.08531224727630615,
      "learning_rate": 0.00017318000000000002,
      "loss": 0.0345,
      "step": 6710
    },
    {
      "epoch": 1.0165645563875652,
      "grad_norm": 0.11494185030460358,
      "learning_rate": 0.00017314,
      "loss": 0.0292,
      "step": 6720
    },
    {
      "epoch": 1.0180773012631419,
      "grad_norm": 0.06993953883647919,
      "learning_rate": 0.0001731,
      "loss": 0.0343,
      "step": 6730
    },
    {
      "epoch": 1.0195900461387186,
      "grad_norm": 0.09449311345815659,
      "learning_rate": 0.00017306,
      "loss": 0.0285,
      "step": 6740
    },
    {
      "epoch": 1.0211027910142954,
      "grad_norm": 0.10550418496131897,
      "learning_rate": 0.00017302,
      "loss": 0.0337,
      "step": 6750
    },
    {
      "epoch": 1.022615535889872,
      "grad_norm": 0.06987041234970093,
      "learning_rate": 0.00017298000000000001,
      "loss": 0.0273,
      "step": 6760
    },
    {
      "epoch": 1.0241282807654488,
      "grad_norm": 0.08014168590307236,
      "learning_rate": 0.00017294,
      "loss": 0.0318,
      "step": 6770
    },
    {
      "epoch": 1.0256410256410255,
      "grad_norm": 0.04886119067668915,
      "learning_rate": 0.00017290000000000003,
      "loss": 0.0318,
      "step": 6780
    },
    {
      "epoch": 1.0271537705166023,
      "grad_norm": 0.07735268771648407,
      "learning_rate": 0.00017286,
      "loss": 0.0377,
      "step": 6790
    },
    {
      "epoch": 1.028666515392179,
      "grad_norm": 0.07365155220031738,
      "learning_rate": 0.00017282000000000002,
      "loss": 0.0397,
      "step": 6800
    },
    {
      "epoch": 1.028666515392179,
      "eval_cer": 0.5956908628651482,
      "eval_loss": 0.03884879872202873,
      "eval_runtime": 10443.3198,
      "eval_samples_per_second": 2.016,
      "eval_steps_per_second": 0.252,
      "step": 6800
    },
    {
      "epoch": 1.0301792602677557,
      "grad_norm": 0.08235965669155121,
      "learning_rate": 0.00017278,
      "loss": 0.0356,
      "step": 6810
    },
    {
      "epoch": 1.0316920051433325,
      "grad_norm": 0.1203494668006897,
      "learning_rate": 0.00017274,
      "loss": 0.0391,
      "step": 6820
    },
    {
      "epoch": 1.0332047500189092,
      "grad_norm": 0.059709157794713974,
      "learning_rate": 0.00017270000000000002,
      "loss": 0.036,
      "step": 6830
    },
    {
      "epoch": 1.034717494894486,
      "grad_norm": 0.08380923420190811,
      "learning_rate": 0.00017266,
      "loss": 0.0311,
      "step": 6840
    },
    {
      "epoch": 1.0362302397700627,
      "grad_norm": 0.0642111599445343,
      "learning_rate": 0.00017262,
      "loss": 0.0296,
      "step": 6850
    },
    {
      "epoch": 1.0377429846456394,
      "grad_norm": 0.07701337337493896,
      "learning_rate": 0.00017258,
      "loss": 0.0318,
      "step": 6860
    },
    {
      "epoch": 1.0392557295212161,
      "grad_norm": 0.09674856811761856,
      "learning_rate": 0.00017254000000000003,
      "loss": 0.0294,
      "step": 6870
    },
    {
      "epoch": 1.0407684743967929,
      "grad_norm": 0.08543815463781357,
      "learning_rate": 0.00017250000000000002,
      "loss": 0.0322,
      "step": 6880
    },
    {
      "epoch": 1.0422812192723696,
      "grad_norm": 0.08181754499673843,
      "learning_rate": 0.00017246,
      "loss": 0.031,
      "step": 6890
    },
    {
      "epoch": 1.0437939641479463,
      "grad_norm": 0.07326922565698624,
      "learning_rate": 0.00017242,
      "loss": 0.0298,
      "step": 6900
    },
    {
      "epoch": 1.045306709023523,
      "grad_norm": 0.060128018260002136,
      "learning_rate": 0.00017238,
      "loss": 0.0351,
      "step": 6910
    },
    {
      "epoch": 1.0468194538990998,
      "grad_norm": 0.055250383913517,
      "learning_rate": 0.00017234000000000002,
      "loss": 0.0322,
      "step": 6920
    },
    {
      "epoch": 1.0483321987746765,
      "grad_norm": 0.07841707766056061,
      "learning_rate": 0.00017230000000000001,
      "loss": 0.0311,
      "step": 6930
    },
    {
      "epoch": 1.0498449436502533,
      "grad_norm": 0.06094701215624809,
      "learning_rate": 0.00017226,
      "loss": 0.0331,
      "step": 6940
    },
    {
      "epoch": 1.0513576885258302,
      "grad_norm": 0.0738435760140419,
      "learning_rate": 0.00017222,
      "loss": 0.0385,
      "step": 6950
    },
    {
      "epoch": 1.052870433401407,
      "grad_norm": 0.0741799846291542,
      "learning_rate": 0.00017218,
      "loss": 0.0332,
      "step": 6960
    },
    {
      "epoch": 1.0543831782769837,
      "grad_norm": 0.11769600957632065,
      "learning_rate": 0.00017214000000000002,
      "loss": 0.0288,
      "step": 6970
    },
    {
      "epoch": 1.0558959231525604,
      "grad_norm": 0.05547551065683365,
      "learning_rate": 0.0001721,
      "loss": 0.0351,
      "step": 6980
    },
    {
      "epoch": 1.0574086680281372,
      "grad_norm": 0.059602439403533936,
      "learning_rate": 0.00017206,
      "loss": 0.0315,
      "step": 6990
    },
    {
      "epoch": 1.0589214129037139,
      "grad_norm": 0.07523063570261002,
      "learning_rate": 0.00017202,
      "loss": 0.0344,
      "step": 7000
    },
    {
      "epoch": 1.0589214129037139,
      "eval_cer": 0.06192848124566072,
      "eval_loss": 0.03872867301106453,
      "eval_runtime": 10423.0915,
      "eval_samples_per_second": 2.02,
      "eval_steps_per_second": 0.253,
      "step": 7000
    },
    {
      "epoch": 1.0604341577792906,
      "grad_norm": 0.07334991544485092,
      "learning_rate": 0.00017198000000000002,
      "loss": 0.0394,
      "step": 7010
    },
    {
      "epoch": 1.0619469026548674,
      "grad_norm": 0.08875437080860138,
      "learning_rate": 0.00017194,
      "loss": 0.0316,
      "step": 7020
    },
    {
      "epoch": 1.063459647530444,
      "grad_norm": 0.06492207199335098,
      "learning_rate": 0.0001719,
      "loss": 0.0375,
      "step": 7030
    },
    {
      "epoch": 1.0649723924060208,
      "grad_norm": 0.08707519620656967,
      "learning_rate": 0.00017186,
      "loss": 0.0333,
      "step": 7040
    },
    {
      "epoch": 1.0664851372815976,
      "grad_norm": 0.06477733701467514,
      "learning_rate": 0.00017182,
      "loss": 0.036,
      "step": 7050
    },
    {
      "epoch": 1.0679978821571743,
      "grad_norm": 0.05914880335330963,
      "learning_rate": 0.00017178,
      "loss": 0.0307,
      "step": 7060
    },
    {
      "epoch": 1.069510627032751,
      "grad_norm": 0.11167873442173004,
      "learning_rate": 0.00017174,
      "loss": 0.0355,
      "step": 7070
    },
    {
      "epoch": 1.0710233719083277,
      "grad_norm": 0.08664342761039734,
      "learning_rate": 0.00017170000000000003,
      "loss": 0.0373,
      "step": 7080
    },
    {
      "epoch": 1.0725361167839045,
      "grad_norm": 0.06912154704332352,
      "learning_rate": 0.00017166,
      "loss": 0.0283,
      "step": 7090
    },
    {
      "epoch": 1.0740488616594812,
      "grad_norm": 0.09120757132768631,
      "learning_rate": 0.00017162000000000001,
      "loss": 0.0313,
      "step": 7100
    },
    {
      "epoch": 1.075561606535058,
      "grad_norm": 0.08159112185239792,
      "learning_rate": 0.00017158,
      "loss": 0.0413,
      "step": 7110
    },
    {
      "epoch": 1.0770743514106347,
      "grad_norm": 0.095944344997406,
      "learning_rate": 0.00017154,
      "loss": 0.0355,
      "step": 7120
    },
    {
      "epoch": 1.0785870962862114,
      "grad_norm": 0.10682930797338486,
      "learning_rate": 0.00017150000000000002,
      "loss": 0.0278,
      "step": 7130
    },
    {
      "epoch": 1.0800998411617881,
      "grad_norm": 0.06514004617929459,
      "learning_rate": 0.00017146,
      "loss": 0.0306,
      "step": 7140
    },
    {
      "epoch": 1.0816125860373649,
      "grad_norm": 0.07849156856536865,
      "learning_rate": 0.00017142,
      "loss": 0.0379,
      "step": 7150
    },
    {
      "epoch": 1.0831253309129416,
      "grad_norm": 0.0788741260766983,
      "learning_rate": 0.00017138,
      "loss": 0.032,
      "step": 7160
    },
    {
      "epoch": 1.0846380757885183,
      "grad_norm": 0.10495191067457199,
      "learning_rate": 0.00017134000000000002,
      "loss": 0.0358,
      "step": 7170
    },
    {
      "epoch": 1.086150820664095,
      "grad_norm": 0.07463409751653671,
      "learning_rate": 0.00017130000000000002,
      "loss": 0.0356,
      "step": 7180
    },
    {
      "epoch": 1.0876635655396718,
      "grad_norm": 0.08425049483776093,
      "learning_rate": 0.00017126,
      "loss": 0.0327,
      "step": 7190
    },
    {
      "epoch": 1.0891763104152485,
      "grad_norm": 0.07767146825790405,
      "learning_rate": 0.00017122,
      "loss": 0.034,
      "step": 7200
    },
    {
      "epoch": 1.0891763104152485,
      "eval_cer": 0.09758161553419167,
      "eval_loss": 0.037929706275463104,
      "eval_runtime": 10420.1284,
      "eval_samples_per_second": 2.02,
      "eval_steps_per_second": 0.253,
      "step": 7200
    },
    {
      "epoch": 1.0906890552908253,
      "grad_norm": 0.07770776748657227,
      "learning_rate": 0.00017118,
      "loss": 0.0321,
      "step": 7210
    },
    {
      "epoch": 1.092201800166402,
      "grad_norm": 0.06977003812789917,
      "learning_rate": 0.00017114000000000002,
      "loss": 0.0315,
      "step": 7220
    },
    {
      "epoch": 1.0937145450419787,
      "grad_norm": 0.077842116355896,
      "learning_rate": 0.0001711,
      "loss": 0.0317,
      "step": 7230
    },
    {
      "epoch": 1.0952272899175555,
      "grad_norm": 0.11414997279644012,
      "learning_rate": 0.00017106,
      "loss": 0.0392,
      "step": 7240
    },
    {
      "epoch": 1.0967400347931322,
      "grad_norm": 0.07568582892417908,
      "learning_rate": 0.00017102,
      "loss": 0.0369,
      "step": 7250
    },
    {
      "epoch": 1.098252779668709,
      "grad_norm": 0.07864728569984436,
      "learning_rate": 0.00017098000000000002,
      "loss": 0.038,
      "step": 7260
    },
    {
      "epoch": 1.0997655245442857,
      "grad_norm": 0.0852401927113533,
      "learning_rate": 0.00017094,
      "loss": 0.0323,
      "step": 7270
    },
    {
      "epoch": 1.1012782694198624,
      "grad_norm": 0.06548303365707397,
      "learning_rate": 0.0001709,
      "loss": 0.0373,
      "step": 7280
    },
    {
      "epoch": 1.1027910142954391,
      "grad_norm": 0.10153812170028687,
      "learning_rate": 0.00017086,
      "loss": 0.0321,
      "step": 7290
    },
    {
      "epoch": 1.1043037591710159,
      "grad_norm": 0.09032442420721054,
      "learning_rate": 0.00017082,
      "loss": 0.0306,
      "step": 7300
    },
    {
      "epoch": 1.1058165040465926,
      "grad_norm": 0.12109789252281189,
      "learning_rate": 0.00017078000000000001,
      "loss": 0.0355,
      "step": 7310
    },
    {
      "epoch": 1.1073292489221693,
      "grad_norm": 0.08515240997076035,
      "learning_rate": 0.00017074,
      "loss": 0.0374,
      "step": 7320
    },
    {
      "epoch": 1.108841993797746,
      "grad_norm": 0.06838446855545044,
      "learning_rate": 0.0001707,
      "loss": 0.0309,
      "step": 7330
    },
    {
      "epoch": 1.1103547386733228,
      "grad_norm": 0.10029911994934082,
      "learning_rate": 0.00017066,
      "loss": 0.0377,
      "step": 7340
    },
    {
      "epoch": 1.1118674835488995,
      "grad_norm": 0.08499938994646072,
      "learning_rate": 0.00017062,
      "loss": 0.0317,
      "step": 7350
    },
    {
      "epoch": 1.1133802284244763,
      "grad_norm": 0.10972133278846741,
      "learning_rate": 0.00017058,
      "loss": 0.0344,
      "step": 7360
    },
    {
      "epoch": 1.114892973300053,
      "grad_norm": 0.06848263740539551,
      "learning_rate": 0.00017054,
      "loss": 0.0356,
      "step": 7370
    },
    {
      "epoch": 1.1164057181756297,
      "grad_norm": 0.06813491135835648,
      "learning_rate": 0.00017050000000000002,
      "loss": 0.0291,
      "step": 7380
    },
    {
      "epoch": 1.1179184630512065,
      "grad_norm": 0.053215883672237396,
      "learning_rate": 0.00017046,
      "loss": 0.0297,
      "step": 7390
    },
    {
      "epoch": 1.1194312079267832,
      "grad_norm": 0.08575928211212158,
      "learning_rate": 0.00017042,
      "loss": 0.0378,
      "step": 7400
    },
    {
      "epoch": 1.1194312079267832,
      "eval_cer": 0.05163898174846133,
      "eval_loss": 0.03768303617835045,
      "eval_runtime": 10418.7834,
      "eval_samples_per_second": 2.021,
      "eval_steps_per_second": 0.253,
      "step": 7400
    },
    {
      "epoch": 1.12094395280236,
      "grad_norm": 0.07621601223945618,
      "learning_rate": 0.00017038,
      "loss": 0.032,
      "step": 7410
    },
    {
      "epoch": 1.1224566976779367,
      "grad_norm": 0.11499703675508499,
      "learning_rate": 0.00017034,
      "loss": 0.0331,
      "step": 7420
    },
    {
      "epoch": 1.1239694425535134,
      "grad_norm": 0.08789568394422531,
      "learning_rate": 0.00017030000000000002,
      "loss": 0.0332,
      "step": 7430
    },
    {
      "epoch": 1.1254821874290901,
      "grad_norm": 0.0887342318892479,
      "learning_rate": 0.00017025999999999999,
      "loss": 0.0374,
      "step": 7440
    },
    {
      "epoch": 1.1269949323046669,
      "grad_norm": 0.11794856935739517,
      "learning_rate": 0.00017022,
      "loss": 0.0347,
      "step": 7450
    },
    {
      "epoch": 1.1285076771802436,
      "grad_norm": 0.07593784481287003,
      "learning_rate": 0.00017018,
      "loss": 0.0323,
      "step": 7460
    },
    {
      "epoch": 1.1300204220558203,
      "grad_norm": 0.06868909299373627,
      "learning_rate": 0.00017014000000000002,
      "loss": 0.0311,
      "step": 7470
    },
    {
      "epoch": 1.131533166931397,
      "grad_norm": 0.1010032370686531,
      "learning_rate": 0.00017010000000000001,
      "loss": 0.0333,
      "step": 7480
    },
    {
      "epoch": 1.1330459118069738,
      "grad_norm": 0.08664656430482864,
      "learning_rate": 0.00017006,
      "loss": 0.0358,
      "step": 7490
    },
    {
      "epoch": 1.1345586566825505,
      "grad_norm": 0.09153386205434799,
      "learning_rate": 0.00017002,
      "loss": 0.0288,
      "step": 7500
    },
    {
      "epoch": 1.1360714015581272,
      "grad_norm": 0.10042116045951843,
      "learning_rate": 0.00016998,
      "loss": 0.0324,
      "step": 7510
    },
    {
      "epoch": 1.137584146433704,
      "grad_norm": 0.09703629463911057,
      "learning_rate": 0.00016994000000000002,
      "loss": 0.0356,
      "step": 7520
    },
    {
      "epoch": 1.1390968913092807,
      "grad_norm": 0.07961410284042358,
      "learning_rate": 0.0001699,
      "loss": 0.0279,
      "step": 7530
    },
    {
      "epoch": 1.1406096361848574,
      "grad_norm": 0.09164062142372131,
      "learning_rate": 0.00016986000000000003,
      "loss": 0.033,
      "step": 7540
    },
    {
      "epoch": 1.1421223810604342,
      "grad_norm": 0.0804910659790039,
      "learning_rate": 0.00016982,
      "loss": 0.033,
      "step": 7550
    },
    {
      "epoch": 1.143635125936011,
      "grad_norm": 0.07923970371484756,
      "learning_rate": 0.00016978000000000002,
      "loss": 0.0366,
      "step": 7560
    },
    {
      "epoch": 1.1451478708115876,
      "grad_norm": 0.1198810487985611,
      "learning_rate": 0.00016974,
      "loss": 0.0361,
      "step": 7570
    },
    {
      "epoch": 1.1466606156871644,
      "grad_norm": 0.08409520238637924,
      "learning_rate": 0.0001697,
      "loss": 0.0323,
      "step": 7580
    },
    {
      "epoch": 1.148173360562741,
      "grad_norm": 0.09524326026439667,
      "learning_rate": 0.00016966000000000003,
      "loss": 0.0338,
      "step": 7590
    },
    {
      "epoch": 1.1496861054383178,
      "grad_norm": 0.0670013502240181,
      "learning_rate": 0.00016962,
      "loss": 0.033,
      "step": 7600
    },
    {
      "epoch": 1.1496861054383178,
      "eval_cer": 0.04317970118571997,
      "eval_loss": 0.03775278851389885,
      "eval_runtime": 10413.2831,
      "eval_samples_per_second": 2.022,
      "eval_steps_per_second": 0.253,
      "step": 7600
    },
    {
      "epoch": 1.1511988503138946,
      "grad_norm": 0.07331959903240204,
      "learning_rate": 0.00016958,
      "loss": 0.0331,
      "step": 7610
    },
    {
      "epoch": 1.1527115951894713,
      "grad_norm": 0.06851343810558319,
      "learning_rate": 0.00016954,
      "loss": 0.0306,
      "step": 7620
    },
    {
      "epoch": 1.154224340065048,
      "grad_norm": 0.07627418637275696,
      "learning_rate": 0.00016950000000000003,
      "loss": 0.0334,
      "step": 7630
    },
    {
      "epoch": 1.1557370849406248,
      "grad_norm": 0.08676694333553314,
      "learning_rate": 0.00016946000000000002,
      "loss": 0.0322,
      "step": 7640
    },
    {
      "epoch": 1.1572498298162015,
      "grad_norm": 0.07023747265338898,
      "learning_rate": 0.00016942000000000001,
      "loss": 0.0358,
      "step": 7650
    },
    {
      "epoch": 1.1587625746917782,
      "grad_norm": 0.07805462926626205,
      "learning_rate": 0.00016938,
      "loss": 0.0325,
      "step": 7660
    },
    {
      "epoch": 1.160275319567355,
      "grad_norm": 0.0867529958486557,
      "learning_rate": 0.00016934,
      "loss": 0.0318,
      "step": 7670
    },
    {
      "epoch": 1.1617880644429317,
      "grad_norm": 0.08449842035770416,
      "learning_rate": 0.00016930000000000002,
      "loss": 0.0408,
      "step": 7680
    },
    {
      "epoch": 1.1633008093185084,
      "grad_norm": 0.08054087311029434,
      "learning_rate": 0.00016926000000000002,
      "loss": 0.0306,
      "step": 7690
    },
    {
      "epoch": 1.1648135541940852,
      "grad_norm": 0.08645962178707123,
      "learning_rate": 0.00016922,
      "loss": 0.0299,
      "step": 7700
    },
    {
      "epoch": 1.166326299069662,
      "grad_norm": 0.0892554521560669,
      "learning_rate": 0.00016918,
      "loss": 0.0352,
      "step": 7710
    },
    {
      "epoch": 1.1678390439452386,
      "grad_norm": 0.06643500924110413,
      "learning_rate": 0.00016914,
      "loss": 0.0284,
      "step": 7720
    },
    {
      "epoch": 1.1693517888208154,
      "grad_norm": 0.06918591260910034,
      "learning_rate": 0.00016910000000000002,
      "loss": 0.0278,
      "step": 7730
    },
    {
      "epoch": 1.170864533696392,
      "grad_norm": 0.08370740711688995,
      "learning_rate": 0.00016906,
      "loss": 0.0316,
      "step": 7740
    },
    {
      "epoch": 1.1723772785719688,
      "grad_norm": 0.053777385503053665,
      "learning_rate": 0.00016902,
      "loss": 0.036,
      "step": 7750
    },
    {
      "epoch": 1.1738900234475456,
      "grad_norm": 0.0665329247713089,
      "learning_rate": 0.00016898,
      "loss": 0.0333,
      "step": 7760
    },
    {
      "epoch": 1.1754027683231223,
      "grad_norm": 0.07484222948551178,
      "learning_rate": 0.00016894000000000002,
      "loss": 0.0319,
      "step": 7770
    },
    {
      "epoch": 1.176915513198699,
      "grad_norm": 0.08218715339899063,
      "learning_rate": 0.0001689,
      "loss": 0.0308,
      "step": 7780
    },
    {
      "epoch": 1.1784282580742758,
      "grad_norm": 0.06873024255037308,
      "learning_rate": 0.00016886,
      "loss": 0.0349,
      "step": 7790
    },
    {
      "epoch": 1.1799410029498525,
      "grad_norm": 0.07846609503030777,
      "learning_rate": 0.00016882,
      "loss": 0.0359,
      "step": 7800
    },
    {
      "epoch": 1.1799410029498525,
      "eval_cer": 0.1078840865459451,
      "eval_loss": 0.03878456726670265,
      "eval_runtime": 10398.1972,
      "eval_samples_per_second": 2.025,
      "eval_steps_per_second": 0.253,
      "step": 7800
    },
    {
      "epoch": 1.1814537478254292,
      "grad_norm": 0.06112883612513542,
      "learning_rate": 0.00016878,
      "loss": 0.0324,
      "step": 7810
    },
    {
      "epoch": 1.182966492701006,
      "grad_norm": 0.07065495103597641,
      "learning_rate": 0.00016874000000000001,
      "loss": 0.0333,
      "step": 7820
    },
    {
      "epoch": 1.1844792375765827,
      "grad_norm": 0.10944267362356186,
      "learning_rate": 0.0001687,
      "loss": 0.0322,
      "step": 7830
    },
    {
      "epoch": 1.1859919824521594,
      "grad_norm": 0.08741329610347748,
      "learning_rate": 0.00016866000000000003,
      "loss": 0.0339,
      "step": 7840
    },
    {
      "epoch": 1.1875047273277362,
      "grad_norm": 0.06457091867923737,
      "learning_rate": 0.00016862,
      "loss": 0.0345,
      "step": 7850
    },
    {
      "epoch": 1.1890174722033129,
      "grad_norm": 0.0570165179669857,
      "learning_rate": 0.00016858000000000002,
      "loss": 0.032,
      "step": 7860
    },
    {
      "epoch": 1.1905302170788896,
      "grad_norm": 0.07944530248641968,
      "learning_rate": 0.00016854,
      "loss": 0.0347,
      "step": 7870
    },
    {
      "epoch": 1.1920429619544664,
      "grad_norm": 0.06981216371059418,
      "learning_rate": 0.0001685,
      "loss": 0.0329,
      "step": 7880
    },
    {
      "epoch": 1.193555706830043,
      "grad_norm": 0.052252449095249176,
      "learning_rate": 0.00016846000000000002,
      "loss": 0.0327,
      "step": 7890
    },
    {
      "epoch": 1.1950684517056198,
      "grad_norm": 0.05333190783858299,
      "learning_rate": 0.00016842,
      "loss": 0.0269,
      "step": 7900
    },
    {
      "epoch": 1.1965811965811965,
      "grad_norm": 0.18012838065624237,
      "learning_rate": 0.00016838,
      "loss": 0.0324,
      "step": 7910
    },
    {
      "epoch": 1.1980939414567733,
      "grad_norm": 0.06892676651477814,
      "learning_rate": 0.00016834,
      "loss": 0.0294,
      "step": 7920
    },
    {
      "epoch": 1.19960668633235,
      "grad_norm": 0.07558593899011612,
      "learning_rate": 0.00016830000000000003,
      "loss": 0.0371,
      "step": 7930
    },
    {
      "epoch": 1.2011194312079267,
      "grad_norm": 0.08046507835388184,
      "learning_rate": 0.00016826000000000002,
      "loss": 0.0311,
      "step": 7940
    },
    {
      "epoch": 1.2026321760835035,
      "grad_norm": 0.07986424118280411,
      "learning_rate": 0.00016822,
      "loss": 0.0357,
      "step": 7950
    },
    {
      "epoch": 1.2041449209590802,
      "grad_norm": 0.07394195348024368,
      "learning_rate": 0.00016818,
      "loss": 0.0341,
      "step": 7960
    },
    {
      "epoch": 1.205657665834657,
      "grad_norm": 0.06269822269678116,
      "learning_rate": 0.00016814,
      "loss": 0.0329,
      "step": 7970
    },
    {
      "epoch": 1.2071704107102337,
      "grad_norm": 0.07179784774780273,
      "learning_rate": 0.00016810000000000002,
      "loss": 0.0329,
      "step": 7980
    },
    {
      "epoch": 1.2086831555858104,
      "grad_norm": 0.10174887627363205,
      "learning_rate": 0.00016806000000000001,
      "loss": 0.0262,
      "step": 7990
    },
    {
      "epoch": 1.2101959004613871,
      "grad_norm": 0.06536643952131271,
      "learning_rate": 0.00016802,
      "loss": 0.034,
      "step": 8000
    },
    {
      "epoch": 1.2101959004613871,
      "eval_cer": 0.15941559003095868,
      "eval_loss": 0.03837862238287926,
      "eval_runtime": 10390.1541,
      "eval_samples_per_second": 2.026,
      "eval_steps_per_second": 0.253,
      "step": 8000
    },
    {
      "epoch": 1.2117086453369639,
      "grad_norm": 0.13079065084457397,
      "learning_rate": 0.00016798,
      "loss": 0.037,
      "step": 8010
    },
    {
      "epoch": 1.2132213902125406,
      "grad_norm": 0.07293607294559479,
      "learning_rate": 0.00016794000000000002,
      "loss": 0.0295,
      "step": 8020
    },
    {
      "epoch": 1.2147341350881173,
      "grad_norm": 0.07390507310628891,
      "learning_rate": 0.00016790000000000002,
      "loss": 0.0309,
      "step": 8030
    },
    {
      "epoch": 1.216246879963694,
      "grad_norm": 0.22675780951976776,
      "learning_rate": 0.00016786,
      "loss": 0.0341,
      "step": 8040
    },
    {
      "epoch": 1.2177596248392708,
      "grad_norm": 0.06630139797925949,
      "learning_rate": 0.00016782,
      "loss": 0.0359,
      "step": 8050
    },
    {
      "epoch": 1.2192723697148475,
      "grad_norm": 0.09231210500001907,
      "learning_rate": 0.00016778,
      "loss": 0.0325,
      "step": 8060
    },
    {
      "epoch": 1.2207851145904243,
      "grad_norm": 0.067893847823143,
      "learning_rate": 0.00016774000000000002,
      "loss": 0.0338,
      "step": 8070
    },
    {
      "epoch": 1.222297859466001,
      "grad_norm": 0.16284491121768951,
      "learning_rate": 0.0001677,
      "loss": 0.0362,
      "step": 8080
    },
    {
      "epoch": 1.2238106043415777,
      "grad_norm": 0.07695828378200531,
      "learning_rate": 0.00016766,
      "loss": 0.0367,
      "step": 8090
    },
    {
      "epoch": 1.2253233492171545,
      "grad_norm": 0.07685229927301407,
      "learning_rate": 0.00016762,
      "loss": 0.0383,
      "step": 8100
    },
    {
      "epoch": 1.2268360940927312,
      "grad_norm": 0.08510534465312958,
      "learning_rate": 0.00016758,
      "loss": 0.0346,
      "step": 8110
    },
    {
      "epoch": 1.228348838968308,
      "grad_norm": 0.16018977761268616,
      "learning_rate": 0.00016754,
      "loss": 0.0314,
      "step": 8120
    },
    {
      "epoch": 1.2298615838438847,
      "grad_norm": 0.10644716769456863,
      "learning_rate": 0.0001675,
      "loss": 0.0427,
      "step": 8130
    },
    {
      "epoch": 1.2313743287194614,
      "grad_norm": 0.06390608847141266,
      "learning_rate": 0.00016746000000000003,
      "loss": 0.0333,
      "step": 8140
    },
    {
      "epoch": 1.2328870735950381,
      "grad_norm": 0.1173742264509201,
      "learning_rate": 0.00016742,
      "loss": 0.0335,
      "step": 8150
    },
    {
      "epoch": 1.2343998184706149,
      "grad_norm": 0.08506636321544647,
      "learning_rate": 0.00016738000000000001,
      "loss": 0.0393,
      "step": 8160
    },
    {
      "epoch": 1.2359125633461916,
      "grad_norm": 0.08176897466182709,
      "learning_rate": 0.00016734,
      "loss": 0.0306,
      "step": 8170
    },
    {
      "epoch": 1.2374253082217683,
      "grad_norm": 0.11272590607404709,
      "learning_rate": 0.0001673,
      "loss": 0.0368,
      "step": 8180
    },
    {
      "epoch": 1.238938053097345,
      "grad_norm": 0.10923430323600769,
      "learning_rate": 0.00016726000000000002,
      "loss": 0.0389,
      "step": 8190
    },
    {
      "epoch": 1.2404507979729218,
      "grad_norm": 0.05665091425180435,
      "learning_rate": 0.00016722,
      "loss": 0.0352,
      "step": 8200
    },
    {
      "epoch": 1.2404507979729218,
      "eval_cer": 0.195939668868118,
      "eval_loss": 0.03837649151682854,
      "eval_runtime": 10379.5895,
      "eval_samples_per_second": 2.028,
      "eval_steps_per_second": 0.254,
      "step": 8200
    },
    {
      "epoch": 1.2419635428484985,
      "grad_norm": 0.08927123993635178,
      "learning_rate": 0.00016718,
      "loss": 0.0356,
      "step": 8210
    },
    {
      "epoch": 1.2434762877240753,
      "grad_norm": 0.09398534893989563,
      "learning_rate": 0.00016714,
      "loss": 0.0365,
      "step": 8220
    },
    {
      "epoch": 1.244989032599652,
      "grad_norm": 0.0905461311340332,
      "learning_rate": 0.00016710000000000002,
      "loss": 0.0335,
      "step": 8230
    },
    {
      "epoch": 1.2465017774752287,
      "grad_norm": 0.09033455699682236,
      "learning_rate": 0.00016706000000000002,
      "loss": 0.0376,
      "step": 8240
    },
    {
      "epoch": 1.2480145223508055,
      "grad_norm": 0.08217161148786545,
      "learning_rate": 0.00016702,
      "loss": 0.032,
      "step": 8250
    },
    {
      "epoch": 1.2495272672263822,
      "grad_norm": 0.0694824755191803,
      "learning_rate": 0.00016698,
      "loss": 0.0354,
      "step": 8260
    },
    {
      "epoch": 1.2510400121019591,
      "grad_norm": 0.08535374701023102,
      "learning_rate": 0.00016694,
      "loss": 0.0288,
      "step": 8270
    },
    {
      "epoch": 1.2525527569775359,
      "grad_norm": 0.10267391055822372,
      "learning_rate": 0.00016690000000000002,
      "loss": 0.0331,
      "step": 8280
    },
    {
      "epoch": 1.2540655018531126,
      "grad_norm": 0.0720328763127327,
      "learning_rate": 0.00016686,
      "loss": 0.0324,
      "step": 8290
    },
    {
      "epoch": 1.2555782467286893,
      "grad_norm": 0.15617039799690247,
      "learning_rate": 0.00016682,
      "loss": 0.0374,
      "step": 8300
    },
    {
      "epoch": 1.257090991604266,
      "grad_norm": 0.09863468259572983,
      "learning_rate": 0.00016678,
      "loss": 0.0363,
      "step": 8310
    },
    {
      "epoch": 1.2586037364798428,
      "grad_norm": 0.08562877029180527,
      "learning_rate": 0.00016674000000000002,
      "loss": 0.0347,
      "step": 8320
    },
    {
      "epoch": 1.2601164813554195,
      "grad_norm": 0.09868349879980087,
      "learning_rate": 0.0001667,
      "loss": 0.0362,
      "step": 8330
    },
    {
      "epoch": 1.2616292262309963,
      "grad_norm": 0.09744835644960403,
      "learning_rate": 0.00016666,
      "loss": 0.0364,
      "step": 8340
    },
    {
      "epoch": 1.263141971106573,
      "grad_norm": 0.19243358075618744,
      "learning_rate": 0.00016662,
      "loss": 0.0378,
      "step": 8350
    },
    {
      "epoch": 1.2646547159821497,
      "grad_norm": 0.06478457897901535,
      "learning_rate": 0.00016658,
      "loss": 0.033,
      "step": 8360
    },
    {
      "epoch": 1.2661674608577265,
      "grad_norm": 0.09313791990280151,
      "learning_rate": 0.00016654000000000001,
      "loss": 0.04,
      "step": 8370
    },
    {
      "epoch": 1.2676802057333032,
      "grad_norm": 0.0906825065612793,
      "learning_rate": 0.0001665,
      "loss": 0.0341,
      "step": 8380
    },
    {
      "epoch": 1.26919295060888,
      "grad_norm": 0.08549359440803528,
      "learning_rate": 0.00016646000000000003,
      "loss": 0.0376,
      "step": 8390
    },
    {
      "epoch": 1.2707056954844567,
      "grad_norm": 0.0915452241897583,
      "learning_rate": 0.00016642,
      "loss": 0.029,
      "step": 8400
    },
    {
      "epoch": 1.2707056954844567,
      "eval_cer": 0.19141261028875828,
      "eval_loss": 0.03777679055929184,
      "eval_runtime": 10360.722,
      "eval_samples_per_second": 2.032,
      "eval_steps_per_second": 0.254,
      "step": 8400
    },
    {
      "epoch": 1.2722184403600334,
      "grad_norm": 0.07039971649646759,
      "learning_rate": 0.00016638,
      "loss": 0.0355,
      "step": 8410
    },
    {
      "epoch": 1.2737311852356101,
      "grad_norm": 0.08890164643526077,
      "learning_rate": 0.00016634,
      "loss": 0.03,
      "step": 8420
    },
    {
      "epoch": 1.2752439301111869,
      "grad_norm": 0.07611805945634842,
      "learning_rate": 0.0001663,
      "loss": 0.037,
      "step": 8430
    },
    {
      "epoch": 1.2767566749867636,
      "grad_norm": 0.10268427431583405,
      "learning_rate": 0.00016626000000000002,
      "loss": 0.0346,
      "step": 8440
    },
    {
      "epoch": 1.2782694198623403,
      "grad_norm": 0.07185817509889603,
      "learning_rate": 0.00016622,
      "loss": 0.0334,
      "step": 8450
    },
    {
      "epoch": 1.279782164737917,
      "grad_norm": 0.09720634669065475,
      "learning_rate": 0.00016618,
      "loss": 0.0328,
      "step": 8460
    },
    {
      "epoch": 1.2812949096134938,
      "grad_norm": 0.08373324573040009,
      "learning_rate": 0.00016614,
      "loss": 0.0342,
      "step": 8470
    },
    {
      "epoch": 1.2828076544890705,
      "grad_norm": 0.05525701493024826,
      "learning_rate": 0.0001661,
      "loss": 0.0295,
      "step": 8480
    },
    {
      "epoch": 1.2843203993646473,
      "grad_norm": 0.08398504555225372,
      "learning_rate": 0.00016606000000000002,
      "loss": 0.0336,
      "step": 8490
    },
    {
      "epoch": 1.285833144240224,
      "grad_norm": 0.11384329944849014,
      "learning_rate": 0.00016601999999999999,
      "loss": 0.0335,
      "step": 8500
    },
    {
      "epoch": 1.2873458891158007,
      "grad_norm": 0.05366117134690285,
      "learning_rate": 0.00016598,
      "loss": 0.0303,
      "step": 8510
    },
    {
      "epoch": 1.2888586339913775,
      "grad_norm": 0.09270923584699631,
      "learning_rate": 0.00016594,
      "loss": 0.0309,
      "step": 8520
    },
    {
      "epoch": 1.2903713788669542,
      "grad_norm": 0.09621911495923996,
      "learning_rate": 0.00016590000000000002,
      "loss": 0.0326,
      "step": 8530
    },
    {
      "epoch": 1.291884123742531,
      "grad_norm": 0.09750113636255264,
      "learning_rate": 0.00016586000000000001,
      "loss": 0.032,
      "step": 8540
    },
    {
      "epoch": 1.2933968686181077,
      "grad_norm": 0.08557499945163727,
      "learning_rate": 0.00016582,
      "loss": 0.0331,
      "step": 8550
    },
    {
      "epoch": 1.2949096134936844,
      "grad_norm": 0.0842200294137001,
      "learning_rate": 0.00016578,
      "loss": 0.0339,
      "step": 8560
    },
    {
      "epoch": 1.2964223583692611,
      "grad_norm": 0.06341574341058731,
      "learning_rate": 0.00016574,
      "loss": 0.0369,
      "step": 8570
    },
    {
      "epoch": 1.2979351032448379,
      "grad_norm": 0.07687686383724213,
      "learning_rate": 0.00016570000000000002,
      "loss": 0.0291,
      "step": 8580
    },
    {
      "epoch": 1.2994478481204146,
      "grad_norm": 0.07118263840675354,
      "learning_rate": 0.00016566,
      "loss": 0.0331,
      "step": 8590
    },
    {
      "epoch": 1.3009605929959913,
      "grad_norm": 0.10967772454023361,
      "learning_rate": 0.00016562,
      "loss": 0.04,
      "step": 8600
    },
    {
      "epoch": 1.3009605929959913,
      "eval_cer": 0.15955704130871465,
      "eval_loss": 0.03786647692322731,
      "eval_runtime": 10383.8112,
      "eval_samples_per_second": 2.027,
      "eval_steps_per_second": 0.253,
      "step": 8600
    },
    {
      "epoch": 1.302473337871568,
      "grad_norm": 0.09102348983287811,
      "learning_rate": 0.00016558,
      "loss": 0.0337,
      "step": 8610
    },
    {
      "epoch": 1.3039860827471448,
      "grad_norm": 0.0596625916659832,
      "learning_rate": 0.00016554000000000002,
      "loss": 0.0341,
      "step": 8620
    },
    {
      "epoch": 1.3054988276227215,
      "grad_norm": 0.0790410116314888,
      "learning_rate": 0.0001655,
      "loss": 0.0348,
      "step": 8630
    },
    {
      "epoch": 1.3070115724982982,
      "grad_norm": 0.08243832737207413,
      "learning_rate": 0.00016546,
      "loss": 0.0351,
      "step": 8640
    },
    {
      "epoch": 1.308524317373875,
      "grad_norm": 0.07890262454748154,
      "learning_rate": 0.00016542,
      "loss": 0.0331,
      "step": 8650
    },
    {
      "epoch": 1.3100370622494517,
      "grad_norm": 0.06424404680728912,
      "learning_rate": 0.00016538,
      "loss": 0.032,
      "step": 8660
    },
    {
      "epoch": 1.3115498071250284,
      "grad_norm": 0.08828658610582352,
      "learning_rate": 0.00016534,
      "loss": 0.0351,
      "step": 8670
    },
    {
      "epoch": 1.3130625520006052,
      "grad_norm": 0.07190482318401337,
      "learning_rate": 0.0001653,
      "loss": 0.0334,
      "step": 8680
    },
    {
      "epoch": 1.314575296876182,
      "grad_norm": 0.1207108125090599,
      "learning_rate": 0.00016526000000000003,
      "loss": 0.0333,
      "step": 8690
    },
    {
      "epoch": 1.3160880417517586,
      "grad_norm": 0.057197410613298416,
      "learning_rate": 0.00016522,
      "loss": 0.0273,
      "step": 8700
    },
    {
      "epoch": 1.3176007866273354,
      "grad_norm": 0.0845530703663826,
      "learning_rate": 0.00016518000000000001,
      "loss": 0.0398,
      "step": 8710
    },
    {
      "epoch": 1.319113531502912,
      "grad_norm": 0.07357069104909897,
      "learning_rate": 0.00016514,
      "loss": 0.0334,
      "step": 8720
    },
    {
      "epoch": 1.3206262763784888,
      "grad_norm": 0.07419273257255554,
      "learning_rate": 0.0001651,
      "loss": 0.0267,
      "step": 8730
    },
    {
      "epoch": 1.3221390212540656,
      "grad_norm": 0.08293847739696503,
      "learning_rate": 0.00016506000000000002,
      "loss": 0.0286,
      "step": 8740
    },
    {
      "epoch": 1.3236517661296423,
      "grad_norm": 0.09437254071235657,
      "learning_rate": 0.00016502,
      "loss": 0.0411,
      "step": 8750
    },
    {
      "epoch": 1.325164511005219,
      "grad_norm": 0.06988554447889328,
      "learning_rate": 0.00016498,
      "loss": 0.0288,
      "step": 8760
    },
    {
      "epoch": 1.3266772558807958,
      "grad_norm": 0.11081293970346451,
      "learning_rate": 0.00016494,
      "loss": 0.0342,
      "step": 8770
    },
    {
      "epoch": 1.3281900007563725,
      "grad_norm": 0.0911073237657547,
      "learning_rate": 0.0001649,
      "loss": 0.0324,
      "step": 8780
    },
    {
      "epoch": 1.3297027456319492,
      "grad_norm": 0.08337673544883728,
      "learning_rate": 0.00016486000000000002,
      "loss": 0.0297,
      "step": 8790
    },
    {
      "epoch": 1.331215490507526,
      "grad_norm": 0.09077824652194977,
      "learning_rate": 0.00016482,
      "loss": 0.0319,
      "step": 8800
    },
    {
      "epoch": 1.331215490507526,
      "eval_cer": 0.050760007214632856,
      "eval_loss": 0.03842457756400108,
      "eval_runtime": 10378.6583,
      "eval_samples_per_second": 2.028,
      "eval_steps_per_second": 0.254,
      "step": 8800
    },
    {
      "epoch": 1.3327282353831027,
      "grad_norm": 0.12336084991693497,
      "learning_rate": 0.00016478,
      "loss": 0.0371,
      "step": 8810
    },
    {
      "epoch": 1.3342409802586794,
      "grad_norm": 0.07978357374668121,
      "learning_rate": 0.00016474,
      "loss": 0.0349,
      "step": 8820
    },
    {
      "epoch": 1.3357537251342562,
      "grad_norm": 0.1073361411690712,
      "learning_rate": 0.00016470000000000002,
      "loss": 0.0417,
      "step": 8830
    },
    {
      "epoch": 1.337266470009833,
      "grad_norm": 0.05822708085179329,
      "learning_rate": 0.00016466,
      "loss": 0.0302,
      "step": 8840
    },
    {
      "epoch": 1.3387792148854096,
      "grad_norm": 0.06241593137383461,
      "learning_rate": 0.00016462,
      "loss": 0.0365,
      "step": 8850
    },
    {
      "epoch": 1.3402919597609864,
      "grad_norm": 0.10107123106718063,
      "learning_rate": 0.00016458,
      "loss": 0.0345,
      "step": 8860
    },
    {
      "epoch": 1.341804704636563,
      "grad_norm": 0.09659604728221893,
      "learning_rate": 0.00016454,
      "loss": 0.0324,
      "step": 8870
    },
    {
      "epoch": 1.3433174495121398,
      "grad_norm": 0.07501540333032608,
      "learning_rate": 0.00016450000000000001,
      "loss": 0.0317,
      "step": 8880
    },
    {
      "epoch": 1.3448301943877166,
      "grad_norm": 0.071120485663414,
      "learning_rate": 0.00016446,
      "loss": 0.0299,
      "step": 8890
    },
    {
      "epoch": 1.3463429392632933,
      "grad_norm": 0.07235920429229736,
      "learning_rate": 0.00016442000000000003,
      "loss": 0.0337,
      "step": 8900
    },
    {
      "epoch": 1.34785568413887,
      "grad_norm": 0.08588097244501114,
      "learning_rate": 0.00016438,
      "loss": 0.0302,
      "step": 8910
    },
    {
      "epoch": 1.3493684290144468,
      "grad_norm": 0.052244190126657486,
      "learning_rate": 0.00016434000000000002,
      "loss": 0.0326,
      "step": 8920
    },
    {
      "epoch": 1.3508811738900235,
      "grad_norm": 0.0702931210398674,
      "learning_rate": 0.0001643,
      "loss": 0.0372,
      "step": 8930
    },
    {
      "epoch": 1.3523939187656002,
      "grad_norm": 0.10441485792398453,
      "learning_rate": 0.00016426,
      "loss": 0.037,
      "step": 8940
    },
    {
      "epoch": 1.353906663641177,
      "grad_norm": 0.10514800250530243,
      "learning_rate": 0.00016422000000000002,
      "loss": 0.037,
      "step": 8950
    },
    {
      "epoch": 1.3554194085167537,
      "grad_norm": 0.07011867314577103,
      "learning_rate": 0.00016418,
      "loss": 0.0314,
      "step": 8960
    },
    {
      "epoch": 1.3569321533923304,
      "grad_norm": 0.06335943937301636,
      "learning_rate": 0.00016414,
      "loss": 0.0311,
      "step": 8970
    },
    {
      "epoch": 1.3584448982679072,
      "grad_norm": 0.07194424420595169,
      "learning_rate": 0.0001641,
      "loss": 0.0336,
      "step": 8980
    },
    {
      "epoch": 1.3599576431434839,
      "grad_norm": 0.07171431183815002,
      "learning_rate": 0.00016406000000000003,
      "loss": 0.0312,
      "step": 8990
    },
    {
      "epoch": 1.3614703880190606,
      "grad_norm": 0.14893119037151337,
      "learning_rate": 0.00016402000000000002,
      "loss": 0.0348,
      "step": 9000
    },
    {
      "epoch": 1.3614703880190606,
      "eval_cer": 0.23852391576669063,
      "eval_loss": 0.03737874701619148,
      "eval_runtime": 10378.6671,
      "eval_samples_per_second": 2.028,
      "eval_steps_per_second": 0.254,
      "step": 9000
    },
    {
      "epoch": 1.3629831328946374,
      "grad_norm": 0.09854207932949066,
      "learning_rate": 0.00016398,
      "loss": 0.0334,
      "step": 9010
    },
    {
      "epoch": 1.364495877770214,
      "grad_norm": 0.0829731673002243,
      "learning_rate": 0.00016394,
      "loss": 0.0367,
      "step": 9020
    },
    {
      "epoch": 1.3660086226457908,
      "grad_norm": 0.05378841981291771,
      "learning_rate": 0.0001639,
      "loss": 0.0328,
      "step": 9030
    },
    {
      "epoch": 1.3675213675213675,
      "grad_norm": 0.08590775728225708,
      "learning_rate": 0.00016386000000000002,
      "loss": 0.0337,
      "step": 9040
    },
    {
      "epoch": 1.3690341123969443,
      "grad_norm": 0.06473217159509659,
      "learning_rate": 0.00016382000000000001,
      "loss": 0.0309,
      "step": 9050
    },
    {
      "epoch": 1.370546857272521,
      "grad_norm": 0.14496292173862457,
      "learning_rate": 0.00016378,
      "loss": 0.0362,
      "step": 9060
    },
    {
      "epoch": 1.3720596021480977,
      "grad_norm": 0.0658840760588646,
      "learning_rate": 0.00016374,
      "loss": 0.0316,
      "step": 9070
    },
    {
      "epoch": 1.3735723470236745,
      "grad_norm": 0.0722692534327507,
      "learning_rate": 0.00016370000000000002,
      "loss": 0.0321,
      "step": 9080
    },
    {
      "epoch": 1.3750850918992512,
      "grad_norm": 0.0751873180270195,
      "learning_rate": 0.00016366000000000002,
      "loss": 0.0357,
      "step": 9090
    },
    {
      "epoch": 1.376597836774828,
      "grad_norm": 0.07309116423130035,
      "learning_rate": 0.00016362,
      "loss": 0.0329,
      "step": 9100
    },
    {
      "epoch": 1.3781105816504047,
      "grad_norm": 0.09205902367830276,
      "learning_rate": 0.00016358,
      "loss": 0.0311,
      "step": 9110
    },
    {
      "epoch": 1.3796233265259814,
      "grad_norm": 0.06787604093551636,
      "learning_rate": 0.00016354,
      "loss": 0.0308,
      "step": 9120
    },
    {
      "epoch": 1.3811360714015581,
      "grad_norm": 0.08365906029939651,
      "learning_rate": 0.00016350000000000002,
      "loss": 0.0344,
      "step": 9130
    },
    {
      "epoch": 1.3826488162771349,
      "grad_norm": 0.07461418211460114,
      "learning_rate": 0.00016346,
      "loss": 0.0286,
      "step": 9140
    },
    {
      "epoch": 1.3841615611527116,
      "grad_norm": 0.11862760782241821,
      "learning_rate": 0.00016342,
      "loss": 0.0361,
      "step": 9150
    },
    {
      "epoch": 1.3856743060282883,
      "grad_norm": 0.07170487195253372,
      "learning_rate": 0.00016338,
      "loss": 0.0335,
      "step": 9160
    },
    {
      "epoch": 1.387187050903865,
      "grad_norm": 0.05578533932566643,
      "learning_rate": 0.00016334,
      "loss": 0.0311,
      "step": 9170
    },
    {
      "epoch": 1.3886997957794418,
      "grad_norm": 0.08838359266519547,
      "learning_rate": 0.0001633,
      "loss": 0.0341,
      "step": 9180
    },
    {
      "epoch": 1.3902125406550185,
      "grad_norm": 0.09284081310033798,
      "learning_rate": 0.00016326,
      "loss": 0.0322,
      "step": 9190
    },
    {
      "epoch": 1.3917252855305953,
      "grad_norm": 0.07425800710916519,
      "learning_rate": 0.00016322000000000003,
      "loss": 0.0319,
      "step": 9200
    },
    {
      "epoch": 1.3917252855305953,
      "eval_cer": 0.11210909414354649,
      "eval_loss": 0.036687206476926804,
      "eval_runtime": 10439.2076,
      "eval_samples_per_second": 2.017,
      "eval_steps_per_second": 0.252,
      "step": 9200
    },
    {
      "epoch": 1.393238030406172,
      "grad_norm": 0.0754477009177208,
      "learning_rate": 0.00016318,
      "loss": 0.0355,
      "step": 9210
    },
    {
      "epoch": 1.3947507752817487,
      "grad_norm": 0.06408898532390594,
      "learning_rate": 0.00016314,
      "loss": 0.0345,
      "step": 9220
    },
    {
      "epoch": 1.3962635201573255,
      "grad_norm": 0.06003674492239952,
      "learning_rate": 0.0001631,
      "loss": 0.0316,
      "step": 9230
    },
    {
      "epoch": 1.3977762650329022,
      "grad_norm": 0.07409165799617767,
      "learning_rate": 0.00016306,
      "loss": 0.03,
      "step": 9240
    },
    {
      "epoch": 1.399289009908479,
      "grad_norm": 0.07411226630210876,
      "learning_rate": 0.00016302000000000002,
      "loss": 0.0325,
      "step": 9250
    },
    {
      "epoch": 1.4008017547840557,
      "grad_norm": 0.09041300415992737,
      "learning_rate": 0.00016298,
      "loss": 0.034,
      "step": 9260
    },
    {
      "epoch": 1.4023144996596324,
      "grad_norm": 0.0684356689453125,
      "learning_rate": 0.00016294,
      "loss": 0.0345,
      "step": 9270
    },
    {
      "epoch": 1.4038272445352091,
      "grad_norm": 0.08621818572282791,
      "learning_rate": 0.0001629,
      "loss": 0.0287,
      "step": 9280
    },
    {
      "epoch": 1.4053399894107859,
      "grad_norm": 0.09592179954051971,
      "learning_rate": 0.00016286000000000002,
      "loss": 0.0371,
      "step": 9290
    },
    {
      "epoch": 1.4068527342863626,
      "grad_norm": 0.061489395797252655,
      "learning_rate": 0.00016282000000000002,
      "loss": 0.0297,
      "step": 9300
    },
    {
      "epoch": 1.4083654791619393,
      "grad_norm": 0.08933687955141068,
      "learning_rate": 0.00016278,
      "loss": 0.0329,
      "step": 9310
    },
    {
      "epoch": 1.409878224037516,
      "grad_norm": 0.06542832404375076,
      "learning_rate": 0.00016274,
      "loss": 0.0359,
      "step": 9320
    },
    {
      "epoch": 1.4113909689130928,
      "grad_norm": 0.10515543818473816,
      "learning_rate": 0.0001627,
      "loss": 0.0282,
      "step": 9330
    },
    {
      "epoch": 1.4129037137886695,
      "grad_norm": 0.11535684019327164,
      "learning_rate": 0.00016266000000000002,
      "loss": 0.0346,
      "step": 9340
    },
    {
      "epoch": 1.4144164586642463,
      "grad_norm": 0.10359009355306625,
      "learning_rate": 0.00016262,
      "loss": 0.0326,
      "step": 9350
    },
    {
      "epoch": 1.415929203539823,
      "grad_norm": 0.08905740082263947,
      "learning_rate": 0.00016258,
      "loss": 0.0353,
      "step": 9360
    },
    {
      "epoch": 1.4174419484153997,
      "grad_norm": 0.0570446141064167,
      "learning_rate": 0.00016254,
      "loss": 0.0282,
      "step": 9370
    },
    {
      "epoch": 1.4189546932909765,
      "grad_norm": 0.0748140960931778,
      "learning_rate": 0.00016250000000000002,
      "loss": 0.0304,
      "step": 9380
    },
    {
      "epoch": 1.4204674381665532,
      "grad_norm": 0.07355400919914246,
      "learning_rate": 0.00016246,
      "loss": 0.031,
      "step": 9390
    },
    {
      "epoch": 1.42198018304213,
      "grad_norm": 0.09431416541337967,
      "learning_rate": 0.00016242,
      "loss": 0.0355,
      "step": 9400
    },
    {
      "epoch": 1.42198018304213,
      "eval_cer": 0.09460805024547048,
      "eval_loss": 0.03653513640165329,
      "eval_runtime": 10519.6629,
      "eval_samples_per_second": 2.001,
      "eval_steps_per_second": 0.25,
      "step": 9400
    },
    {
      "epoch": 1.4234929279177067,
      "grad_norm": 0.10641132295131683,
      "learning_rate": 0.00016238,
      "loss": 0.0299,
      "step": 9410
    },
    {
      "epoch": 1.4250056727932834,
      "grad_norm": 0.051270656287670135,
      "learning_rate": 0.00016234,
      "loss": 0.0317,
      "step": 9420
    },
    {
      "epoch": 1.4265184176688601,
      "grad_norm": 0.07362283766269684,
      "learning_rate": 0.00016230000000000001,
      "loss": 0.0269,
      "step": 9430
    },
    {
      "epoch": 1.4280311625444368,
      "grad_norm": 0.060159552842378616,
      "learning_rate": 0.00016226,
      "loss": 0.0335,
      "step": 9440
    },
    {
      "epoch": 1.4295439074200136,
      "grad_norm": 0.08667318522930145,
      "learning_rate": 0.00016222000000000003,
      "loss": 0.0361,
      "step": 9450
    },
    {
      "epoch": 1.4310566522955903,
      "grad_norm": 0.06154588237404823,
      "learning_rate": 0.00016218,
      "loss": 0.0334,
      "step": 9460
    },
    {
      "epoch": 1.432569397171167,
      "grad_norm": 0.10563425719738007,
      "learning_rate": 0.00016214000000000002,
      "loss": 0.0362,
      "step": 9470
    },
    {
      "epoch": 1.4340821420467438,
      "grad_norm": 0.10325556248426437,
      "learning_rate": 0.0001621,
      "loss": 0.0343,
      "step": 9480
    },
    {
      "epoch": 1.4355948869223205,
      "grad_norm": 0.08902329206466675,
      "learning_rate": 0.00016206,
      "loss": 0.032,
      "step": 9490
    },
    {
      "epoch": 1.4371076317978972,
      "grad_norm": 0.07280543446540833,
      "learning_rate": 0.00016202000000000002,
      "loss": 0.0366,
      "step": 9500
    },
    {
      "epoch": 1.438620376673474,
      "grad_norm": 0.09071139991283417,
      "learning_rate": 0.00016198,
      "loss": 0.0299,
      "step": 9510
    },
    {
      "epoch": 1.4401331215490507,
      "grad_norm": 0.06658421456813812,
      "learning_rate": 0.00016194,
      "loss": 0.0281,
      "step": 9520
    },
    {
      "epoch": 1.4416458664246274,
      "grad_norm": 0.0793207511305809,
      "learning_rate": 0.0001619,
      "loss": 0.0292,
      "step": 9530
    },
    {
      "epoch": 1.4431586113002042,
      "grad_norm": 0.0829392522573471,
      "learning_rate": 0.00016186,
      "loss": 0.0337,
      "step": 9540
    },
    {
      "epoch": 1.444671356175781,
      "grad_norm": 0.061817191541194916,
      "learning_rate": 0.00016182000000000002,
      "loss": 0.0298,
      "step": 9550
    },
    {
      "epoch": 1.4461841010513576,
      "grad_norm": 0.09837779402732849,
      "learning_rate": 0.00016177999999999999,
      "loss": 0.037,
      "step": 9560
    },
    {
      "epoch": 1.4476968459269344,
      "grad_norm": 0.05777046084403992,
      "learning_rate": 0.00016174,
      "loss": 0.0339,
      "step": 9570
    },
    {
      "epoch": 1.449209590802511,
      "grad_norm": 0.07731931656599045,
      "learning_rate": 0.0001617,
      "loss": 0.0338,
      "step": 9580
    },
    {
      "epoch": 1.4507223356780878,
      "grad_norm": 0.08898504078388214,
      "learning_rate": 0.00016166000000000002,
      "loss": 0.0358,
      "step": 9590
    },
    {
      "epoch": 1.4522350805536646,
      "grad_norm": 0.0696534812450409,
      "learning_rate": 0.00016162000000000001,
      "loss": 0.0318,
      "step": 9600
    },
    {
      "epoch": 1.4522350805536646,
      "eval_cer": 0.08453906649568975,
      "eval_loss": 0.036363635212183,
      "eval_runtime": 10514.0599,
      "eval_samples_per_second": 2.002,
      "eval_steps_per_second": 0.25,
      "step": 9600
    },
    {
      "epoch": 1.4537478254292413,
      "grad_norm": 0.059242941439151764,
      "learning_rate": 0.00016158,
      "loss": 0.0313,
      "step": 9610
    },
    {
      "epoch": 1.455260570304818,
      "grad_norm": 0.0844852551817894,
      "learning_rate": 0.00016154,
      "loss": 0.034,
      "step": 9620
    },
    {
      "epoch": 1.4567733151803948,
      "grad_norm": 0.08737514168024063,
      "learning_rate": 0.0001615,
      "loss": 0.0314,
      "step": 9630
    },
    {
      "epoch": 1.4582860600559715,
      "grad_norm": 0.08028477430343628,
      "learning_rate": 0.00016146000000000002,
      "loss": 0.028,
      "step": 9640
    },
    {
      "epoch": 1.4597988049315482,
      "grad_norm": 0.08293917775154114,
      "learning_rate": 0.00016142,
      "loss": 0.0344,
      "step": 9650
    },
    {
      "epoch": 1.461311549807125,
      "grad_norm": 0.07055462896823883,
      "learning_rate": 0.00016138,
      "loss": 0.0329,
      "step": 9660
    },
    {
      "epoch": 1.4628242946827017,
      "grad_norm": 0.08431320637464523,
      "learning_rate": 0.00016134,
      "loss": 0.0313,
      "step": 9670
    },
    {
      "epoch": 1.4643370395582784,
      "grad_norm": 0.09756868332624435,
      "learning_rate": 0.00016130000000000002,
      "loss": 0.0305,
      "step": 9680
    },
    {
      "epoch": 1.4658497844338552,
      "grad_norm": 0.07265082001686096,
      "learning_rate": 0.00016126,
      "loss": 0.0333,
      "step": 9690
    },
    {
      "epoch": 1.467362529309432,
      "grad_norm": 0.09156455099582672,
      "learning_rate": 0.00016122,
      "loss": 0.0356,
      "step": 9700
    },
    {
      "epoch": 1.4688752741850086,
      "grad_norm": 0.06957582384347916,
      "learning_rate": 0.00016118,
      "loss": 0.0313,
      "step": 9710
    },
    {
      "epoch": 1.4703880190605854,
      "grad_norm": 0.06783420592546463,
      "learning_rate": 0.00016114,
      "loss": 0.0297,
      "step": 9720
    },
    {
      "epoch": 1.471900763936162,
      "grad_norm": 0.07193417102098465,
      "learning_rate": 0.0001611,
      "loss": 0.0302,
      "step": 9730
    },
    {
      "epoch": 1.4734135088117388,
      "grad_norm": 0.08238872140645981,
      "learning_rate": 0.00016106,
      "loss": 0.0335,
      "step": 9740
    },
    {
      "epoch": 1.4749262536873156,
      "grad_norm": 0.07197025418281555,
      "learning_rate": 0.00016102000000000003,
      "loss": 0.0369,
      "step": 9750
    },
    {
      "epoch": 1.4764389985628923,
      "grad_norm": 0.08109525591135025,
      "learning_rate": 0.00016098,
      "loss": 0.0327,
      "step": 9760
    },
    {
      "epoch": 1.477951743438469,
      "grad_norm": 0.12331151217222214,
      "learning_rate": 0.00016094000000000001,
      "loss": 0.0372,
      "step": 9770
    },
    {
      "epoch": 1.4794644883140458,
      "grad_norm": 0.08190298080444336,
      "learning_rate": 0.0001609,
      "loss": 0.0293,
      "step": 9780
    },
    {
      "epoch": 1.4809772331896225,
      "grad_norm": 0.05840008333325386,
      "learning_rate": 0.00016086,
      "loss": 0.0349,
      "step": 9790
    },
    {
      "epoch": 1.4824899780651992,
      "grad_norm": 0.07874023169279099,
      "learning_rate": 0.00016082000000000002,
      "loss": 0.0322,
      "step": 9800
    },
    {
      "epoch": 1.4824899780651992,
      "eval_cer": 0.24973192203254985,
      "eval_loss": 0.036100711673498154,
      "eval_runtime": 10381.657,
      "eval_samples_per_second": 2.028,
      "eval_steps_per_second": 0.254,
      "step": 9800
    },
    {
      "epoch": 1.484002722940776,
      "grad_norm": 0.0776941329240799,
      "learning_rate": 0.00016078,
      "loss": 0.0358,
      "step": 9810
    },
    {
      "epoch": 1.4855154678163527,
      "grad_norm": 0.12248267233371735,
      "learning_rate": 0.00016074,
      "loss": 0.0356,
      "step": 9820
    },
    {
      "epoch": 1.4870282126919294,
      "grad_norm": 0.08847146481275558,
      "learning_rate": 0.0001607,
      "loss": 0.0274,
      "step": 9830
    },
    {
      "epoch": 1.4885409575675062,
      "grad_norm": 0.0689850002527237,
      "learning_rate": 0.00016066000000000002,
      "loss": 0.0266,
      "step": 9840
    },
    {
      "epoch": 1.4900537024430829,
      "grad_norm": 0.06342552602291107,
      "learning_rate": 0.00016062000000000002,
      "loss": 0.031,
      "step": 9850
    },
    {
      "epoch": 1.4915664473186596,
      "grad_norm": 0.11846140772104263,
      "learning_rate": 0.00016057999999999998,
      "loss": 0.0348,
      "step": 9860
    },
    {
      "epoch": 1.4930791921942363,
      "grad_norm": 0.07698410004377365,
      "learning_rate": 0.00016054,
      "loss": 0.0259,
      "step": 9870
    },
    {
      "epoch": 1.494591937069813,
      "grad_norm": 0.11177106946706772,
      "learning_rate": 0.0001605,
      "loss": 0.0301,
      "step": 9880
    },
    {
      "epoch": 1.4961046819453898,
      "grad_norm": 0.09459209442138672,
      "learning_rate": 0.00016046000000000002,
      "loss": 0.0349,
      "step": 9890
    },
    {
      "epoch": 1.4976174268209665,
      "grad_norm": 0.08800119906663895,
      "learning_rate": 0.00016042,
      "loss": 0.0335,
      "step": 9900
    },
    {
      "epoch": 1.4991301716965433,
      "grad_norm": 0.09330447763204575,
      "learning_rate": 0.00016038,
      "loss": 0.0326,
      "step": 9910
    },
    {
      "epoch": 1.50064291657212,
      "grad_norm": 0.10210063308477402,
      "learning_rate": 0.00016034,
      "loss": 0.035,
      "step": 9920
    },
    {
      "epoch": 1.5021556614476967,
      "grad_norm": 0.11886809766292572,
      "learning_rate": 0.0001603,
      "loss": 0.036,
      "step": 9930
    },
    {
      "epoch": 1.5036684063232735,
      "grad_norm": 0.07646410167217255,
      "learning_rate": 0.00016026000000000001,
      "loss": 0.0269,
      "step": 9940
    },
    {
      "epoch": 1.5051811511988502,
      "grad_norm": 0.09994587302207947,
      "learning_rate": 0.00016022,
      "loss": 0.0298,
      "step": 9950
    },
    {
      "epoch": 1.506693896074427,
      "grad_norm": 0.0781632736325264,
      "learning_rate": 0.00016018,
      "loss": 0.0299,
      "step": 9960
    },
    {
      "epoch": 1.5082066409500037,
      "grad_norm": 0.09286709874868393,
      "learning_rate": 0.00016014,
      "loss": 0.0334,
      "step": 9970
    },
    {
      "epoch": 1.5097193858255804,
      "grad_norm": 0.08658807724714279,
      "learning_rate": 0.00016010000000000002,
      "loss": 0.032,
      "step": 9980
    },
    {
      "epoch": 1.5112321307011571,
      "grad_norm": 0.09535326808691025,
      "learning_rate": 0.00016006,
      "loss": 0.032,
      "step": 9990
    },
    {
      "epoch": 1.5127448755767339,
      "grad_norm": 0.056372299790382385,
      "learning_rate": 0.00016002,
      "loss": 0.033,
      "step": 10000
    },
    {
      "epoch": 1.5127448755767339,
      "eval_cer": 0.1808933296766016,
      "eval_loss": 0.03580623120069504,
      "eval_runtime": 10388.4948,
      "eval_samples_per_second": 2.026,
      "eval_steps_per_second": 0.253,
      "step": 10000
    }
  ],
  "logging_steps": 10,
  "max_steps": 50000,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 8,
  "save_steps": 10000,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": false
      },
      "attributes": {}
    }
  },
  "total_flos": 7.622822387689695e+17,
  "train_batch_size": 8,
  "trial_name": null,
  "trial_params": null
}