wav2vec2-xlsr-53-ft-btb-ccv-cy / trainer_state.json

End of training

b30b16e verified 4 months ago

82.4 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 1.9647137412079059,
	"eval_steps": 200,
	"global_step": 50000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.007858854964831625,
	"eval_loss": 3.175461769104004,
	"eval_runtime": 144.4533,
	"eval_samples_per_second": 39.155,
	"eval_steps_per_second": 4.894,
	"eval_wer": 1.0,
	"step": 200
	},
	{
	"epoch": 0.01571770992966325,
	"eval_loss": 2.8796634674072266,
	"eval_runtime": 143.0854,
	"eval_samples_per_second": 39.529,
	"eval_steps_per_second": 4.941,
	"eval_wer": 1.0,
	"step": 400
	},
	{
	"epoch": 0.01964713741207906,
	"grad_norm": 1.9831087589263916,
	"learning_rate": 0.00029759999999999997,
	"loss": 4.8076,
	"step": 500
	},
	{
	"epoch": 0.023576564894494872,
	"eval_loss": 1.4753953218460083,
	"eval_runtime": 143.2096,
	"eval_samples_per_second": 39.495,
	"eval_steps_per_second": 4.937,
	"eval_wer": 0.903997689011571,
	"step": 600
	},
	{
	"epoch": 0.0314354198593265,
	"eval_loss": 1.25261652469635,
	"eval_runtime": 144.6031,
	"eval_samples_per_second": 39.114,
	"eval_steps_per_second": 4.889,
	"eval_wer": 0.8548410393028518,
	"step": 800
	},
	{
	"epoch": 0.03929427482415812,
	"grad_norm": 2.427387237548828,
	"learning_rate": 0.0002969939393939394,
	"loss": 1.1153,
	"step": 1000
	},
	{
	"epoch": 0.03929427482415812,
	"eval_loss": 1.1311910152435303,
	"eval_runtime": 144.1542,
	"eval_samples_per_second": 39.236,
	"eval_steps_per_second": 4.904,
	"eval_wer": 0.788769238176245,
	"step": 1000
	},
	{
	"epoch": 0.047153129788989744,
	"eval_loss": 1.0895923376083374,
	"eval_runtime": 144.7009,
	"eval_samples_per_second": 39.088,
	"eval_steps_per_second": 4.886,
	"eval_wer": 0.7734749883648152,
	"step": 1200
	},
	{
	"epoch": 0.055011984753821366,
	"eval_loss": 1.0287705659866333,
	"eval_runtime": 143.6225,
	"eval_samples_per_second": 39.381,
	"eval_steps_per_second": 4.923,
	"eval_wer": 0.7571054869926658,
	"step": 1400
	},
	{
	"epoch": 0.05894141223623718,
	"grad_norm": 2.3919336795806885,
	"learning_rate": 0.0002939636363636363,
	"loss": 0.8282,
	"step": 1500
	},
	{
	"epoch": 0.062870839718653,
	"eval_loss": 0.9747628569602966,
	"eval_runtime": 144.5139,
	"eval_samples_per_second": 39.138,
	"eval_steps_per_second": 4.892,
	"eval_wer": 0.7254096387475727,
	"step": 1600
	},
	{
	"epoch": 0.07072969468348461,
	"eval_loss": 0.9748485088348389,
	"eval_runtime": 144.3418,
	"eval_samples_per_second": 39.185,
	"eval_steps_per_second": 4.898,
	"eval_wer": 0.7194556338367223,
	"step": 1800
	},
	{
	"epoch": 0.07858854964831624,
	"grad_norm": 2.169008255004883,
	"learning_rate": 0.0002909333333333333,
	"loss": 0.7335,
	"step": 2000
	},
	{
	"epoch": 0.07858854964831624,
	"eval_loss": 0.9882574081420898,
	"eval_runtime": 145.192,
	"eval_samples_per_second": 38.955,
	"eval_steps_per_second": 4.869,
	"eval_wer": 0.7143682495867504,
	"step": 2000
	},
	{
	"epoch": 0.08644740461314787,
	"eval_loss": 0.9364911317825317,
	"eval_runtime": 145.4626,
	"eval_samples_per_second": 38.883,
	"eval_steps_per_second": 4.86,
	"eval_wer": 0.7061834989006757,
	"step": 2200
	},
	{
	"epoch": 0.09430625957797949,
	"eval_loss": 0.9164892435073853,
	"eval_runtime": 145.9321,
	"eval_samples_per_second": 38.758,
	"eval_steps_per_second": 4.845,
	"eval_wer": 0.6801688305435637,
	"step": 2400
	},
	{
	"epoch": 0.0982356870603953,
	"grad_norm": 5.276973247528076,
	"learning_rate": 0.00028790303030303027,
	"loss": 0.6931,
	"step": 2500
	},
	{
	"epoch": 0.10216511454281112,
	"eval_loss": 0.9169939756393433,
	"eval_runtime": 145.3478,
	"eval_samples_per_second": 38.914,
	"eval_steps_per_second": 4.864,
	"eval_wer": 0.6773603376610872,
	"step": 2600
	},
	{
	"epoch": 0.11002396950764273,
	"eval_loss": 0.9080427289009094,
	"eval_runtime": 144.7759,
	"eval_samples_per_second": 39.067,
	"eval_steps_per_second": 4.883,
	"eval_wer": 0.6692237325672835,
	"step": 2800
	},
	{
	"epoch": 0.11788282447247436,
	"grad_norm": 2.9965720176696777,
	"learning_rate": 0.00028487272727272726,
	"loss": 0.67,
	"step": 3000
	},
	{
	"epoch": 0.11788282447247436,
	"eval_loss": 0.8609287738800049,
	"eval_runtime": 145.381,
	"eval_samples_per_second": 38.905,
	"eval_steps_per_second": 4.863,
	"eval_wer": 0.6621784275649564,
	"step": 3000
	},
	{
	"epoch": 0.125741679437306,
	"eval_loss": 0.8863000273704529,
	"eval_runtime": 144.6247,
	"eval_samples_per_second": 39.108,
	"eval_steps_per_second": 4.889,
	"eval_wer": 0.6659177352313396,
	"step": 3200
	},
	{
	"epoch": 0.13360053440213762,
	"eval_loss": 0.8669990301132202,
	"eval_runtime": 145.3885,
	"eval_samples_per_second": 38.903,
	"eval_steps_per_second": 4.863,
	"eval_wer": 0.6610710789427228,
	"step": 3400
	},
	{
	"epoch": 0.1375299618845534,
	"grad_norm": 3.541180372238159,
	"learning_rate": 0.0002818424242424242,
	"loss": 0.6282,
	"step": 3500
	},
	{
	"epoch": 0.14145938936696922,
	"eval_loss": 0.8718289136886597,
	"eval_runtime": 147.388,
	"eval_samples_per_second": 38.375,
	"eval_steps_per_second": 4.797,
	"eval_wer": 0.6819983630498628,
	"step": 3600
	},
	{
	"epoch": 0.14931824433180085,
	"eval_loss": 0.861672580242157,
	"eval_runtime": 145.355,
	"eval_samples_per_second": 38.912,
	"eval_steps_per_second": 4.864,
	"eval_wer": 0.6481520116833304,
	"step": 3800
	},
	{
	"epoch": 0.15717709929663248,
	"grad_norm": 1.9885746240615845,
	"learning_rate": 0.0002788121212121212,
	"loss": 0.6311,
	"step": 4000
	},
	{
	"epoch": 0.15717709929663248,
	"eval_loss": 0.8504879474639893,
	"eval_runtime": 145.0997,
	"eval_samples_per_second": 38.98,
	"eval_steps_per_second": 4.873,
	"eval_wer": 0.6597230023591341,
	"step": 4000
	},
	{
	"epoch": 0.1650359542614641,
	"eval_loss": 0.8290337324142456,
	"eval_runtime": 144.8192,
	"eval_samples_per_second": 39.056,
	"eval_steps_per_second": 4.882,
	"eval_wer": 0.6292307939208166,
	"step": 4200
	},
	{
	"epoch": 0.17289480922629574,
	"eval_loss": 0.8300275206565857,
	"eval_runtime": 144.9963,
	"eval_samples_per_second": 39.008,
	"eval_steps_per_second": 4.876,
	"eval_wer": 0.6567540241690873,
	"step": 4400
	},
	{
	"epoch": 0.17682423670871153,
	"grad_norm": 3.603195905685425,
	"learning_rate": 0.0002757878787878788,
	"loss": 0.615,
	"step": 4500
	},
	{
	"epoch": 0.18075366419112734,
	"eval_loss": 0.8007863163948059,
	"eval_runtime": 144.795,
	"eval_samples_per_second": 39.062,
	"eval_steps_per_second": 4.883,
	"eval_wer": 0.610855226204041,
	"step": 4600
	},
	{
	"epoch": 0.18861251915595897,
	"eval_loss": 0.8038597702980042,
	"eval_runtime": 144.8128,
	"eval_samples_per_second": 39.057,
	"eval_steps_per_second": 4.882,
	"eval_wer": 0.6045160565550224,
	"step": 4800
	},
	{
	"epoch": 0.1964713741207906,
	"grad_norm": 3.389535665512085,
	"learning_rate": 0.0002727575757575757,
	"loss": 0.5785,
	"step": 5000
	},
	{
	"epoch": 0.1964713741207906,
	"eval_loss": 0.7907959818840027,
	"eval_runtime": 144.5449,
	"eval_samples_per_second": 39.13,
	"eval_steps_per_second": 4.891,
	"eval_wer": 0.6071801126606859,
	"step": 5000
	},
	{
	"epoch": 0.20433022908562223,
	"eval_loss": 0.7867733836174011,
	"eval_runtime": 144.7418,
	"eval_samples_per_second": 39.076,
	"eval_steps_per_second": 4.885,
	"eval_wer": 0.6037457270786859,
	"step": 5200
	},
	{
	"epoch": 0.21218908405045384,
	"eval_loss": 0.7709878087043762,
	"eval_runtime": 146.1138,
	"eval_samples_per_second": 38.71,
	"eval_steps_per_second": 4.839,
	"eval_wer": 0.5988348766670412,
	"step": 5400
	},
	{
	"epoch": 0.21611851153286965,
	"grad_norm": 2.476861000061035,
	"learning_rate": 0.00026972727272727266,
	"loss": 0.5928,
	"step": 5500
	},
	{
	"epoch": 0.22004793901528547,
	"eval_loss": 0.766153872013092,
	"eval_runtime": 144.8164,
	"eval_samples_per_second": 39.056,
	"eval_steps_per_second": 4.882,
	"eval_wer": 0.5747139349392563,
	"step": 5600
	},
	{
	"epoch": 0.2279067939801171,
	"eval_loss": 0.767308235168457,
	"eval_runtime": 145.7638,
	"eval_samples_per_second": 38.803,
	"eval_steps_per_second": 4.85,
	"eval_wer": 0.5945820160164337,
	"step": 5800
	},
	{
	"epoch": 0.23576564894494872,
	"grad_norm": 2.2588391304016113,
	"learning_rate": 0.00026669696969696966,
	"loss": 0.5799,
	"step": 6000
	},
	{
	"epoch": 0.23576564894494872,
	"eval_loss": 0.7804461121559143,
	"eval_runtime": 145.0414,
	"eval_samples_per_second": 38.996,
	"eval_steps_per_second": 4.874,
	"eval_wer": 0.5990114105053682,
	"step": 6000
	},
	{
	"epoch": 0.24362450390978035,
	"eval_loss": 0.7586621642112732,
	"eval_runtime": 145.864,
	"eval_samples_per_second": 38.776,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.5780520293367142,
	"step": 6200
	},
	{
	"epoch": 0.251483358874612,
	"eval_loss": 0.749543309211731,
	"eval_runtime": 145.8617,
	"eval_samples_per_second": 38.776,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.5728683539022003,
	"step": 6400
	},
	{
	"epoch": 0.2554127863570278,
	"grad_norm": 1.971763253211975,
	"learning_rate": 0.00026366666666666666,
	"loss": 0.5534,
	"step": 6500
	},
	{
	"epoch": 0.2593422138394436,
	"eval_loss": 0.7536802291870117,
	"eval_runtime": 147.4299,
	"eval_samples_per_second": 38.364,
	"eval_steps_per_second": 4.795,
	"eval_wer": 0.5768804865914525,
	"step": 6600
	},
	{
	"epoch": 0.26720106880427524,
	"eval_loss": 0.7661583423614502,
	"eval_runtime": 149.947,
	"eval_samples_per_second": 37.72,
	"eval_steps_per_second": 4.715,
	"eval_wer": 0.581245686957359,
	"step": 6800
	},
	{
	"epoch": 0.2750599237691068,
	"grad_norm": 2.5072972774505615,
	"learning_rate": 0.0002606363636363636,
	"loss": 0.5592,
	"step": 7000
	},
	{
	"epoch": 0.2750599237691068,
	"eval_loss": 0.7571460604667664,
	"eval_runtime": 145.6344,
	"eval_samples_per_second": 38.837,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.5607998587729294,
	"step": 7000
	},
	{
	"epoch": 0.28291877873393845,
	"eval_loss": 0.7475385665893555,
	"eval_runtime": 145.4869,
	"eval_samples_per_second": 38.876,
	"eval_steps_per_second": 4.86,
	"eval_wer": 0.5635120604708639,
	"step": 7200
	},
	{
	"epoch": 0.2907776336987701,
	"eval_loss": 0.7267230749130249,
	"eval_runtime": 145.614,
	"eval_samples_per_second": 38.842,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.5591950056972285,
	"step": 7400
	},
	{
	"epoch": 0.2947070611811859,
	"grad_norm": 3.4168338775634766,
	"learning_rate": 0.0002576060606060606,
	"loss": 0.5512,
	"step": 7500
	},
	{
	"epoch": 0.2986364886636017,
	"eval_loss": 0.7362108826637268,
	"eval_runtime": 145.7986,
	"eval_samples_per_second": 38.793,
	"eval_steps_per_second": 4.849,
	"eval_wer": 0.5588098409590602,
	"step": 7600
	},
	{
	"epoch": 0.30649534362843334,
	"eval_loss": 0.7624097466468811,
	"eval_runtime": 145.4148,
	"eval_samples_per_second": 38.896,
	"eval_steps_per_second": 4.862,
	"eval_wer": 0.581117298711303,
	"step": 7800
	},
	{
	"epoch": 0.31435419859326497,
	"grad_norm": 2.9330873489379883,
	"learning_rate": 0.00025457575757575755,
	"loss": 0.54,
	"step": 8000
	},
	{
	"epoch": 0.31435419859326497,
	"eval_loss": 0.7657227516174316,
	"eval_runtime": 146.1604,
	"eval_samples_per_second": 38.697,
	"eval_steps_per_second": 4.837,
	"eval_wer": 0.5622442265410602,
	"step": 8000
	},
	{
	"epoch": 0.3222130535580966,
	"eval_loss": 0.7300673127174377,
	"eval_runtime": 146.8709,
	"eval_samples_per_second": 38.51,
	"eval_steps_per_second": 4.814,
	"eval_wer": 0.5453611721846865,
	"step": 8200
	},
	{
	"epoch": 0.3300719085229282,
	"eval_loss": 0.7118472456932068,
	"eval_runtime": 146.4543,
	"eval_samples_per_second": 38.62,
	"eval_steps_per_second": 4.827,
	"eval_wer": 0.5381553818747894,
	"step": 8400
	},
	{
	"epoch": 0.33400133600534404,
	"grad_norm": 2.0070419311523438,
	"learning_rate": 0.00025154545454545454,
	"loss": 0.531,
	"step": 8500
	},
	{
	"epoch": 0.33793076348775986,
	"eval_loss": 0.7252832055091858,
	"eval_runtime": 145.6223,
	"eval_samples_per_second": 38.84,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.548153616536406,
	"step": 8600
	},
	{
	"epoch": 0.3457896184525915,
	"eval_loss": 0.7304599285125732,
	"eval_runtime": 145.89,
	"eval_samples_per_second": 38.769,
	"eval_steps_per_second": 4.846,
	"eval_wer": 0.5582962879748359,
	"step": 8800
	},
	{
	"epoch": 0.35364847341742306,
	"grad_norm": 2.5275588035583496,
	"learning_rate": 0.00024852121212121206,
	"loss": 0.5406,
	"step": 9000
	},
	{
	"epoch": 0.35364847341742306,
	"eval_loss": 0.7097567915916443,
	"eval_runtime": 145.7013,
	"eval_samples_per_second": 38.819,
	"eval_steps_per_second": 4.852,
	"eval_wer": 0.5520213124488453,
	"step": 9000
	},
	{
	"epoch": 0.3615073283822547,
	"eval_loss": 0.698684573173523,
	"eval_runtime": 146.3052,
	"eval_samples_per_second": 38.659,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.5372245670908828,
	"step": 9200
	},
	{
	"epoch": 0.3693661833470863,
	"eval_loss": 0.7044981718063354,
	"eval_runtime": 145.8062,
	"eval_samples_per_second": 38.791,
	"eval_steps_per_second": 4.849,
	"eval_wer": 0.5472548988140136,
	"step": 9400
	},
	{
	"epoch": 0.37329561082950213,
	"grad_norm": 6.208221435546875,
	"learning_rate": 0.00024549090909090906,
	"loss": 0.5252,
	"step": 9500
	},
	{
	"epoch": 0.37722503831191795,
	"eval_loss": 0.7025354504585266,
	"eval_runtime": 146.2272,
	"eval_samples_per_second": 38.68,
	"eval_steps_per_second": 4.835,
	"eval_wer": 0.5332766285246585,
	"step": 9600
	},
	{
	"epoch": 0.3850838932767496,
	"eval_loss": 0.7077142000198364,
	"eval_runtime": 145.5575,
	"eval_samples_per_second": 38.857,
	"eval_steps_per_second": 4.857,
	"eval_wer": 0.5461796472532939,
	"step": 9800
	},
	{
	"epoch": 0.3929427482415812,
	"grad_norm": 4.407375812530518,
	"learning_rate": 0.00024246060606060606,
	"loss": 0.5156,
	"step": 10000
	},
	{
	"epoch": 0.3929427482415812,
	"eval_loss": 0.7006597518920898,
	"eval_runtime": 146.3123,
	"eval_samples_per_second": 38.657,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.5382516730593314,
	"step": 10000
	},
	{
	"epoch": 0.40080160320641284,
	"eval_loss": 0.6947250962257385,
	"eval_runtime": 145.4545,
	"eval_samples_per_second": 38.885,
	"eval_steps_per_second": 4.861,
	"eval_wer": 0.5425847763637239,
	"step": 10200
	},
	{
	"epoch": 0.40866045817124447,
	"eval_loss": 0.7127708196640015,
	"eval_runtime": 145.5874,
	"eval_samples_per_second": 38.85,
	"eval_steps_per_second": 4.856,
	"eval_wer": 0.5361332669994062,
	"step": 10400
	},
	{
	"epoch": 0.4125898856536603,
	"grad_norm": 2.721827983856201,
	"learning_rate": 0.000239430303030303,
	"loss": 0.5181,
	"step": 10500
	},
	{
	"epoch": 0.4165193131360761,
	"eval_loss": 0.6945223212242126,
	"eval_runtime": 146.0143,
	"eval_samples_per_second": 38.736,
	"eval_steps_per_second": 4.842,
	"eval_wer": 0.5276114971674343,
	"step": 10600
	},
	{
	"epoch": 0.42437816810090767,
	"eval_loss": 0.6985763311386108,
	"eval_runtime": 146.5657,
	"eval_samples_per_second": 38.59,
	"eval_steps_per_second": 4.824,
	"eval_wer": 0.5310619312801913,
	"step": 10800
	},
	{
	"epoch": 0.4322370230657393,
	"grad_norm": 5.38914680480957,
	"learning_rate": 0.0002364,
	"loss": 0.5096,
	"step": 11000
	},
	{
	"epoch": 0.4322370230657393,
	"eval_loss": 0.6909800171852112,
	"eval_runtime": 146.0039,
	"eval_samples_per_second": 38.739,
	"eval_steps_per_second": 4.842,
	"eval_wer": 0.5293126414276773,
	"step": 11000
	},
	{
	"epoch": 0.44009587803057093,
	"eval_loss": 0.6855354905128479,
	"eval_runtime": 146.6844,
	"eval_samples_per_second": 38.559,
	"eval_steps_per_second": 4.82,
	"eval_wer": 0.5280608560286306,
	"step": 11200
	},
	{
	"epoch": 0.44795473299540256,
	"eval_loss": 0.6889775395393372,
	"eval_runtime": 146.3731,
	"eval_samples_per_second": 38.641,
	"eval_steps_per_second": 4.83,
	"eval_wer": 0.5262313235223315,
	"step": 11400
	},
	{
	"epoch": 0.4518841604778184,
	"grad_norm": 3.3484437465667725,
	"learning_rate": 0.00023336969696969694,
	"loss": 0.5099,
	"step": 11500
	},
	{
	"epoch": 0.4558135879602342,
	"eval_loss": 0.677577018737793,
	"eval_runtime": 146.1848,
	"eval_samples_per_second": 38.691,
	"eval_steps_per_second": 4.836,
	"eval_wer": 0.5298101458811446,
	"step": 11600
	},
	{
	"epoch": 0.4636724429250658,
	"eval_loss": 0.6817450523376465,
	"eval_runtime": 146.2301,
	"eval_samples_per_second": 38.679,
	"eval_steps_per_second": 4.835,
	"eval_wer": 0.5141949254545747,
	"step": 11800
	},
	{
	"epoch": 0.47153129788989745,
	"grad_norm": 4.75791597366333,
	"learning_rate": 0.00023033939393939391,
	"loss": 0.481,
	"step": 12000
	},
	{
	"epoch": 0.47153129788989745,
	"eval_loss": 0.6749030351638794,
	"eval_runtime": 144.9955,
	"eval_samples_per_second": 39.008,
	"eval_steps_per_second": 4.876,
	"eval_wer": 0.5318483092872848,
	"step": 12000
	},
	{
	"epoch": 0.4793901528547291,
	"eval_loss": 0.6648340225219727,
	"eval_runtime": 146.7705,
	"eval_samples_per_second": 38.536,
	"eval_steps_per_second": 4.817,
	"eval_wer": 0.513167819486126,
	"step": 12200
	},
	{
	"epoch": 0.4872490078195607,
	"eval_loss": 0.6659471392631531,
	"eval_runtime": 145.9108,
	"eval_samples_per_second": 38.763,
	"eval_steps_per_second": 4.845,
	"eval_wer": 0.5151096917077241,
	"step": 12400
	},
	{
	"epoch": 0.4911784353019765,
	"grad_norm": 3.3849971294403076,
	"learning_rate": 0.00022730909090909089,
	"loss": 0.4899,
	"step": 12500
	},
	{
	"epoch": 0.49510786278439234,
	"eval_loss": 0.6744287014007568,
	"eval_runtime": 146.3152,
	"eval_samples_per_second": 38.656,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.5207266774726774,
	"step": 12600
	},
	{
	"epoch": 0.502966717749224,
	"eval_loss": 0.6732743978500366,
	"eval_runtime": 146.1337,
	"eval_samples_per_second": 38.704,
	"eval_steps_per_second": 4.838,
	"eval_wer": 0.5228771805941166,
	"step": 12800
	},
	{
	"epoch": 0.5108255727140556,
	"grad_norm": 3.489818811416626,
	"learning_rate": 0.00022427878787878786,
	"loss": 0.492,
	"step": 13000
	},
	{
	"epoch": 0.5108255727140556,
	"eval_loss": 0.6456639170646667,
	"eval_runtime": 146.9518,
	"eval_samples_per_second": 38.489,
	"eval_steps_per_second": 4.811,
	"eval_wer": 0.5041645937314438,
	"step": 13000
	},
	{
	"epoch": 0.5186844276788872,
	"eval_loss": 0.6671249866485596,
	"eval_runtime": 145.8641,
	"eval_samples_per_second": 38.776,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.5259103529071913,
	"step": 13200
	},
	{
	"epoch": 0.5265432826437189,
	"eval_loss": 0.6544414162635803,
	"eval_runtime": 146.5937,
	"eval_samples_per_second": 38.583,
	"eval_steps_per_second": 4.823,
	"eval_wer": 0.5179181845902008,
	"step": 13400
	},
	{
	"epoch": 0.5304727101261346,
	"grad_norm": 1.4167377948760986,
	"learning_rate": 0.00022125454545454546,
	"loss": 0.4782,
	"step": 13500
	},
	{
	"epoch": 0.5344021376085505,
	"eval_loss": 0.6560591459274292,
	"eval_runtime": 146.1188,
	"eval_samples_per_second": 38.708,
	"eval_steps_per_second": 4.839,
	"eval_wer": 0.5054484761920046,
	"step": 13600
	},
	{
	"epoch": 0.542260992573382,
	"eval_loss": 0.6381711363792419,
	"eval_runtime": 145.8554,
	"eval_samples_per_second": 38.778,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.49918954919677105,
	"step": 13800
	},
	{
	"epoch": 0.5501198475382136,
	"grad_norm": 3.582862615585327,
	"learning_rate": 0.0002182242424242424,
	"loss": 0.507,
	"step": 14000
	},
	{
	"epoch": 0.5501198475382136,
	"eval_loss": 0.6555091738700867,
	"eval_runtime": 148.0584,
	"eval_samples_per_second": 38.201,
	"eval_steps_per_second": 4.775,
	"eval_wer": 0.504437418754313,
	"step": 14000
	},
	{
	"epoch": 0.5579787025030453,
	"eval_loss": 0.6399552822113037,
	"eval_runtime": 146.0824,
	"eval_samples_per_second": 38.718,
	"eval_steps_per_second": 4.84,
	"eval_wer": 0.49548233859190194,
	"step": 14200
	},
	{
	"epoch": 0.5658375574678769,
	"eval_loss": 0.6467686891555786,
	"eval_runtime": 146.3336,
	"eval_samples_per_second": 38.651,
	"eval_steps_per_second": 4.831,
	"eval_wer": 0.5014202949719954,
	"step": 14400
	},
	{
	"epoch": 0.5697669849502928,
	"grad_norm": 2.1453781127929688,
	"learning_rate": 0.0002151939393939394,
	"loss": 0.4899,
	"step": 14500
	},
	{
	"epoch": 0.5736964124327085,
	"eval_loss": 0.6370707750320435,
	"eval_runtime": 146.4635,
	"eval_samples_per_second": 38.617,
	"eval_steps_per_second": 4.827,
	"eval_wer": 0.49723162844441593,
	"step": 14600
	},
	{
	"epoch": 0.5815552673975402,
	"eval_loss": 0.6356329917907715,
	"eval_runtime": 145.6834,
	"eval_samples_per_second": 38.824,
	"eval_steps_per_second": 4.853,
	"eval_wer": 0.5025597406557429,
	"step": 14800
	},
	{
	"epoch": 0.5894141223623718,
	"grad_norm": 2.615446090698242,
	"learning_rate": 0.00021216363636363634,
	"loss": 0.4677,
	"step": 15000
	},
	{
	"epoch": 0.5894141223623718,
	"eval_loss": 0.638607919216156,
	"eval_runtime": 145.7689,
	"eval_samples_per_second": 38.801,
	"eval_steps_per_second": 4.85,
	"eval_wer": 0.5021424788560608,
	"step": 15000
	},
	{
	"epoch": 0.5972729773272034,
	"eval_loss": 0.6653130650520325,
	"eval_runtime": 146.0092,
	"eval_samples_per_second": 38.737,
	"eval_steps_per_second": 4.842,
	"eval_wer": 0.5190255332124344,
	"step": 15200
	},
	{
	"epoch": 0.605131832292035,
	"eval_loss": 0.6442501544952393,
	"eval_runtime": 146.2404,
	"eval_samples_per_second": 38.676,
	"eval_steps_per_second": 4.835,
	"eval_wer": 0.4998154418962944,
	"step": 15400
	},
	{
	"epoch": 0.6090612597744509,
	"grad_norm": 2.680966854095459,
	"learning_rate": 0.0002091333333333333,
	"loss": 0.461,
	"step": 15500
	},
	{
	"epoch": 0.6129906872568667,
	"eval_loss": 0.6210175156593323,
	"eval_runtime": 146.9594,
	"eval_samples_per_second": 38.487,
	"eval_steps_per_second": 4.811,
	"eval_wer": 0.4896567219271076,
	"step": 15600
	},
	{
	"epoch": 0.6208495422216983,
	"eval_loss": 0.6395752429962158,
	"eval_runtime": 146.5911,
	"eval_samples_per_second": 38.584,
	"eval_steps_per_second": 4.823,
	"eval_wer": 0.5011635184798832,
	"step": 15800
	},
	{
	"epoch": 0.6287083971865299,
	"grad_norm": 2.2297749519348145,
	"learning_rate": 0.00020610303030303028,
	"loss": 0.4528,
	"step": 16000
	},
	{
	"epoch": 0.6287083971865299,
	"eval_loss": 0.6226186752319336,
	"eval_runtime": 147.1935,
	"eval_samples_per_second": 38.426,
	"eval_steps_per_second": 4.803,
	"eval_wer": 0.49333183547046267,
	"step": 16000
	},
	{
	"epoch": 0.6365672521513616,
	"eval_loss": 0.6253554224967957,
	"eval_runtime": 147.0403,
	"eval_samples_per_second": 38.466,
	"eval_steps_per_second": 4.808,
	"eval_wer": 0.49365280608560286,
	"step": 16200
	},
	{
	"epoch": 0.6444261071161932,
	"eval_loss": 0.6289177536964417,
	"eval_runtime": 146.8167,
	"eval_samples_per_second": 38.524,
	"eval_steps_per_second": 4.816,
	"eval_wer": 0.5013240037874532,
	"step": 16400
	},
	{
	"epoch": 0.648355534598609,
	"grad_norm": 1.9119956493377686,
	"learning_rate": 0.00020307272727272725,
	"loss": 0.451,
	"step": 16500
	},
	{
	"epoch": 0.6522849620810248,
	"eval_loss": 0.6229738593101501,
	"eval_runtime": 146.4262,
	"eval_samples_per_second": 38.627,
	"eval_steps_per_second": 4.828,
	"eval_wer": 0.49723162844441593,
	"step": 16600
	},
	{
	"epoch": 0.6601438170458565,
	"eval_loss": 0.6153121590614319,
	"eval_runtime": 146.6615,
	"eval_samples_per_second": 38.565,
	"eval_steps_per_second": 4.821,
	"eval_wer": 0.4957391150840141,
	"step": 16800
	},
	{
	"epoch": 0.6680026720106881,
	"grad_norm": 3.115481376647949,
	"learning_rate": 0.00020004848484848485,
	"loss": 0.4444,
	"step": 17000
	},
	{
	"epoch": 0.6680026720106881,
	"eval_loss": 0.6032531261444092,
	"eval_runtime": 146.667,
	"eval_samples_per_second": 38.564,
	"eval_steps_per_second": 4.82,
	"eval_wer": 0.47476368538460306,
	"step": 17000
	},
	{
	"epoch": 0.6758615269755197,
	"eval_loss": 0.6153914332389832,
	"eval_runtime": 146.5404,
	"eval_samples_per_second": 38.597,
	"eval_steps_per_second": 4.825,
	"eval_wer": 0.4771388679366404,
	"step": 17200
	},
	{
	"epoch": 0.6837203819403513,
	"eval_loss": 0.6169700622558594,
	"eval_runtime": 146.4739,
	"eval_samples_per_second": 38.614,
	"eval_steps_per_second": 4.827,
	"eval_wer": 0.48591741426072443,
	"step": 17400
	},
	{
	"epoch": 0.6876498094227671,
	"grad_norm": 3.35622501373291,
	"learning_rate": 0.0001970181818181818,
	"loss": 0.4357,
	"step": 17500
	},
	{
	"epoch": 0.691579236905183,
	"eval_loss": 0.6020850539207458,
	"eval_runtime": 146.4462,
	"eval_samples_per_second": 38.622,
	"eval_steps_per_second": 4.828,
	"eval_wer": 0.4814559227102759,
	"step": 17600
	},
	{
	"epoch": 0.6994380918700145,
	"eval_loss": 0.6071408987045288,
	"eval_runtime": 147.1123,
	"eval_samples_per_second": 38.447,
	"eval_steps_per_second": 4.806,
	"eval_wer": 0.47303044406284606,
	"step": 17800
	},
	{
	"epoch": 0.7072969468348461,
	"grad_norm": 2.2534916400909424,
	"learning_rate": 0.0001939939393939394,
	"loss": 0.4413,
	"step": 18000
	},
	{
	"epoch": 0.7072969468348461,
	"eval_loss": 0.6042246222496033,
	"eval_runtime": 146.518,
	"eval_samples_per_second": 38.603,
	"eval_steps_per_second": 4.825,
	"eval_wer": 0.47656112082938806,
	"step": 18000
	},
	{
	"epoch": 0.7151558017996777,
	"eval_loss": 0.6118656396865845,
	"eval_runtime": 147.1712,
	"eval_samples_per_second": 38.431,
	"eval_steps_per_second": 4.804,
	"eval_wer": 0.4837508626085282,
	"step": 18200
	},
	{
	"epoch": 0.7230146567645094,
	"eval_loss": 0.6045942902565002,
	"eval_runtime": 146.4829,
	"eval_samples_per_second": 38.612,
	"eval_steps_per_second": 4.827,
	"eval_wer": 0.47569450016850956,
	"step": 18400
	},
	{
	"epoch": 0.7269440842469252,
	"grad_norm": 3.591475248336792,
	"learning_rate": 0.00019096363636363634,
	"loss": 0.4375,
	"step": 18500
	},
	{
	"epoch": 0.730873511729341,
	"eval_loss": 0.6081308722496033,
	"eval_runtime": 147.4627,
	"eval_samples_per_second": 38.355,
	"eval_steps_per_second": 4.794,
	"eval_wer": 0.4832854552165749,
	"step": 18600
	},
	{
	"epoch": 0.7387323666941726,
	"eval_loss": 0.6007533073425293,
	"eval_runtime": 146.3827,
	"eval_samples_per_second": 38.638,
	"eval_steps_per_second": 4.83,
	"eval_wer": 0.4727897161014909,
	"step": 18800
	},
	{
	"epoch": 0.7465912216590043,
	"grad_norm": 1.425370693206787,
	"learning_rate": 0.0001879333333333333,
	"loss": 0.4329,
	"step": 19000
	},
	{
	"epoch": 0.7465912216590043,
	"eval_loss": 0.6008017063140869,
	"eval_runtime": 147.3011,
	"eval_samples_per_second": 38.398,
	"eval_steps_per_second": 4.8,
	"eval_wer": 0.46924299080419185,
	"step": 19000
	},
	{
	"epoch": 0.7544500766238359,
	"eval_loss": 0.6007276177406311,
	"eval_runtime": 146.7759,
	"eval_samples_per_second": 38.535,
	"eval_steps_per_second": 4.817,
	"eval_wer": 0.4822262521866123,
	"step": 19200
	},
	{
	"epoch": 0.7623089315886675,
	"eval_loss": 0.5838043093681335,
	"eval_runtime": 146.9473,
	"eval_samples_per_second": 38.49,
	"eval_steps_per_second": 4.811,
	"eval_wer": 0.4657925566914349,
	"step": 19400
	},
	{
	"epoch": 0.7662383590710834,
	"grad_norm": 2.780203342437744,
	"learning_rate": 0.00018490303030303028,
	"loss": 0.4318,
	"step": 19500
	},
	{
	"epoch": 0.7701677865534992,
	"eval_loss": 0.6007500290870667,
	"eval_runtime": 146.6721,
	"eval_samples_per_second": 38.562,
	"eval_steps_per_second": 4.82,
	"eval_wer": 0.46519876105342556,
	"step": 19600
	},
	{
	"epoch": 0.7780266415183308,
	"eval_loss": 0.5918843746185303,
	"eval_runtime": 147.2498,
	"eval_samples_per_second": 38.411,
	"eval_steps_per_second": 4.801,
	"eval_wer": 0.4664826435139863,
	"step": 19800
	},
	{
	"epoch": 0.7858854964831624,
	"grad_norm": 3.501138687133789,
	"learning_rate": 0.00018187272727272725,
	"loss": 0.4265,
	"step": 20000
	},
	{
	"epoch": 0.7858854964831624,
	"eval_loss": 0.59038907289505,
	"eval_runtime": 147.6976,
	"eval_samples_per_second": 38.294,
	"eval_steps_per_second": 4.787,
	"eval_wer": 0.4721959204634816,
	"step": 20000
	},
	{
	"epoch": 0.793744351447994,
	"eval_loss": 0.5922533273696899,
	"eval_runtime": 146.8772,
	"eval_samples_per_second": 38.508,
	"eval_steps_per_second": 4.814,
	"eval_wer": 0.4815201168333039,
	"step": 20200
	},
	{
	"epoch": 0.8016032064128257,
	"eval_loss": 0.5979217886924744,
	"eval_runtime": 146.9133,
	"eval_samples_per_second": 38.499,
	"eval_steps_per_second": 4.812,
	"eval_wer": 0.4661295758373321,
	"step": 20400
	},
	{
	"epoch": 0.8055326338952414,
	"grad_norm": 2.374830484390259,
	"learning_rate": 0.00017884242424242425,
	"loss": 0.4321,
	"step": 20500
	},
	{
	"epoch": 0.8094620613776573,
	"eval_loss": 0.5837874412536621,
	"eval_runtime": 146.6078,
	"eval_samples_per_second": 38.579,
	"eval_steps_per_second": 4.822,
	"eval_wer": 0.45608319558344435,
	"step": 20600
	},
	{
	"epoch": 0.8173209163424889,
	"eval_loss": 0.5824867486953735,
	"eval_runtime": 147.7105,
	"eval_samples_per_second": 38.291,
	"eval_steps_per_second": 4.786,
	"eval_wer": 0.4523920335093322,
	"step": 20800
	},
	{
	"epoch": 0.8251797713073206,
	"grad_norm": 1.430405616760254,
	"learning_rate": 0.0001758121212121212,
	"loss": 0.4192,
	"step": 21000
	},
	{
	"epoch": 0.8251797713073206,
	"eval_loss": 0.5838850140571594,
	"eval_runtime": 146.699,
	"eval_samples_per_second": 38.555,
	"eval_steps_per_second": 4.819,
	"eval_wer": 0.4551523807995378,
	"step": 21000
	},
	{
	"epoch": 0.8330386262721522,
	"eval_loss": 0.5804269909858704,
	"eval_runtime": 147.0076,
	"eval_samples_per_second": 38.474,
	"eval_steps_per_second": 4.809,
	"eval_wer": 0.4593731443886312,
	"step": 21200
	},
	{
	"epoch": 0.8408974812369838,
	"eval_loss": 0.5890819430351257,
	"eval_runtime": 146.6585,
	"eval_samples_per_second": 38.566,
	"eval_steps_per_second": 4.821,
	"eval_wer": 0.4722280175249956,
	"step": 21400
	},
	{
	"epoch": 0.8448269087193996,
	"grad_norm": 2.7897725105285645,
	"learning_rate": 0.00017278181818181817,
	"loss": 0.4151,
	"step": 21500
	},
	{
	"epoch": 0.8487563362018153,
	"eval_loss": 0.5830910205841064,
	"eval_runtime": 147.6653,
	"eval_samples_per_second": 38.303,
	"eval_steps_per_second": 4.788,
	"eval_wer": 0.4525204217553883,
	"step": 21600
	},
	{
	"epoch": 0.856615191166647,
	"eval_loss": 0.5677404403686523,
	"eval_runtime": 146.5378,
	"eval_samples_per_second": 38.598,
	"eval_steps_per_second": 4.825,
	"eval_wer": 0.45430180866941633,
	"step": 21800
	},
	{
	"epoch": 0.8644740461314786,
	"grad_norm": 2.938485622406006,
	"learning_rate": 0.00016975757575757574,
	"loss": 0.417,
	"step": 22000
	},
	{
	"epoch": 0.8644740461314786,
	"eval_loss": 0.5605286359786987,
	"eval_runtime": 147.3751,
	"eval_samples_per_second": 38.378,
	"eval_steps_per_second": 4.797,
	"eval_wer": 0.446807144805893,
	"step": 22000
	},
	{
	"epoch": 0.8723329010963102,
	"eval_loss": 0.570513129234314,
	"eval_runtime": 146.7648,
	"eval_samples_per_second": 38.538,
	"eval_steps_per_second": 4.817,
	"eval_wer": 0.44422333135401454,
	"step": 22200
	},
	{
	"epoch": 0.8801917560611419,
	"eval_loss": 0.5685856938362122,
	"eval_runtime": 147.3241,
	"eval_samples_per_second": 38.392,
	"eval_steps_per_second": 4.799,
	"eval_wer": 0.4551363322687808,
	"step": 22400
	},
	{
	"epoch": 0.8841211835435577,
	"grad_norm": 5.145638942718506,
	"learning_rate": 0.0001667272727272727,
	"loss": 0.4014,
	"step": 22500
	},
	{
	"epoch": 0.8880506110259735,
	"eval_loss": 0.5751659870147705,
	"eval_runtime": 146.2417,
	"eval_samples_per_second": 38.676,
	"eval_steps_per_second": 4.834,
	"eval_wer": 0.4602397650495097,
	"step": 22600
	},
	{
	"epoch": 0.8959094659908051,
	"eval_loss": 0.5623380541801453,
	"eval_runtime": 146.6371,
	"eval_samples_per_second": 38.571,
	"eval_steps_per_second": 4.821,
	"eval_wer": 0.4452985829147342,
	"step": 22800
	},
	{
	"epoch": 0.9037683209556368,
	"grad_norm": 1.9630001783370972,
	"learning_rate": 0.00016369696969696968,
	"loss": 0.4024,
	"step": 23000
	},
	{
	"epoch": 0.9037683209556368,
	"eval_loss": 0.5631678700447083,
	"eval_runtime": 146.9977,
	"eval_samples_per_second": 38.477,
	"eval_steps_per_second": 4.81,
	"eval_wer": 0.4423777503169585,
	"step": 23000
	},
	{
	"epoch": 0.9116271759204684,
	"eval_loss": 0.568145751953125,
	"eval_runtime": 146.7017,
	"eval_samples_per_second": 38.554,
	"eval_steps_per_second": 4.819,
	"eval_wer": 0.4471120668902762,
	"step": 23200
	},
	{
	"epoch": 0.9194860308853,
	"eval_loss": 0.5659225583076477,
	"eval_runtime": 147.422,
	"eval_samples_per_second": 38.366,
	"eval_steps_per_second": 4.796,
	"eval_wer": 0.4510760539872575,
	"step": 23400
	},
	{
	"epoch": 0.9234154583677158,
	"grad_norm": 2.880105972290039,
	"learning_rate": 0.00016066666666666665,
	"loss": 0.3899,
	"step": 23500
	},
	{
	"epoch": 0.9273448858501316,
	"eval_loss": 0.5653769969940186,
	"eval_runtime": 147.0508,
	"eval_samples_per_second": 38.463,
	"eval_steps_per_second": 4.808,
	"eval_wer": 0.4417197605559211,
	"step": 23600
	},
	{
	"epoch": 0.9352037408149633,
	"eval_loss": 0.5691047310829163,
	"eval_runtime": 147.3319,
	"eval_samples_per_second": 38.39,
	"eval_steps_per_second": 4.799,
	"eval_wer": 0.45418946895411727,
	"step": 23800
	},
	{
	"epoch": 0.9430625957797949,
	"grad_norm": 1.747075080871582,
	"learning_rate": 0.00015763636363636365,
	"loss": 0.3977,
	"step": 24000
	},
	{
	"epoch": 0.9430625957797949,
	"eval_loss": 0.5613217949867249,
	"eval_runtime": 146.5842,
	"eval_samples_per_second": 38.585,
	"eval_steps_per_second": 4.823,
	"eval_wer": 0.4434209048161641,
	"step": 24000
	},
	{
	"epoch": 0.9509214507446265,
	"eval_loss": 0.5688283443450928,
	"eval_runtime": 147.1422,
	"eval_samples_per_second": 38.439,
	"eval_steps_per_second": 4.805,
	"eval_wer": 0.44326041950859396,
	"step": 24200
	},
	{
	"epoch": 0.9587803057094582,
	"eval_loss": 0.57487553358078,
	"eval_runtime": 146.7792,
	"eval_samples_per_second": 38.534,
	"eval_steps_per_second": 4.817,
	"eval_wer": 0.4454751167530613,
	"step": 24400
	},
	{
	"epoch": 0.9627097331918739,
	"grad_norm": NaN,
	"learning_rate": 0.0001546121212121212,
	"loss": 0.3889,
	"step": 24500
	},
	{
	"epoch": 0.9666391606742898,
	"eval_loss": 0.5499551892280579,
	"eval_runtime": 147.156,
	"eval_samples_per_second": 38.435,
	"eval_steps_per_second": 4.804,
	"eval_wer": 0.43180176854808944,
	"step": 24600
	},
	{
	"epoch": 0.9744980156391214,
	"eval_loss": 0.5436142086982727,
	"eval_runtime": 147.2848,
	"eval_samples_per_second": 38.402,
	"eval_steps_per_second": 4.8,
	"eval_wer": 0.4371780263516875,
	"step": 24800
	},
	{
	"epoch": 0.982356870603953,
	"grad_norm": 4.918150424957275,
	"learning_rate": 0.0001515818181818182,
	"loss": 0.39,
	"step": 25000
	},
	{
	"epoch": 0.982356870603953,
	"eval_loss": 0.547515332698822,
	"eval_runtime": 147.2374,
	"eval_samples_per_second": 38.414,
	"eval_steps_per_second": 4.802,
	"eval_wer": 0.4388310250196594,
	"step": 25000
	},
	{
	"epoch": 0.9902157255687847,
	"eval_loss": 0.5531713366508484,
	"eval_runtime": 146.8558,
	"eval_samples_per_second": 38.514,
	"eval_steps_per_second": 4.814,
	"eval_wer": 0.4423777503169585,
	"step": 25200
	},
	{
	"epoch": 0.9980745805336163,
	"eval_loss": 0.5450366139411926,
	"eval_runtime": 147.6783,
	"eval_samples_per_second": 38.299,
	"eval_steps_per_second": 4.787,
	"eval_wer": 0.4280945579432203,
	"step": 25400
	},
	{
	"epoch": 1.002004008016032,
	"grad_norm": 1.2219481468200684,
	"learning_rate": 0.00014855151515151514,
	"loss": 0.3853,
	"step": 25500
	},
	{
	"epoch": 1.005933435498448,
	"eval_loss": 0.5462915897369385,
	"eval_runtime": 145.543,
	"eval_samples_per_second": 38.861,
	"eval_steps_per_second": 4.858,
	"eval_wer": 0.43079071111039785,
	"step": 25600
	},
	{
	"epoch": 1.0137922904632795,
	"eval_loss": 0.5457944869995117,
	"eval_runtime": 145.2381,
	"eval_samples_per_second": 38.943,
	"eval_steps_per_second": 4.868,
	"eval_wer": 0.4277896358588371,
	"step": 25800
	},
	{
	"epoch": 1.0216511454281112,
	"grad_norm": 4.69161319732666,
	"learning_rate": 0.0001455212121212121,
	"loss": 0.3413,
	"step": 26000
	},
	{
	"epoch": 1.0216511454281112,
	"eval_loss": 0.5470069646835327,
	"eval_runtime": 145.5418,
	"eval_samples_per_second": 38.862,
	"eval_steps_per_second": 4.858,
	"eval_wer": 0.43441767906148193,
	"step": 26000
	},
	{
	"epoch": 1.0295100003929427,
	"eval_loss": 0.5358372330665588,
	"eval_runtime": 145.609,
	"eval_samples_per_second": 38.844,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.42258991189356615,
	"step": 26200
	},
	{
	"epoch": 1.0373688553577745,
	"eval_loss": 0.5403576493263245,
	"eval_runtime": 146.3753,
	"eval_samples_per_second": 38.64,
	"eval_steps_per_second": 4.83,
	"eval_wer": 0.42308741634703345,
	"step": 26400
	},
	{
	"epoch": 1.0412982828401902,
	"grad_norm": 1.2460460662841797,
	"learning_rate": 0.00014249090909090908,
	"loss": 0.339,
	"step": 26500
	},
	{
	"epoch": 1.045227710322606,
	"eval_loss": 0.5345466732978821,
	"eval_runtime": 145.3146,
	"eval_samples_per_second": 38.922,
	"eval_steps_per_second": 4.865,
	"eval_wer": 0.42433920174608014,
	"step": 26600
	},
	{
	"epoch": 1.0530865652874377,
	"eval_loss": 0.5396625995635986,
	"eval_runtime": 145.9713,
	"eval_samples_per_second": 38.747,
	"eval_steps_per_second": 4.843,
	"eval_wer": 0.4199579528494166,
	"step": 26800
	},
	{
	"epoch": 1.0609454202522692,
	"grad_norm": 1.021347165107727,
	"learning_rate": 0.00013946060606060605,
	"loss": 0.3235,
	"step": 27000
	},
	{
	"epoch": 1.0609454202522692,
	"eval_loss": 0.5378654599189758,
	"eval_runtime": 145.6291,
	"eval_samples_per_second": 38.838,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.4183049541814447,
	"step": 27000
	},
	{
	"epoch": 1.0688042752171008,
	"eval_loss": 0.5305435657501221,
	"eval_runtime": 145.36,
	"eval_samples_per_second": 38.91,
	"eval_steps_per_second": 4.864,
	"eval_wer": 0.42753285936672497,
	"step": 27200
	},
	{
	"epoch": 1.0766631301819325,
	"eval_loss": 0.5440751910209656,
	"eval_runtime": 145.3458,
	"eval_samples_per_second": 38.914,
	"eval_steps_per_second": 4.864,
	"eval_wer": 0.4247564635457624,
	"step": 27400
	},
	{
	"epoch": 1.0805925576643483,
	"grad_norm": 0.5985044836997986,
	"learning_rate": 0.00013643636363636362,
	"loss": 0.3252,
	"step": 27500
	},
	{
	"epoch": 1.0845219851467642,
	"eval_loss": 0.5361995697021484,
	"eval_runtime": 146.0428,
	"eval_samples_per_second": 38.728,
	"eval_steps_per_second": 4.841,
	"eval_wer": 0.4177753526664634,
	"step": 27600
	},
	{
	"epoch": 1.0923808401115958,
	"eval_loss": 0.5305026173591614,
	"eval_runtime": 145.9537,
	"eval_samples_per_second": 38.752,
	"eval_steps_per_second": 4.844,
	"eval_wer": 0.42015053521850076,
	"step": 27800
	},
	{
	"epoch": 1.1002396950764273,
	"grad_norm": 1.615342378616333,
	"learning_rate": 0.0001334060606060606,
	"loss": 0.3301,
	"step": 28000
	},
	{
	"epoch": 1.1002396950764273,
	"eval_loss": 0.5307178497314453,
	"eval_runtime": 146.253,
	"eval_samples_per_second": 38.673,
	"eval_steps_per_second": 4.834,
	"eval_wer": 0.41851358508128583,
	"step": 28000
	},
	{
	"epoch": 1.108098550041259,
	"eval_loss": 0.5402148365974426,
	"eval_runtime": 145.7202,
	"eval_samples_per_second": 38.814,
	"eval_steps_per_second": 4.852,
	"eval_wer": 0.431127730256295,
	"step": 28200
	},
	{
	"epoch": 1.1159574050060905,
	"eval_loss": 0.5308640003204346,
	"eval_runtime": 145.81,
	"eval_samples_per_second": 38.79,
	"eval_steps_per_second": 4.849,
	"eval_wer": 0.41788769238176243,
	"step": 28400
	},
	{
	"epoch": 1.1198868324885065,
	"grad_norm": 1.1408910751342773,
	"learning_rate": 0.00013037575757575756,
	"loss": 0.3087,
	"step": 28500
	},
	{
	"epoch": 1.1238162599709223,
	"eval_loss": 0.5298367738723755,
	"eval_runtime": 145.4349,
	"eval_samples_per_second": 38.89,
	"eval_steps_per_second": 4.861,
	"eval_wer": 0.42137022355603343,
	"step": 28600
	},
	{
	"epoch": 1.1316751149357538,
	"eval_loss": 0.5330610275268555,
	"eval_runtime": 145.6355,
	"eval_samples_per_second": 38.837,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.4214665147405755,
	"step": 28800
	},
	{
	"epoch": 1.1395339699005855,
	"grad_norm": 0.8552046418190002,
	"learning_rate": 0.00012734545454545453,
	"loss": 0.3222,
	"step": 29000
	},
	{
	"epoch": 1.1395339699005855,
	"eval_loss": 0.5273275971412659,
	"eval_runtime": 145.8763,
	"eval_samples_per_second": 38.773,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.4145495979843045,
	"step": 29000
	},
	{
	"epoch": 1.147392824865417,
	"eval_loss": 0.5282542705535889,
	"eval_runtime": 145.6375,
	"eval_samples_per_second": 38.836,
	"eval_steps_per_second": 4.855,
	"eval_wer": 0.4130731331546597,
	"step": 29200
	},
	{
	"epoch": 1.1552516798302488,
	"eval_loss": 0.5256520509719849,
	"eval_runtime": 145.9987,
	"eval_samples_per_second": 38.74,
	"eval_steps_per_second": 4.843,
	"eval_wer": 0.41159666832501485,
	"step": 29400
	},
	{
	"epoch": 1.1591811073126645,
	"grad_norm": 3.544210195541382,
	"learning_rate": 0.0001243151515151515,
	"loss": 0.3227,
	"step": 29500
	},
	{
	"epoch": 1.1631105347950803,
	"eval_loss": 0.5168554186820984,
	"eval_runtime": 145.3157,
	"eval_samples_per_second": 38.922,
	"eval_steps_per_second": 4.865,
	"eval_wer": 0.408419059235127,
	"step": 29600
	},
	{
	"epoch": 1.170969389759912,
	"eval_loss": 0.5184837579727173,
	"eval_runtime": 145.4598,
	"eval_samples_per_second": 38.884,
	"eval_steps_per_second": 4.86,
	"eval_wer": 0.41068190207186533,
	"step": 29800
	},
	{
	"epoch": 1.1788282447247436,
	"grad_norm": 0.8857652544975281,
	"learning_rate": 0.00012128484848484848,
	"loss": 0.309,
	"step": 30000
	},
	{
	"epoch": 1.1788282447247436,
	"eval_loss": 0.5076336860656738,
	"eval_runtime": 145.8517,
	"eval_samples_per_second": 38.779,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.40275392787790276,
	"step": 30000
	},
	{
	"epoch": 1.1866870996895753,
	"eval_loss": 0.5178284049034119,
	"eval_runtime": 146.4004,
	"eval_samples_per_second": 38.634,
	"eval_steps_per_second": 4.829,
	"eval_wer": 0.40535378986053827,
	"step": 30200
	},
	{
	"epoch": 1.1945459546544068,
	"eval_loss": 0.5225840210914612,
	"eval_runtime": 149.501,
	"eval_samples_per_second": 37.833,
	"eval_steps_per_second": 4.729,
	"eval_wer": 0.4122065124937812,
	"step": 30400
	},
	{
	"epoch": 1.1984753821368226,
	"grad_norm": 1.1116445064544678,
	"learning_rate": 0.00011826060606060606,
	"loss": 0.3138,
	"step": 30500
	},
	{
	"epoch": 1.2024048096192386,
	"eval_loss": 0.5226925015449524,
	"eval_runtime": 145.5048,
	"eval_samples_per_second": 38.872,
	"eval_steps_per_second": 4.859,
	"eval_wer": 0.4072635650206224,
	"step": 30600
	},
	{
	"epoch": 1.21026366458407,
	"eval_loss": 0.5130230784416199,
	"eval_runtime": 144.8014,
	"eval_samples_per_second": 39.06,
	"eval_steps_per_second": 4.883,
	"eval_wer": 0.40498467365312707,
	"step": 30800
	},
	{
	"epoch": 1.2181225195489018,
	"grad_norm": 1.0480467081069946,
	"learning_rate": 0.00011523030303030302,
	"loss": 0.3083,
	"step": 31000
	},
	{
	"epoch": 1.2181225195489018,
	"eval_loss": 0.516806423664093,
	"eval_runtime": 145.4982,
	"eval_samples_per_second": 38.873,
	"eval_steps_per_second": 4.859,
	"eval_wer": 0.4113077947713887,
	"step": 31000
	},
	{
	"epoch": 1.2259813745137333,
	"eval_loss": 0.505409836769104,
	"eval_runtime": 145.5358,
	"eval_samples_per_second": 38.863,
	"eval_steps_per_second": 4.858,
	"eval_wer": 0.4003947938566224,
	"step": 31200
	},
	{
	"epoch": 1.2338402294785649,
	"eval_loss": 0.5144046545028687,
	"eval_runtime": 145.0631,
	"eval_samples_per_second": 38.99,
	"eval_steps_per_second": 4.874,
	"eval_wer": 0.406653720851856,
	"step": 31400
	},
	{
	"epoch": 1.2377696569609808,
	"grad_norm": 1.0551427602767944,
	"learning_rate": 0.00011219999999999999,
	"loss": 0.2981,
	"step": 31500
	},
	{
	"epoch": 1.2416990844433966,
	"eval_loss": 0.5082244277000427,
	"eval_runtime": 145.8395,
	"eval_samples_per_second": 38.782,
	"eval_steps_per_second": 4.848,
	"eval_wer": 0.39923929964211774,
	"step": 31600
	},
	{
	"epoch": 1.2495579394082281,
	"eval_loss": 0.5134223103523254,
	"eval_runtime": 145.7659,
	"eval_samples_per_second": 38.802,
	"eval_steps_per_second": 4.85,
	"eval_wer": 0.396125884675258,
	"step": 31800
	},
	{
	"epoch": 1.2574167943730599,
	"grad_norm": 2.2508976459503174,
	"learning_rate": 0.00010916969696969696,
	"loss": 0.2952,
	"step": 32000
	},
	{
	"epoch": 1.2574167943730599,
	"eval_loss": 0.49696260690689087,
	"eval_runtime": 145.5612,
	"eval_samples_per_second": 38.857,
	"eval_steps_per_second": 4.857,
	"eval_wer": 0.3999454349954262,
	"step": 32000
	},
	{
	"epoch": 1.2652756493378914,
	"eval_loss": 0.50291907787323,
	"eval_runtime": 145.2238,
	"eval_samples_per_second": 38.947,
	"eval_steps_per_second": 4.868,
	"eval_wer": 0.4005713276949495,
	"step": 32200
	},
	{
	"epoch": 1.2731345043027231,
	"eval_loss": 0.4979938268661499,
	"eval_runtime": 146.0479,
	"eval_samples_per_second": 38.727,
	"eval_steps_per_second": 4.841,
	"eval_wer": 0.4001540658952673,
	"step": 32400
	},
	{
	"epoch": 1.2770639317851389,
	"grad_norm": 0.7384321689605713,
	"learning_rate": 0.00010614545454545453,
	"loss": 0.2995,
	"step": 32500
	},
	{
	"epoch": 1.2809933592675546,
	"eval_loss": 0.49917110800743103,
	"eval_runtime": 145.9484,
	"eval_samples_per_second": 38.753,
	"eval_steps_per_second": 4.844,
	"eval_wer": 0.40463160597647285,
	"step": 32600
	},
	{
	"epoch": 1.2888522142323864,
	"eval_loss": 0.49689990282058716,
	"eval_runtime": 146.3024,
	"eval_samples_per_second": 38.66,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.3911829372020991,
	"step": 32800
	},
	{
	"epoch": 1.296711069197218,
	"grad_norm": 0.6462344527244568,
	"learning_rate": 0.0001031151515151515,
	"loss": 0.3046,
	"step": 33000
	},
	{
	"epoch": 1.296711069197218,
	"eval_loss": 0.49431467056274414,
	"eval_runtime": 145.566,
	"eval_samples_per_second": 38.855,
	"eval_steps_per_second": 4.857,
	"eval_wer": 0.3933334403235384,
	"step": 33000
	},
	{
	"epoch": 1.3045699241620496,
	"eval_loss": 0.4882897138595581,
	"eval_runtime": 146.7921,
	"eval_samples_per_second": 38.531,
	"eval_steps_per_second": 4.816,
	"eval_wer": 0.3932050520774823,
	"step": 33200
	},
	{
	"epoch": 1.3124287791268812,
	"eval_loss": 0.49653205275535583,
	"eval_runtime": 146.2261,
	"eval_samples_per_second": 38.68,
	"eval_steps_per_second": 4.835,
	"eval_wer": 0.3935099741618655,
	"step": 33400
	},
	{
	"epoch": 1.316358206609297,
	"grad_norm": 4.335805416107178,
	"learning_rate": 0.00010009090909090908,
	"loss": 0.2972,
	"step": 33500
	},
	{
	"epoch": 1.320287634091713,
	"eval_loss": 0.49103957414627075,
	"eval_runtime": 146.0953,
	"eval_samples_per_second": 38.714,
	"eval_steps_per_second": 4.839,
	"eval_wer": 0.3942000609844169,
	"step": 33600
	},
	{
	"epoch": 1.3281464890565444,
	"eval_loss": 0.5007916688919067,
	"eval_runtime": 145.7572,
	"eval_samples_per_second": 38.804,
	"eval_steps_per_second": 4.851,
	"eval_wer": 0.4097029416956878,
	"step": 33800
	},
	{
	"epoch": 1.3360053440213762,
	"grad_norm": 0.6741358637809753,
	"learning_rate": 9.706060606060605e-05,
	"loss": 0.3093,
	"step": 34000
	},
	{
	"epoch": 1.3360053440213762,
	"eval_loss": 0.4958365857601166,
	"eval_runtime": 146.2684,
	"eval_samples_per_second": 38.669,
	"eval_steps_per_second": 4.834,
	"eval_wer": 0.39574071993708976,
	"step": 34000
	},
	{
	"epoch": 1.3438641989862077,
	"eval_loss": 0.5045068264007568,
	"eval_runtime": 146.1991,
	"eval_samples_per_second": 38.687,
	"eval_steps_per_second": 4.836,
	"eval_wer": 0.40179101603248224,
	"step": 34200
	},
	{
	"epoch": 1.3517230539510394,
	"eval_loss": 0.492519348859787,
	"eval_runtime": 146.1528,
	"eval_samples_per_second": 38.699,
	"eval_steps_per_second": 4.837,
	"eval_wer": 0.3969925053361365,
	"step": 34400
	},
	{
	"epoch": 1.3556524814334552,
	"grad_norm": 0.9136665463447571,
	"learning_rate": 9.403030303030303e-05,
	"loss": 0.2947,
	"step": 34500
	},
	{
	"epoch": 1.359581908915871,
	"eval_loss": 0.4828738868236542,
	"eval_runtime": 145.0639,
	"eval_samples_per_second": 38.99,
	"eval_steps_per_second": 4.874,
	"eval_wer": 0.3905409959718188,
	"step": 34600
	},
	{
	"epoch": 1.3674407638807025,
	"eval_loss": 0.4869907796382904,
	"eval_runtime": 145.4878,
	"eval_samples_per_second": 38.876,
	"eval_steps_per_second": 4.86,
	"eval_wer": 0.39522716695286547,
	"step": 34800
	},
	{
	"epoch": 1.3752996188455342,
	"grad_norm": 1.0685299634933472,
	"learning_rate": 9.099999999999999e-05,
	"loss": 0.2801,
	"step": 35000
	},
	{
	"epoch": 1.3752996188455342,
	"eval_loss": 0.4897337555885315,
	"eval_runtime": 145.9513,
	"eval_samples_per_second": 38.753,
	"eval_steps_per_second": 4.844,
	"eval_wer": 0.3936704594694356,
	"step": 35000
	},
	{
	"epoch": 1.383158473810366,
	"eval_loss": 0.5006551146507263,
	"eval_runtime": 145.7634,
	"eval_samples_per_second": 38.803,
	"eval_steps_per_second": 4.85,
	"eval_wer": 0.39972075556482806,
	"step": 35200
	},
	{
	"epoch": 1.3910173287751975,
	"eval_loss": 0.48228171467781067,
	"eval_runtime": 145.956,
	"eval_samples_per_second": 38.751,
	"eval_steps_per_second": 4.844,
	"eval_wer": 0.38492401020686556,
	"step": 35400
	},
	{
	"epoch": 1.3949467562576132,
	"grad_norm": 0.6772143244743347,
	"learning_rate": 8.796969696969696e-05,
	"loss": 0.2772,
	"step": 35500
	},
	{
	"epoch": 1.398876183740029,
	"eval_loss": 0.4848904013633728,
	"eval_runtime": 145.8656,
	"eval_samples_per_second": 38.775,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.39121503426361315,
	"step": 35600
	},
	{
	"epoch": 1.4067350387048607,
	"eval_loss": 0.4844968020915985,
	"eval_runtime": 146.3634,
	"eval_samples_per_second": 38.644,
	"eval_steps_per_second": 4.83,
	"eval_wer": 0.3881658134197814,
	"step": 35800
	},
	{
	"epoch": 1.4145938936696925,
	"grad_norm": 1.0455658435821533,
	"learning_rate": 8.493939393939393e-05,
	"loss": 0.281,
	"step": 36000
	},
	{
	"epoch": 1.4145938936696925,
	"eval_loss": 0.482947438955307,
	"eval_runtime": 145.7025,
	"eval_samples_per_second": 38.819,
	"eval_steps_per_second": 4.852,
	"eval_wer": 0.38418577779204316,
	"step": 36000
	},
	{
	"epoch": 1.422452748634524,
	"eval_loss": 0.48147863149642944,
	"eval_runtime": 146.3811,
	"eval_samples_per_second": 38.639,
	"eval_steps_per_second": 4.83,
	"eval_wer": 0.3859190191138001,
	"step": 36200
	},
	{
	"epoch": 1.4303116035993555,
	"eval_loss": 0.4771769642829895,
	"eval_runtime": 145.8053,
	"eval_samples_per_second": 38.791,
	"eval_steps_per_second": 4.849,
	"eval_wer": 0.38075139221004317,
	"step": 36400
	},
	{
	"epoch": 1.4342410310817715,
	"grad_norm": 0.6518095135688782,
	"learning_rate": 8.19090909090909e-05,
	"loss": 0.2697,
	"step": 36500
	},
	{
	"epoch": 1.4381704585641872,
	"eval_loss": 0.48701608180999756,
	"eval_runtime": 145.4126,
	"eval_samples_per_second": 38.896,
	"eval_steps_per_second": 4.862,
	"eval_wer": 0.3914236651634543,
	"step": 36600
	},
	{
	"epoch": 1.4460293135290188,
	"eval_loss": 0.47700512409210205,
	"eval_runtime": 145.4281,
	"eval_samples_per_second": 38.892,
	"eval_steps_per_second": 4.862,
	"eval_wer": 0.38662515446710854,
	"step": 36800
	},
	{
	"epoch": 1.4538881684938505,
	"grad_norm": 2.1603991985321045,
	"learning_rate": 7.887878787878789e-05,
	"loss": 0.2766,
	"step": 37000
	},
	{
	"epoch": 1.4538881684938505,
	"eval_loss": 0.4786865711212158,
	"eval_runtime": 145.7912,
	"eval_samples_per_second": 38.795,
	"eval_steps_per_second": 4.849,
	"eval_wer": 0.38209946879363194,
	"step": 37000
	},
	{
	"epoch": 1.461747023458682,
	"eval_loss": 0.4793393015861511,
	"eval_runtime": 145.5675,
	"eval_samples_per_second": 38.855,
	"eval_steps_per_second": 4.857,
	"eval_wer": 0.38099212017139833,
	"step": 37200
	},
	{
	"epoch": 1.4696058784235138,
	"eval_loss": 0.4738729000091553,
	"eval_runtime": 145.8624,
	"eval_samples_per_second": 38.776,
	"eval_steps_per_second": 4.847,
	"eval_wer": 0.3803341304103609,
	"step": 37400
	},
	{
	"epoch": 1.4735353059059295,
	"grad_norm": 1.9566117525100708,
	"learning_rate": 7.585454545454545e-05,
	"loss": 0.2905,
	"step": 37500
	},
	{
	"epoch": 1.4774647333883453,
	"eval_loss": 0.47245293855667114,
	"eval_runtime": 145.8323,
	"eval_samples_per_second": 38.784,
	"eval_steps_per_second": 4.848,
	"eval_wer": 0.3811205084174544,
	"step": 37600
	},
	{
	"epoch": 1.485323588353177,
	"eval_loss": 0.47267088294029236,
	"eval_runtime": 145.9296,
	"eval_samples_per_second": 38.758,
	"eval_steps_per_second": 4.845,
	"eval_wer": 0.37827991847346376,
	"step": 37800
	},
	{
	"epoch": 1.4931824433180085,
	"grad_norm": 2.518251895904541,
	"learning_rate": 7.282424242424242e-05,
	"loss": 0.2799,
	"step": 38000
	},
	{
	"epoch": 1.4931824433180085,
	"eval_loss": 0.47050511837005615,
	"eval_runtime": 146.8142,
	"eval_samples_per_second": 38.525,
	"eval_steps_per_second": 4.816,
	"eval_wer": 0.3776700743046974,
	"step": 38000
	},
	{
	"epoch": 1.50104129828284,
	"eval_loss": 0.4659024178981781,
	"eval_runtime": 145.787,
	"eval_samples_per_second": 38.796,
	"eval_steps_per_second": 4.85,
	"eval_wer": 0.37508626085281893,
	"step": 38200
	},
	{
	"epoch": 1.5089001532476718,
	"eval_loss": 0.46910360455513,
	"eval_runtime": 146.8808,
	"eval_samples_per_second": 38.507,
	"eval_steps_per_second": 4.813,
	"eval_wer": 0.37429988284572546,
	"step": 38400
	},
	{
	"epoch": 1.5128295807300876,
	"grad_norm": 1.3675510883331299,
	"learning_rate": 6.979393939393939e-05,
	"loss": 0.267,
	"step": 38500
	},
	{
	"epoch": 1.5167590082125035,
	"eval_loss": 0.4690033495426178,
	"eval_runtime": 145.2501,
	"eval_samples_per_second": 38.94,
	"eval_steps_per_second": 4.867,
	"eval_wer": 0.3663558601210059,
	"step": 38600
	},
	{
	"epoch": 1.524617863177335,
	"eval_loss": 0.4632550776004791,
	"eval_runtime": 146.3252,
	"eval_samples_per_second": 38.654,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.36810514997351995,
	"step": 38800
	},
	{
	"epoch": 1.5324767181421666,
	"grad_norm": 1.2868680953979492,
	"learning_rate": 6.676969696969697e-05,
	"loss": 0.2632,
	"step": 39000
	},
	{
	"epoch": 1.5324767181421666,
	"eval_loss": 0.4650620222091675,
	"eval_runtime": 146.2691,
	"eval_samples_per_second": 38.668,
	"eval_steps_per_second": 4.834,
	"eval_wer": 0.37255059299321147,
	"step": 39000
	},
	{
	"epoch": 1.5403355731069983,
	"eval_loss": 0.46896418929100037,
	"eval_runtime": 145.9823,
	"eval_samples_per_second": 38.744,
	"eval_steps_per_second": 4.843,
	"eval_wer": 0.3673990146202115,
	"step": 39200
	},
	{
	"epoch": 1.54819442807183,
	"eval_loss": 0.4612589180469513,
	"eval_runtime": 145.4614,
	"eval_samples_per_second": 38.883,
	"eval_steps_per_second": 4.86,
	"eval_wer": 0.3714913899632489,
	"step": 39400
	},
	{
	"epoch": 1.5521238555542456,
	"grad_norm": 2.942875623703003,
	"learning_rate": 6.373939393939393e-05,
	"loss": 0.2716,
	"step": 39500
	},
	{
	"epoch": 1.5560532830366616,
	"eval_loss": 0.4654790461063385,
	"eval_runtime": 146.1694,
	"eval_samples_per_second": 38.695,
	"eval_steps_per_second": 4.837,
	"eval_wer": 0.36967790598770683,
	"step": 39600
	},
	{
	"epoch": 1.563912138001493,
	"eval_loss": 0.4596673846244812,
	"eval_runtime": 145.7967,
	"eval_samples_per_second": 38.794,
	"eval_steps_per_second": 4.849,
	"eval_wer": 0.364799152637576,
	"step": 39800
	},
	{
	"epoch": 1.5717709929663248,
	"grad_norm": 0.4809035658836365,
	"learning_rate": 6.07090909090909e-05,
	"loss": 0.2651,
	"step": 40000
	},
	{
	"epoch": 1.5717709929663248,
	"eval_loss": 0.4549534320831299,
	"eval_runtime": 146.3998,
	"eval_samples_per_second": 38.634,
	"eval_steps_per_second": 4.829,
	"eval_wer": 0.36619537481343584,
	"step": 40000
	},
	{
	"epoch": 1.5796298479311566,
	"eval_loss": 0.4538833498954773,
	"eval_runtime": 146.0948,
	"eval_samples_per_second": 38.715,
	"eval_steps_per_second": 4.839,
	"eval_wer": 0.3676397425815667,
	"step": 40200
	},
	{
	"epoch": 1.587488702895988,
	"eval_loss": 0.4542824625968933,
	"eval_runtime": 146.3082,
	"eval_samples_per_second": 38.658,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.36746320874323957,
	"step": 40400
	},
	{
	"epoch": 1.5914181303784039,
	"grad_norm": 1.2710328102111816,
	"learning_rate": 5.767878787878788e-05,
	"loss": 0.2659,
	"step": 40500
	},
	{
	"epoch": 1.5953475578608196,
	"eval_loss": 0.45555397868156433,
	"eval_runtime": 146.1729,
	"eval_samples_per_second": 38.694,
	"eval_steps_per_second": 4.837,
	"eval_wer": 0.3622795333087256,
	"step": 40600
	},
	{
	"epoch": 1.6032064128256514,
	"eval_loss": 0.463294118642807,
	"eval_runtime": 146.3048,
	"eval_samples_per_second": 38.659,
	"eval_steps_per_second": 4.832,
	"eval_wer": 0.36849031471168814,
	"step": 40800
	},
	{
	"epoch": 1.611065267790483,
	"grad_norm": 1.9250500202178955,
	"learning_rate": 5.4660606060606054e-05,
	"loss": 0.2559,
	"step": 41000
	},
	{
	"epoch": 1.611065267790483,
	"eval_loss": 0.4529285132884979,
	"eval_runtime": 146.9183,
	"eval_samples_per_second": 38.498,
	"eval_steps_per_second": 4.812,
	"eval_wer": 0.36083516554059475,
	"step": 41000
	},
	{
	"epoch": 1.6189241227553146,
	"eval_loss": 0.45345816016197205,
	"eval_runtime": 145.5972,
	"eval_samples_per_second": 38.847,
	"eval_steps_per_second": 4.856,
	"eval_wer": 0.36385228932291247,
	"step": 41200
	},
	{
	"epoch": 1.6267829777201461,
	"eval_loss": 0.4511209726333618,
	"eval_runtime": 146.7532,
	"eval_samples_per_second": 38.541,
	"eval_steps_per_second": 4.818,
	"eval_wer": 0.3637078525460994,
	"step": 41400
	},
	{
	"epoch": 1.630712405202562,
	"grad_norm": 0.9593771696090698,
	"learning_rate": 5.1630303030303025e-05,
	"loss": 0.2629,
	"step": 41500
	},
	{
	"epoch": 1.6346418326849776,
	"eval_loss": 0.45563140511512756,
	"eval_runtime": 146.0124,
	"eval_samples_per_second": 38.736,
	"eval_steps_per_second": 4.842,
	"eval_wer": 0.36049814639469757,
	"step": 41600
	},
	{
	"epoch": 1.6425006876498094,
	"eval_loss": 0.457055002450943,
	"eval_runtime": 147.3584,
	"eval_samples_per_second": 38.383,
	"eval_steps_per_second": 4.798,
	"eval_wer": 0.36390043491518353,
	"step": 41800
	},
	{
	"epoch": 1.6503595426146411,
	"grad_norm": 0.9599024653434753,
	"learning_rate": 4.8599999999999995e-05,
	"loss": 0.259,
	"step": 42000
	},
	{
	"epoch": 1.6503595426146411,
	"eval_loss": 0.46201661229133606,
	"eval_runtime": 146.8464,
	"eval_samples_per_second": 38.516,
	"eval_steps_per_second": 4.815,
	"eval_wer": 0.36903596475742645,
	"step": 42000
	},
	{
	"epoch": 1.6582183975794726,
	"eval_loss": 0.45499464869499207,
	"eval_runtime": 146.9092,
	"eval_samples_per_second": 38.5,
	"eval_steps_per_second": 4.812,
	"eval_wer": 0.36348317311550127,
	"step": 42200
	},
	{
	"epoch": 1.6660772525443042,
	"eval_loss": 0.45219454169273376,
	"eval_runtime": 146.8863,
	"eval_samples_per_second": 38.506,
	"eval_steps_per_second": 4.813,
	"eval_wer": 0.3584278859270434,
	"step": 42400
	},
	{
	"epoch": 1.6700066800267201,
	"grad_norm": 1.0676679611206055,
	"learning_rate": 4.5569696969696966e-05,
	"loss": 0.2594,
	"step": 42500
	},
	{
	"epoch": 1.673936107509136,
	"eval_loss": 0.4494900703430176,
	"eval_runtime": 147.3169,
	"eval_samples_per_second": 38.393,
	"eval_steps_per_second": 4.799,
	"eval_wer": 0.3589253903805107,
	"step": 42600
	},
	{
	"epoch": 1.6817949624739676,
	"eval_loss": 0.4453260898590088,
	"eval_runtime": 146.8159,
	"eval_samples_per_second": 38.524,
	"eval_steps_per_second": 4.816,
	"eval_wer": 0.3562131886825761,
	"step": 42800
	},
	{
	"epoch": 1.6896538174387992,
	"grad_norm": 0.4820586144924164,
	"learning_rate": 4.253939393939394e-05,
	"loss": 0.2538,
	"step": 43000
	},
	{
	"epoch": 1.6896538174387992,
	"eval_loss": 0.4438420832157135,
	"eval_runtime": 147.9055,
	"eval_samples_per_second": 38.241,
	"eval_steps_per_second": 4.78,
	"eval_wer": 0.3555391503907817,
	"step": 43000
	},
	{
	"epoch": 1.6975126724036307,
	"eval_loss": 0.4494447708129883,
	"eval_runtime": 146.855,
	"eval_samples_per_second": 38.514,
	"eval_steps_per_second": 4.814,
	"eval_wer": 0.3566946446052864,
	"step": 43200
	},
	{
	"epoch": 1.7053715273684624,
	"eval_loss": 0.4443654716014862,
	"eval_runtime": 146.8467,
	"eval_samples_per_second": 38.516,
	"eval_steps_per_second": 4.815,
	"eval_wer": 0.3537898605382677,
	"step": 43400
	},
	{
	"epoch": 1.7093009548508782,
	"grad_norm": 0.7214144468307495,
	"learning_rate": 3.950909090909091e-05,
	"loss": 0.2512,
	"step": 43500
	},
	{
	"epoch": 1.7132303823332942,
	"eval_loss": 0.4454784691333771,
	"eval_runtime": 147.1352,
	"eval_samples_per_second": 38.441,
	"eval_steps_per_second": 4.805,
	"eval_wer": 0.3529713854696602,
	"step": 43600
	},
	{
	"epoch": 1.7210892372981257,
	"eval_loss": 0.4453714191913605,
	"eval_runtime": 147.5374,
	"eval_samples_per_second": 38.336,
	"eval_steps_per_second": 4.792,
	"eval_wer": 0.3522010559933238,
	"step": 43800
	},
	{
	"epoch": 1.7289480922629572,
	"grad_norm": 1.9711872339248657,
	"learning_rate": 3.647878787878787e-05,
	"loss": 0.2358,
	"step": 44000
	},
	{
	"epoch": 1.7289480922629572,
	"eval_loss": 0.44450756907463074,
	"eval_runtime": 146.8893,
	"eval_samples_per_second": 38.505,
	"eval_steps_per_second": 4.813,
	"eval_wer": 0.3519763765627257,
	"step": 44000
	},
	{
	"epoch": 1.736806947227789,
	"eval_loss": 0.44162794947624207,
	"eval_runtime": 147.6037,
	"eval_samples_per_second": 38.319,
	"eval_steps_per_second": 4.79,
	"eval_wer": 0.34998635874885653,
	"step": 44200
	},
	{
	"epoch": 1.7446658021926207,
	"eval_loss": 0.44202086329460144,
	"eval_runtime": 148.0767,
	"eval_samples_per_second": 38.196,
	"eval_steps_per_second": 4.775,
	"eval_wer": 0.34897530131116494,
	"step": 44400
	},
	{
	"epoch": 1.7485952296750362,
	"grad_norm": 1.1429784297943115,
	"learning_rate": 3.344848484848484e-05,
	"loss": 0.2418,
	"step": 44500
	},
	{
	"epoch": 1.7525246571574522,
	"eval_loss": 0.43861278891563416,
	"eval_runtime": 147.9549,
	"eval_samples_per_second": 38.228,
	"eval_steps_per_second": 4.778,
	"eval_wer": 0.34790004975044536,
	"step": 44600
	},
	{
	"epoch": 1.7603835121222837,
	"eval_loss": 0.4354783296585083,
	"eval_runtime": 149.8154,
	"eval_samples_per_second": 37.753,
	"eval_steps_per_second": 4.719,
	"eval_wer": 0.3460705172441463,
	"step": 44800
	},
	{
	"epoch": 1.7682423670871152,
	"grad_norm": 1.684985637664795,
	"learning_rate": 3.0418181818181817e-05,
	"loss": 0.2421,
	"step": 45000
	},
	{
	"epoch": 1.7682423670871152,
	"eval_loss": 0.43855908513069153,
	"eval_runtime": 148.5791,
	"eval_samples_per_second": 38.067,
	"eval_steps_per_second": 4.758,
	"eval_wer": 0.34372743175362297,
	"step": 45000
	},
	{
	"epoch": 1.776101222051947,
	"eval_loss": 0.4347515106201172,
	"eval_runtime": 147.9309,
	"eval_samples_per_second": 38.234,
	"eval_steps_per_second": 4.779,
	"eval_wer": 0.3458297892827912,
	"step": 45200
	},
	{
	"epoch": 1.7839600770167787,
	"eval_loss": 0.43350183963775635,
	"eval_runtime": 148.2161,
	"eval_samples_per_second": 38.16,
	"eval_steps_per_second": 4.77,
	"eval_wer": 0.3435348493845388,
	"step": 45400
	},
	{
	"epoch": 1.7878895044991945,
	"grad_norm": 2.4373562335968018,
	"learning_rate": 2.7387878787878784e-05,
	"loss": 0.2418,
	"step": 45500
	},
	{
	"epoch": 1.7918189319816102,
	"eval_loss": 0.43087294697761536,
	"eval_runtime": 146.7738,
	"eval_samples_per_second": 38.535,
	"eval_steps_per_second": 4.817,
	"eval_wer": 0.3443693729839033,
	"step": 45600
	},
	{
	"epoch": 1.7996777869464418,
	"eval_loss": 0.43208202719688416,
	"eval_runtime": 147.2129,
	"eval_samples_per_second": 38.421,
	"eval_steps_per_second": 4.803,
	"eval_wer": 0.34249169488533326,
	"step": 45800
	},
	{
	"epoch": 1.8075366419112735,
	"grad_norm": 1.2847892045974731,
	"learning_rate": 2.4357575757575755e-05,
	"loss": 0.2424,
	"step": 46000
	},
	{
	"epoch": 1.8075366419112735,
	"eval_loss": 0.42999544739723206,
	"eval_runtime": 147.0735,
	"eval_samples_per_second": 38.457,
	"eval_steps_per_second": 4.807,
	"eval_wer": 0.34075845356357626,
	"step": 46000
	},
	{
	"epoch": 1.8153954968761052,
	"eval_loss": 0.4301421046257019,
	"eval_runtime": 146.951,
	"eval_samples_per_second": 38.489,
	"eval_steps_per_second": 4.811,
	"eval_wer": 0.34231516104700616,
	"step": 46200
	},
	{
	"epoch": 1.8232543518409368,
	"eval_loss": 0.4339451491832733,
	"eval_runtime": 146.5189,
	"eval_samples_per_second": 38.603,
	"eval_steps_per_second": 4.825,
	"eval_wer": 0.3407424050328192,
	"step": 46400
	},
	{
	"epoch": 1.8271837793233527,
	"grad_norm": 7.262228965759277,
	"learning_rate": 2.133333333333333e-05,
	"loss": 0.228,
	"step": 46500
	},
	{
	"epoch": 1.8311132068057683,
	"eval_loss": 0.43165403604507446,
	"eval_runtime": 146.7443,
	"eval_samples_per_second": 38.543,
	"eval_steps_per_second": 4.818,
	"eval_wer": 0.3428929081542585,
	"step": 46600
	},
	{
	"epoch": 1.8389720617706,
	"eval_loss": 0.43002423644065857,
	"eval_runtime": 146.6705,
	"eval_samples_per_second": 38.563,
	"eval_steps_per_second": 4.82,
	"eval_wer": 0.34332621848469774,
	"step": 46800
	},
	{
	"epoch": 1.8468309167354318,
	"grad_norm": 0.922248125076294,
	"learning_rate": 1.8303030303030302e-05,
	"loss": 0.2532,
	"step": 47000
	},
	{
	"epoch": 1.8468309167354318,
	"eval_loss": 0.42492908239364624,
	"eval_runtime": 147.1617,
	"eval_samples_per_second": 38.434,
	"eval_steps_per_second": 4.804,
	"eval_wer": 0.3439360626534641,
	"step": 47000
	},
	{
	"epoch": 1.8546897717002633,
	"eval_loss": 0.42566677927970886,
	"eval_runtime": 147.1363,
	"eval_samples_per_second": 38.441,
	"eval_steps_per_second": 4.805,
	"eval_wer": 0.3430373449310716,
	"step": 47200
	},
	{
	"epoch": 1.8625486266650948,
	"eval_loss": 0.42639264464378357,
	"eval_runtime": 147.0021,
	"eval_samples_per_second": 38.476,
	"eval_steps_per_second": 4.809,
	"eval_wer": 0.3408226476866043,
	"step": 47400
	},
	{
	"epoch": 1.8664780541475108,
	"grad_norm": 0.7899935841560364,
	"learning_rate": 1.5272727272727273e-05,
	"loss": 0.2347,
	"step": 47500
	},
	{
	"epoch": 1.8704074816299265,
	"eval_loss": 0.4254419207572937,
	"eval_runtime": 146.4448,
	"eval_samples_per_second": 38.622,
	"eval_steps_per_second": 4.828,
	"eval_wer": 0.3408868418096323,
	"step": 47600
	},
	{
	"epoch": 1.8782663365947583,
	"eval_loss": 0.423650860786438,
	"eval_runtime": 147.0702,
	"eval_samples_per_second": 38.458,
	"eval_steps_per_second": 4.807,
	"eval_wer": 0.3391215034263613,
	"step": 47800
	},
	{
	"epoch": 1.8861251915595898,
	"grad_norm": 1.1323833465576172,
	"learning_rate": 1.2242424242424242e-05,
	"loss": 0.2265,
	"step": 48000
	},
	{
	"epoch": 1.8861251915595898,
	"eval_loss": 0.4246509373188019,
	"eval_runtime": 147.0222,
	"eval_samples_per_second": 38.47,
	"eval_steps_per_second": 4.809,
	"eval_wer": 0.33952271669528655,
	"step": 48000
	},
	{
	"epoch": 1.8939840465244213,
	"eval_loss": 0.42534753680229187,
	"eval_runtime": 146.8715,
	"eval_samples_per_second": 38.51,
	"eval_steps_per_second": 4.814,
	"eval_wer": 0.3389128725265202,
	"step": 48200
	},
	{
	"epoch": 1.901842901489253,
	"eval_loss": 0.4245891273021698,
	"eval_runtime": 146.4129,
	"eval_samples_per_second": 38.63,
	"eval_steps_per_second": 4.829,
	"eval_wer": 0.33902521224181925,
	"step": 48400
	},
	{
	"epoch": 1.9057723289716688,
	"grad_norm": 2.10141658782959,
	"learning_rate": 9.212121212121211e-06,
	"loss": 0.2262,
	"step": 48500
	},
	{
	"epoch": 1.9097017564540848,
	"eval_loss": 0.4226687252521515,
	"eval_runtime": 147.045,
	"eval_samples_per_second": 38.464,
	"eval_steps_per_second": 4.808,
	"eval_wer": 0.3378536694965576,
	"step": 48600
	},
	{
	"epoch": 1.9175606114189163,
	"eval_loss": 0.4228062033653259,
	"eval_runtime": 147.4189,
	"eval_samples_per_second": 38.367,
	"eval_steps_per_second": 4.796,
	"eval_wer": 0.33892892105727723,
	"step": 48800
	},
	{
	"epoch": 1.9254194663837478,
	"grad_norm": 0.8046126365661621,
	"learning_rate": 6.181818181818182e-06,
	"loss": 0.2358,
	"step": 49000
	},
	{
	"epoch": 1.9254194663837478,
	"eval_loss": 0.4225420653820038,
	"eval_runtime": 147.7497,
	"eval_samples_per_second": 38.281,
	"eval_steps_per_second": 4.785,
	"eval_wer": 0.3391054548956043,
	"step": 49000
	},
	{
	"epoch": 1.9332783213485794,
	"eval_loss": 0.4224160313606262,
	"eval_runtime": 147.1221,
	"eval_samples_per_second": 38.444,
	"eval_steps_per_second": 4.806,
	"eval_wer": 0.33902521224181925,
	"step": 49200
	},
	{
	"epoch": 1.941137176313411,
	"eval_loss": 0.4214831590652466,
	"eval_runtime": 147.8229,
	"eval_samples_per_second": 38.262,
	"eval_steps_per_second": 4.783,
	"eval_wer": 0.3389931151803052,
	"step": 49400
	},
	{
	"epoch": 1.9450666037958269,
	"grad_norm": 1.517034888267517,
	"learning_rate": 3.1575757575757576e-06,
	"loss": 0.231,
	"step": 49500
	},
	{
	"epoch": 1.9489960312782428,
	"eval_loss": 0.4215412437915802,
	"eval_runtime": 147.4583,
	"eval_samples_per_second": 38.357,
	"eval_steps_per_second": 4.795,
	"eval_wer": 0.3399560270257258,
	"step": 49600
	},
	{
	"epoch": 1.9568548862430744,
	"eval_loss": 0.4211778938770294,
	"eval_runtime": 146.928,
	"eval_samples_per_second": 38.495,
	"eval_steps_per_second": 4.812,
	"eval_wer": 0.33933013432620246,
	"step": 49800
	},
	{
	"epoch": 1.9647137412079059,
	"grad_norm": 2.9327681064605713,
	"learning_rate": 1.2727272727272726e-07,
	"loss": 0.2331,
	"step": 50000
	},
	{
	"epoch": 1.9647137412079059,
	"eval_loss": 0.4211583733558655,
	"eval_runtime": 147.1945,
	"eval_samples_per_second": 38.425,
	"eval_steps_per_second": 4.803,
	"eval_wer": 0.33939432844923045,
	"step": 50000
	},
	{
	"epoch": 1.9647137412079059,
	"step": 50000,
	"total_flos": 6.219831968409632e+19,
	"train_loss": 0.4413083312988281,
	"train_runtime": 56545.9703,
	"train_samples_per_second": 7.074,
	"train_steps_per_second": 0.884
	}
	],
	"logging_steps": 500,
	"max_steps": 50000,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 2,
	"save_steps": 400,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 6.219831968409632e+19,
	"train_batch_size": 8,
	"trial_name": null,
	"trial_params": null
	}