Initial model

Files changed (10) hide show

config.json +79 -0
optimizer.pt +3 -0
preprocessor_config.json +9 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +1501 -0
training_args.bin +3 -0
vocab.json +1 -0

config.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
+  "activation_dropout": 0.0,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.2,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.2,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "pad_token_id": 36,
+  "proj_codevector_dim": 768,
+  "torch_dtype": "float32",
+  "transformers_version": "4.11.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 39
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0fbd68c9108bdd7f2b74d2d6ab60ec454155756c1066837141fb986be18d13b0
+size 2490378769

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:44e381719215ff2cd65a2fbf5588b8deeaf4f712e2800f38410d404e2527695f
+size 1262083569

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76eba952d902f592e5dc53b1ace73547fece6bddedfb82abd6d368838cc3983f
+size 14567

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:12ab3ab57bdd4de9271b2ed77c5b527f019219b09da8c0a67492f35863f058ca
+size 559

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8cd458f9d8a9355ed82afe3dc4a8877431efaf85b6481a523d12fee5200e931c
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1501 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 35.73957158962796,
+  "global_step": 39600,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0002388,
+      "loss": 5.1061,
+      "step": 400
+    },
+    {
+      "epoch": 0.36,
+      "eval_loss": 3.2615509033203125,
+      "eval_runtime": 209.4571,
+      "eval_samples_per_second": 18.892,
+      "eval_steps_per_second": 2.363,
+      "eval_wer": 1.0,
+      "step": 400
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.0002990989719814553,
+      "loss": 1.8298,
+      "step": 800
+    },
+    {
+      "epoch": 0.72,
+      "eval_loss": 0.5897451639175415,
+      "eval_runtime": 208.9676,
+      "eval_samples_per_second": 18.936,
+      "eval_steps_per_second": 2.369,
+      "eval_wer": 0.7382658232272045,
+      "step": 800
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 0.0002978895383995162,
+      "loss": 0.7312,
+      "step": 1200
+    },
+    {
+      "epoch": 1.08,
+      "eval_loss": 0.38931864500045776,
+      "eval_runtime": 205.7748,
+      "eval_samples_per_second": 19.23,
+      "eval_steps_per_second": 2.406,
+      "eval_wer": 0.5565651976374375,
+      "step": 1200
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 0.0002966801048175771,
+      "loss": 0.5859,
+      "step": 1600
+    },
+    {
+      "epoch": 1.44,
+      "eval_loss": 0.3028641939163208,
+      "eval_runtime": 210.4962,
+      "eval_samples_per_second": 18.798,
+      "eval_steps_per_second": 2.352,
+      "eval_wer": 0.43102785447174363,
+      "step": 1600
+    },
+    {
+      "epoch": 1.8,
+      "learning_rate": 0.00029547067123563797,
+      "loss": 0.5272,
+      "step": 2000
+    },
+    {
+      "epoch": 1.8,
+      "eval_loss": 0.2646712362766266,
+      "eval_runtime": 208.1951,
+      "eval_samples_per_second": 19.006,
+      "eval_steps_per_second": 2.378,
+      "eval_wer": 0.3874462656834306,
+      "step": 2000
+    },
+    {
+      "epoch": 2.17,
+      "learning_rate": 0.00029426123765369884,
+      "loss": 0.4691,
+      "step": 2400
+    },
+    {
+      "epoch": 2.17,
+      "eval_loss": 0.25143691897392273,
+      "eval_runtime": 208.3951,
+      "eval_samples_per_second": 18.988,
+      "eval_steps_per_second": 2.375,
+      "eval_wer": 0.3728025722573655,
+      "step": 2400
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 0.0002930518040717597,
+      "loss": 0.4313,
+      "step": 2800
+    },
+    {
+      "epoch": 2.53,
+      "eval_loss": 0.23935846984386444,
+      "eval_runtime": 208.5439,
+      "eval_samples_per_second": 18.974,
+      "eval_steps_per_second": 2.374,
+      "eval_wer": 0.33872715199384895,
+      "step": 2800
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 0.0002918423704898206,
+      "loss": 0.4157,
+      "step": 3200
+    },
+    {
+      "epoch": 2.89,
+      "eval_loss": 0.22154289484024048,
+      "eval_runtime": 207.5705,
+      "eval_samples_per_second": 19.063,
+      "eval_steps_per_second": 2.385,
+      "eval_wer": 0.3165344423863279,
+      "step": 3200
+    },
+    {
+      "epoch": 3.25,
+      "learning_rate": 0.00029063293690788144,
+      "loss": 0.382,
+      "step": 3600
+    },
+    {
+      "epoch": 3.25,
+      "eval_loss": 0.22716625034809113,
+      "eval_runtime": 208.4179,
+      "eval_samples_per_second": 18.986,
+      "eval_steps_per_second": 2.375,
+      "eval_wer": 0.310103798972495,
+      "step": 3600
+    },
+    {
+      "epoch": 3.61,
+      "learning_rate": 0.0002894235033259423,
+      "loss": 0.3636,
+      "step": 4000
+    },
+    {
+      "epoch": 3.61,
+      "eval_loss": 0.21131443977355957,
+      "eval_runtime": 206.1846,
+      "eval_samples_per_second": 19.192,
+      "eval_steps_per_second": 2.401,
+      "eval_wer": 0.30538566385908505,
+      "step": 4000
+    },
+    {
+      "epoch": 3.97,
+      "learning_rate": 0.00028821406974400323,
+      "loss": 0.3665,
+      "step": 4400
+    },
+    {
+      "epoch": 3.97,
+      "eval_loss": 0.21285590529441833,
+      "eval_runtime": 205.9986,
+      "eval_samples_per_second": 19.209,
+      "eval_steps_per_second": 2.403,
+      "eval_wer": 0.2907769195820082,
+      "step": 4400
+    },
+    {
+      "epoch": 4.33,
+      "learning_rate": 0.00028700463616206405,
+      "loss": 0.333,
+      "step": 4800
+    },
+    {
+      "epoch": 4.33,
+      "eval_loss": 0.2077477127313614,
+      "eval_runtime": 208.1768,
+      "eval_samples_per_second": 19.008,
+      "eval_steps_per_second": 2.378,
+      "eval_wer": 0.2788243106280362,
+      "step": 4800
+    },
+    {
+      "epoch": 4.69,
+      "learning_rate": 0.00028579520258012497,
+      "loss": 0.3313,
+      "step": 5200
+    },
+    {
+      "epoch": 4.69,
+      "eval_loss": 0.18993255496025085,
+      "eval_runtime": 205.0681,
+      "eval_samples_per_second": 19.296,
+      "eval_steps_per_second": 2.414,
+      "eval_wer": 0.2659979729493587,
+      "step": 5200
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 0.00028458576899818584,
+      "loss": 0.3222,
+      "step": 5600
+    },
+    {
+      "epoch": 5.05,
+      "eval_loss": 0.19064170122146606,
+      "eval_runtime": 205.7167,
+      "eval_samples_per_second": 19.235,
+      "eval_steps_per_second": 2.406,
+      "eval_wer": 0.2542201097403278,
+      "step": 5600
+    },
+    {
+      "epoch": 5.41,
+      "learning_rate": 0.0002833763354162467,
+      "loss": 0.3003,
+      "step": 6000
+    },
+    {
+      "epoch": 5.41,
+      "eval_loss": 0.1921728551387787,
+      "eval_runtime": 204.1327,
+      "eval_samples_per_second": 19.384,
+      "eval_steps_per_second": 2.425,
+      "eval_wer": 0.2612099395379722,
+      "step": 6000
+    },
+    {
+      "epoch": 5.78,
+      "learning_rate": 0.00028216690183430757,
+      "loss": 0.3057,
+      "step": 6400
+    },
+    {
+      "epoch": 5.78,
+      "eval_loss": 0.19207137823104858,
+      "eval_runtime": 205.293,
+      "eval_samples_per_second": 19.275,
+      "eval_steps_per_second": 2.411,
+      "eval_wer": 0.2560724146367036,
+      "step": 6400
+    },
+    {
+      "epoch": 6.14,
+      "learning_rate": 0.0002809604918363233,
+      "loss": 0.297,
+      "step": 6800
+    },
+    {
+      "epoch": 6.14,
+      "eval_loss": 0.1768147200345993,
+      "eval_runtime": 204.3464,
+      "eval_samples_per_second": 19.364,
+      "eval_steps_per_second": 2.422,
+      "eval_wer": 0.24146367035962674,
+      "step": 6800
+    },
+    {
+      "epoch": 6.5,
+      "learning_rate": 0.0002797510582543842,
+      "loss": 0.2834,
+      "step": 7200
+    },
+    {
+      "epoch": 6.5,
+      "eval_loss": 0.18651635944843292,
+      "eval_runtime": 205.3683,
+      "eval_samples_per_second": 19.268,
+      "eval_steps_per_second": 2.41,
+      "eval_wer": 0.24894278824310628,
+      "step": 7200
+    },
+    {
+      "epoch": 6.86,
+      "learning_rate": 0.00027854162467244505,
+      "loss": 0.2787,
+      "step": 7600
+    },
+    {
+      "epoch": 6.86,
+      "eval_loss": 0.18522889912128448,
+      "eval_runtime": 204.2237,
+      "eval_samples_per_second": 19.376,
+      "eval_steps_per_second": 2.424,
+      "eval_wer": 0.24726522909167162,
+      "step": 7600
+    },
+    {
+      "epoch": 7.22,
+      "learning_rate": 0.0002773321910905059,
+      "loss": 0.2678,
+      "step": 8000
+    },
+    {
+      "epoch": 7.22,
+      "eval_loss": 0.1824478805065155,
+      "eval_runtime": 203.4819,
+      "eval_samples_per_second": 19.446,
+      "eval_steps_per_second": 2.433,
+      "eval_wer": 0.23087407821619543,
+      "step": 8000
+    },
+    {
+      "epoch": 7.58,
+      "learning_rate": 0.0002761227575085668,
+      "loss": 0.2665,
+      "step": 8400
+    },
+    {
+      "epoch": 7.58,
+      "eval_loss": 0.17768050730228424,
+      "eval_runtime": 203.7918,
+      "eval_samples_per_second": 19.417,
+      "eval_steps_per_second": 2.429,
+      "eval_wer": 0.2309789256631601,
+      "step": 8400
+    },
+    {
+      "epoch": 7.94,
+      "learning_rate": 0.00027491332392662766,
+      "loss": 0.2722,
+      "step": 8800
+    },
+    {
+      "epoch": 7.94,
+      "eval_loss": 0.17655304074287415,
+      "eval_runtime": 203.4054,
+      "eval_samples_per_second": 19.454,
+      "eval_steps_per_second": 2.434,
+      "eval_wer": 0.23216719672875966,
+      "step": 8800
+    },
+    {
+      "epoch": 8.3,
+      "learning_rate": 0.0002737038903446885,
+      "loss": 0.2549,
+      "step": 9200
+    },
+    {
+      "epoch": 8.3,
+      "eval_loss": 0.18208913505077362,
+      "eval_runtime": 203.5406,
+      "eval_samples_per_second": 19.441,
+      "eval_steps_per_second": 2.432,
+      "eval_wer": 0.23590675567049943,
+      "step": 9200
+    },
+    {
+      "epoch": 8.66,
+      "learning_rate": 0.00027249748034670427,
+      "loss": 0.2535,
+      "step": 9600
+    },
+    {
+      "epoch": 8.66,
+      "eval_loss": 0.17272169888019562,
+      "eval_runtime": 204.5912,
+      "eval_samples_per_second": 19.341,
+      "eval_steps_per_second": 2.419,
+      "eval_wer": 0.22619089225177366,
+      "step": 9600
+    },
+    {
+      "epoch": 9.03,
+      "learning_rate": 0.00027128804676476514,
+      "loss": 0.2508,
+      "step": 10000
+    },
+    {
+      "epoch": 9.03,
+      "eval_loss": 0.17887552082538605,
+      "eval_runtime": 202.6986,
+      "eval_samples_per_second": 19.522,
+      "eval_steps_per_second": 2.442,
+      "eval_wer": 0.22301051969384544,
+      "step": 10000
+    },
+    {
+      "epoch": 9.39,
+      "learning_rate": 0.000270078613182826,
+      "loss": 0.2354,
+      "step": 10400
+    },
+    {
+      "epoch": 9.39,
+      "eval_loss": 0.17052198946475983,
+      "eval_runtime": 202.2989,
+      "eval_samples_per_second": 19.56,
+      "eval_steps_per_second": 2.447,
+      "eval_wer": 0.2227658756509279,
+      "step": 10400
+    },
+    {
+      "epoch": 9.75,
+      "learning_rate": 0.0002688691796008869,
+      "loss": 0.2449,
+      "step": 10800
+    },
+    {
+      "epoch": 9.75,
+      "eval_loss": 0.17250895500183105,
+      "eval_runtime": 202.4538,
+      "eval_samples_per_second": 19.545,
+      "eval_steps_per_second": 2.445,
+      "eval_wer": 0.2203893335197288,
+      "step": 10800
+    },
+    {
+      "epoch": 10.11,
+      "learning_rate": 0.0002676597460189478,
+      "loss": 0.2461,
+      "step": 11200
+    },
+    {
+      "epoch": 10.11,
+      "eval_loss": 0.18136142194271088,
+      "eval_runtime": 202.9746,
+      "eval_samples_per_second": 19.495,
+      "eval_steps_per_second": 2.439,
+      "eval_wer": 0.23083912906720722,
+      "step": 11200
+    },
+    {
+      "epoch": 10.47,
+      "learning_rate": 0.0002664533360209635,
+      "loss": 0.2354,
+      "step": 11600
+    },
+    {
+      "epoch": 10.47,
+      "eval_loss": 0.17660640180110931,
+      "eval_runtime": 202.5754,
+      "eval_samples_per_second": 19.533,
+      "eval_steps_per_second": 2.444,
+      "eval_wer": 0.21902631670918812,
+      "step": 11600
+    },
+    {
+      "epoch": 10.83,
+      "learning_rate": 0.00026524390243902435,
+      "loss": 0.2271,
+      "step": 12000
+    },
+    {
+      "epoch": 10.83,
+      "eval_loss": 0.16712866723537445,
+      "eval_runtime": 204.6252,
+      "eval_samples_per_second": 19.338,
+      "eval_steps_per_second": 2.419,
+      "eval_wer": 0.22643553629469124,
+      "step": 12000
+    },
+    {
+      "epoch": 11.19,
+      "learning_rate": 0.0002640344688570853,
+      "loss": 0.2262,
+      "step": 12400
+    },
+    {
+      "epoch": 11.19,
+      "eval_loss": 0.16640537977218628,
+      "eval_runtime": 205.9457,
+      "eval_samples_per_second": 19.214,
+      "eval_steps_per_second": 2.404,
+      "eval_wer": 0.2237444518225981,
+      "step": 12400
+    },
+    {
+      "epoch": 11.55,
+      "learning_rate": 0.0002628250352751461,
+      "loss": 0.222,
+      "step": 12800
+    },
+    {
+      "epoch": 11.55,
+      "eval_loss": 0.16319511830806732,
+      "eval_runtime": 203.9378,
+      "eval_samples_per_second": 19.403,
+      "eval_steps_per_second": 2.427,
+      "eval_wer": 0.20773774158599237,
+      "step": 12800
+    },
+    {
+      "epoch": 11.91,
+      "learning_rate": 0.000261615601693207,
+      "loss": 0.2254,
+      "step": 13200
+    },
+    {
+      "epoch": 11.91,
+      "eval_loss": 0.16412602365016937,
+      "eval_runtime": 203.9337,
+      "eval_samples_per_second": 19.403,
+      "eval_steps_per_second": 2.427,
+      "eval_wer": 0.21906126585817634,
+      "step": 13200
+    },
+    {
+      "epoch": 12.27,
+      "learning_rate": 0.0002604061681112679,
+      "loss": 0.2198,
+      "step": 13600
+    },
+    {
+      "epoch": 12.27,
+      "eval_loss": 0.16197219491004944,
+      "eval_runtime": 202.2546,
+      "eval_samples_per_second": 19.564,
+      "eval_steps_per_second": 2.447,
+      "eval_wer": 0.2122112326564848,
+      "step": 13600
+    },
+    {
+      "epoch": 12.63,
+      "learning_rate": 0.00025919673452932875,
+      "loss": 0.2167,
+      "step": 14000
+    },
+    {
+      "epoch": 12.63,
+      "eval_loss": 0.15757694840431213,
+      "eval_runtime": 202.2278,
+      "eval_samples_per_second": 19.567,
+      "eval_steps_per_second": 2.448,
+      "eval_wer": 0.2082270296718275,
+      "step": 14000
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 0.0002579903245313445,
+      "loss": 0.2138,
+      "step": 14400
+    },
+    {
+      "epoch": 13.0,
+      "eval_loss": 0.16401419043540955,
+      "eval_runtime": 202.7059,
+      "eval_samples_per_second": 19.521,
+      "eval_steps_per_second": 2.442,
+      "eval_wer": 0.2156711984063188,
+      "step": 14400
+    },
+    {
+      "epoch": 13.36,
+      "learning_rate": 0.0002567808909494053,
+      "loss": 0.2112,
+      "step": 14800
+    },
+    {
+      "epoch": 13.36,
+      "eval_loss": 0.17054887115955353,
+      "eval_runtime": 203.4699,
+      "eval_samples_per_second": 19.448,
+      "eval_steps_per_second": 2.433,
+      "eval_wer": 0.21696431691888302,
+      "step": 14800
+    },
+    {
+      "epoch": 13.72,
+      "learning_rate": 0.00025557145736746623,
+      "loss": 0.2038,
+      "step": 15200
+    },
+    {
+      "epoch": 13.72,
+      "eval_loss": 0.1620979905128479,
+      "eval_runtime": 203.3439,
+      "eval_samples_per_second": 19.46,
+      "eval_steps_per_second": 2.434,
+      "eval_wer": 0.2075979449900395,
+      "step": 15200
+    },
+    {
+      "epoch": 14.08,
+      "learning_rate": 0.0002543620237855271,
+      "loss": 0.2101,
+      "step": 15600
+    },
+    {
+      "epoch": 14.08,
+      "eval_loss": 0.16726231575012207,
+      "eval_runtime": 203.5727,
+      "eval_samples_per_second": 19.438,
+      "eval_steps_per_second": 2.432,
+      "eval_wer": 0.19962953902072483,
+      "step": 15600
+    },
+    {
+      "epoch": 14.44,
+      "learning_rate": 0.00025315259020358797,
+      "loss": 0.2013,
+      "step": 16000
+    },
+    {
+      "epoch": 14.44,
+      "eval_loss": 0.16415779292583466,
+      "eval_runtime": 202.8281,
+      "eval_samples_per_second": 19.509,
+      "eval_steps_per_second": 2.44,
+      "eval_wer": 0.20885611435361548,
+      "step": 16000
+    },
+    {
+      "epoch": 14.8,
+      "learning_rate": 0.00025194315662164883,
+      "loss": 0.21,
+      "step": 16400
+    },
+    {
+      "epoch": 14.8,
+      "eval_loss": 0.1616578996181488,
+      "eval_runtime": 203.1464,
+      "eval_samples_per_second": 19.479,
+      "eval_steps_per_second": 2.437,
+      "eval_wer": 0.2186768252193059,
+      "step": 16400
+    },
+    {
+      "epoch": 15.16,
+      "learning_rate": 0.0002507337230397097,
+      "loss": 0.2002,
+      "step": 16800
+    },
+    {
+      "epoch": 15.16,
+      "eval_loss": 0.1627209484577179,
+      "eval_runtime": 202.7336,
+      "eval_samples_per_second": 19.518,
+      "eval_steps_per_second": 2.442,
+      "eval_wer": 0.21839723202740013,
+      "step": 16800
+    },
+    {
+      "epoch": 15.52,
+      "learning_rate": 0.00024952428945777057,
+      "loss": 0.2007,
+      "step": 17200
+    },
+    {
+      "epoch": 15.52,
+      "eval_loss": 0.1601659506559372,
+      "eval_runtime": 202.199,
+      "eval_samples_per_second": 19.57,
+      "eval_steps_per_second": 2.448,
+      "eval_wer": 0.20924055499248592,
+      "step": 17200
+    },
+    {
+      "epoch": 15.88,
+      "learning_rate": 0.0002483178794597863,
+      "loss": 0.2042,
+      "step": 17600
+    },
+    {
+      "epoch": 15.88,
+      "eval_loss": 0.15520912408828735,
+      "eval_runtime": 202.5397,
+      "eval_samples_per_second": 19.537,
+      "eval_steps_per_second": 2.444,
+      "eval_wer": 0.1952958445461853,
+      "step": 17600
+    },
+    {
+      "epoch": 16.25,
+      "learning_rate": 0.0002471084458778472,
+      "loss": 0.187,
+      "step": 18000
+    },
+    {
+      "epoch": 16.25,
+      "eval_loss": 0.16360661387443542,
+      "eval_runtime": 202.7459,
+      "eval_samples_per_second": 19.517,
+      "eval_steps_per_second": 2.441,
+      "eval_wer": 0.19442211582147975,
+      "step": 18000
+    },
+    {
+      "epoch": 16.61,
+      "learning_rate": 0.00024589901229590805,
+      "loss": 0.1931,
+      "step": 18400
+    },
+    {
+      "epoch": 16.61,
+      "eval_loss": 0.1533084213733673,
+      "eval_runtime": 203.0495,
+      "eval_samples_per_second": 19.488,
+      "eval_steps_per_second": 2.438,
+      "eval_wer": 0.1916960822003984,
+      "step": 18400
+    },
+    {
+      "epoch": 16.97,
+      "learning_rate": 0.000244689578713969,
+      "loss": 0.1891,
+      "step": 18800
+    },
+    {
+      "epoch": 16.97,
+      "eval_loss": 0.16208086907863617,
+      "eval_runtime": 202.8946,
+      "eval_samples_per_second": 19.503,
+      "eval_steps_per_second": 2.44,
+      "eval_wer": 0.1907175060287282,
+      "step": 18800
+    },
+    {
+      "epoch": 17.33,
+      "learning_rate": 0.00024348014513202981,
+      "loss": 0.1863,
+      "step": 19200
+    },
+    {
+      "epoch": 17.33,
+      "eval_loss": 0.15993733704090118,
+      "eval_runtime": 202.8467,
+      "eval_samples_per_second": 19.507,
+      "eval_steps_per_second": 2.44,
+      "eval_wer": 0.1905777094327753,
+      "step": 19200
+    },
+    {
+      "epoch": 17.69,
+      "learning_rate": 0.00024227071155009068,
+      "loss": 0.1863,
+      "step": 19600
+    },
+    {
+      "epoch": 17.69,
+      "eval_loss": 0.15354220569133759,
+      "eval_runtime": 202.9873,
+      "eval_samples_per_second": 19.494,
+      "eval_steps_per_second": 2.439,
+      "eval_wer": 0.1911718449655751,
+      "step": 19600
+    },
+    {
+      "epoch": 18.05,
+      "learning_rate": 0.00024106127796815155,
+      "loss": 0.1827,
+      "step": 20000
+    },
+    {
+      "epoch": 18.05,
+      "eval_loss": 0.1616511195898056,
+      "eval_runtime": 204.4003,
+      "eval_samples_per_second": 19.359,
+      "eval_steps_per_second": 2.422,
+      "eval_wer": 0.1880264215566351,
+      "step": 20000
+    },
+    {
+      "epoch": 18.41,
+      "learning_rate": 0.00023985184438621244,
+      "loss": 0.1822,
+      "step": 20400
+    },
+    {
+      "epoch": 18.41,
+      "eval_loss": 0.1649104207754135,
+      "eval_runtime": 206.8059,
+      "eval_samples_per_second": 19.134,
+      "eval_steps_per_second": 2.394,
+      "eval_wer": 0.18806137070562332,
+      "step": 20400
+    },
+    {
+      "epoch": 18.77,
+      "learning_rate": 0.0002386424108042733,
+      "loss": 0.1841,
+      "step": 20800
+    },
+    {
+      "epoch": 18.77,
+      "eval_loss": 0.16039612889289856,
+      "eval_runtime": 204.0742,
+      "eval_samples_per_second": 19.39,
+      "eval_steps_per_second": 2.426,
+      "eval_wer": 0.18942438751616397,
+      "step": 20800
+    },
+    {
+      "epoch": 19.13,
+      "learning_rate": 0.00023743297722233418,
+      "loss": 0.1817,
+      "step": 21200
+    },
+    {
+      "epoch": 19.13,
+      "eval_loss": 0.157293900847435,
+      "eval_runtime": 202.3143,
+      "eval_samples_per_second": 19.559,
+      "eval_steps_per_second": 2.447,
+      "eval_wer": 0.1810715409079789,
+      "step": 21200
+    },
+    {
+      "epoch": 19.49,
+      "learning_rate": 0.00023622959080830475,
+      "loss": 0.1756,
+      "step": 21600
+    },
+    {
+      "epoch": 19.49,
+      "eval_loss": 0.16328036785125732,
+      "eval_runtime": 204.2348,
+      "eval_samples_per_second": 19.375,
+      "eval_steps_per_second": 2.424,
+      "eval_wer": 0.18809631985461153,
+      "step": 21600
+    },
+    {
+      "epoch": 19.86,
+      "learning_rate": 0.00023502015722636564,
+      "loss": 0.1804,
+      "step": 22000
+    },
+    {
+      "epoch": 19.86,
+      "eval_loss": 0.1585751324892044,
+      "eval_runtime": 204.9615,
+      "eval_samples_per_second": 19.306,
+      "eval_steps_per_second": 2.415,
+      "eval_wer": 0.18823611645056443,
+      "step": 22000
+    },
+    {
+      "epoch": 20.22,
+      "learning_rate": 0.0002338107236444265,
+      "loss": 0.1736,
+      "step": 22400
+    },
+    {
+      "epoch": 20.22,
+      "eval_loss": 0.15415678918361664,
+      "eval_runtime": 202.4017,
+      "eval_samples_per_second": 19.55,
+      "eval_steps_per_second": 2.446,
+      "eval_wer": 0.19033306538985775,
+      "step": 22400
+    },
+    {
+      "epoch": 20.58,
+      "learning_rate": 0.00023260129006248738,
+      "loss": 0.1704,
+      "step": 22800
+    },
+    {
+      "epoch": 20.58,
+      "eval_loss": 0.1622617095708847,
+      "eval_runtime": 206.2682,
+      "eval_samples_per_second": 19.184,
+      "eval_steps_per_second": 2.4,
+      "eval_wer": 0.1983014713591724,
+      "step": 22800
+    },
+    {
+      "epoch": 20.94,
+      "learning_rate": 0.00023139185648054828,
+      "loss": 0.1741,
+      "step": 23200
+    },
+    {
+      "epoch": 20.94,
+      "eval_loss": 0.15422095358371735,
+      "eval_runtime": 208.5273,
+      "eval_samples_per_second": 18.976,
+      "eval_steps_per_second": 2.374,
+      "eval_wer": 0.19568028518505573,
+      "step": 23200
+    },
+    {
+      "epoch": 21.3,
+      "learning_rate": 0.00023018242289860912,
+      "loss": 0.1642,
+      "step": 23600
+    },
+    {
+      "epoch": 21.3,
+      "eval_loss": 0.155488982796669,
+      "eval_runtime": 206.3858,
+      "eval_samples_per_second": 19.173,
+      "eval_steps_per_second": 2.398,
+      "eval_wer": 0.19704330199559641,
+      "step": 23600
+    },
+    {
+      "epoch": 21.66,
+      "learning_rate": 0.00022897601290062486,
+      "loss": 0.1707,
+      "step": 24000
+    },
+    {
+      "epoch": 21.66,
+      "eval_loss": 0.15275663137435913,
+      "eval_runtime": 206.6413,
+      "eval_samples_per_second": 19.149,
+      "eval_steps_per_second": 2.395,
+      "eval_wer": 0.18442665921084822,
+      "step": 24000
+    },
+    {
+      "epoch": 22.02,
+      "learning_rate": 0.00022776657931868573,
+      "loss": 0.1673,
+      "step": 24400
+    },
+    {
+      "epoch": 22.02,
+      "eval_loss": 0.15888585150241852,
+      "eval_runtime": 208.9307,
+      "eval_samples_per_second": 18.939,
+      "eval_steps_per_second": 2.369,
+      "eval_wer": 0.1858246251703771,
+      "step": 24400
+    },
+    {
+      "epoch": 22.38,
+      "learning_rate": 0.0002265571457367466,
+      "loss": 0.1593,
+      "step": 24800
+    },
+    {
+      "epoch": 22.38,
+      "eval_loss": 0.15319041907787323,
+      "eval_runtime": 206.6808,
+      "eval_samples_per_second": 19.145,
+      "eval_steps_per_second": 2.395,
+      "eval_wer": 0.17750672771118023,
+      "step": 24800
+    },
+    {
+      "epoch": 22.74,
+      "learning_rate": 0.0002253477121548075,
+      "loss": 0.1595,
+      "step": 25200
+    },
+    {
+      "epoch": 22.74,
+      "eval_loss": 0.15495522320270538,
+      "eval_runtime": 211.5152,
+      "eval_samples_per_second": 18.708,
+      "eval_steps_per_second": 2.34,
+      "eval_wer": 0.1755495753678398,
+      "step": 25200
+    },
+    {
+      "epoch": 23.1,
+      "learning_rate": 0.00022413827857286836,
+      "loss": 0.1598,
+      "step": 25600
+    },
+    {
+      "epoch": 23.1,
+      "eval_loss": 0.16047397255897522,
+      "eval_runtime": 213.237,
+      "eval_samples_per_second": 18.557,
+      "eval_steps_per_second": 2.321,
+      "eval_wer": 0.18624401495823575,
+      "step": 25600
+    },
+    {
+      "epoch": 23.47,
+      "learning_rate": 0.00022293186857488405,
+      "loss": 0.1573,
+      "step": 26000
+    },
+    {
+      "epoch": 23.47,
+      "eval_loss": 0.15952068567276,
+      "eval_runtime": 205.0554,
+      "eval_samples_per_second": 19.297,
+      "eval_steps_per_second": 2.414,
+      "eval_wer": 0.17796106664802713,
+      "step": 26000
+    },
+    {
+      "epoch": 23.83,
+      "learning_rate": 0.00022172243499294495,
+      "loss": 0.1596,
+      "step": 26400
+    },
+    {
+      "epoch": 23.83,
+      "eval_loss": 0.15038904547691345,
+      "eval_runtime": 203.7621,
+      "eval_samples_per_second": 19.42,
+      "eval_steps_per_second": 2.429,
+      "eval_wer": 0.17879984622374445,
+      "step": 26400
+    },
+    {
+      "epoch": 24.19,
+      "learning_rate": 0.00022051300141100584,
+      "loss": 0.1589,
+      "step": 26800
+    },
+    {
+      "epoch": 24.19,
+      "eval_loss": 0.15989159047603607,
+      "eval_runtime": 202.8293,
+      "eval_samples_per_second": 19.509,
+      "eval_steps_per_second": 2.44,
+      "eval_wer": 0.17677279558242756,
+      "step": 26800
+    },
+    {
+      "epoch": 24.55,
+      "learning_rate": 0.00021930356782906668,
+      "loss": 0.1551,
+      "step": 27200
+    },
+    {
+      "epoch": 24.55,
+      "eval_loss": 0.15309767425060272,
+      "eval_runtime": 203.5071,
+      "eval_samples_per_second": 19.444,
+      "eval_steps_per_second": 2.432,
+      "eval_wer": 0.1685946947191836,
+      "step": 27200
+    },
+    {
+      "epoch": 24.91,
+      "learning_rate": 0.00021809413424712758,
+      "loss": 0.1593,
+      "step": 27600
+    },
+    {
+      "epoch": 24.91,
+      "eval_loss": 0.1611892282962799,
+      "eval_runtime": 203.404,
+      "eval_samples_per_second": 19.454,
+      "eval_steps_per_second": 2.434,
+      "eval_wer": 0.181560828993814,
+      "step": 27600
+    },
+    {
+      "epoch": 25.27,
+      "learning_rate": 0.00021688470066518845,
+      "loss": 0.1519,
+      "step": 28000
+    },
+    {
+      "epoch": 25.27,
+      "eval_loss": 0.16373491287231445,
+      "eval_runtime": 203.251,
+      "eval_samples_per_second": 19.469,
+      "eval_steps_per_second": 2.435,
+      "eval_wer": 0.17638835494355712,
+      "step": 28000
+    },
+    {
+      "epoch": 25.63,
+      "learning_rate": 0.0002156752670832493,
+      "loss": 0.1509,
+      "step": 28400
+    },
+    {
+      "epoch": 25.63,
+      "eval_loss": 0.15399527549743652,
+      "eval_runtime": 203.0998,
+      "eval_samples_per_second": 19.483,
+      "eval_steps_per_second": 2.437,
+      "eval_wer": 0.17093628770139446,
+      "step": 28400
+    },
+    {
+      "epoch": 25.99,
+      "learning_rate": 0.0002144658335013102,
+      "loss": 0.1524,
+      "step": 28800
+    },
+    {
+      "epoch": 25.99,
+      "eval_loss": 0.1519121676683426,
+      "eval_runtime": 203.5041,
+      "eval_samples_per_second": 19.444,
+      "eval_steps_per_second": 2.432,
+      "eval_wer": 0.18072204941809666,
+      "step": 28800
+    },
+    {
+      "epoch": 26.35,
+      "learning_rate": 0.00021325639991937108,
+      "loss": 0.1452,
+      "step": 29200
+    },
+    {
+      "epoch": 26.35,
+      "eval_loss": 0.15314562618732452,
+      "eval_runtime": 203.4098,
+      "eval_samples_per_second": 19.453,
+      "eval_steps_per_second": 2.434,
+      "eval_wer": 0.17310313493866425,
+      "step": 29200
+    },
+    {
+      "epoch": 26.71,
+      "learning_rate": 0.0002120499899213868,
+      "loss": 0.1485,
+      "step": 29600
+    },
+    {
+      "epoch": 26.71,
+      "eval_loss": 0.14827923476696014,
+      "eval_runtime": 203.2718,
+      "eval_samples_per_second": 19.467,
+      "eval_steps_per_second": 2.435,
+      "eval_wer": 0.16136022087862162,
+      "step": 29600
+    },
+    {
+      "epoch": 27.08,
+      "learning_rate": 0.0002108405563394477,
+      "loss": 0.1513,
+      "step": 30000
+    },
+    {
+      "epoch": 27.08,
+      "eval_loss": 0.15502476692199707,
+      "eval_runtime": 203.5744,
+      "eval_samples_per_second": 19.438,
+      "eval_steps_per_second": 2.432,
+      "eval_wer": 0.16579876280012582,
+      "step": 30000
+    },
+    {
+      "epoch": 27.44,
+      "learning_rate": 0.00020963112275750853,
+      "loss": 0.1437,
+      "step": 30400
+    },
+    {
+      "epoch": 27.44,
+      "eval_loss": 0.15631796419620514,
+      "eval_runtime": 204.0627,
+      "eval_samples_per_second": 19.391,
+      "eval_steps_per_second": 2.426,
+      "eval_wer": 0.16614825429000804,
+      "step": 30400
+    },
+    {
+      "epoch": 27.8,
+      "learning_rate": 0.00020842168917556943,
+      "loss": 0.1445,
+      "step": 30800
+    },
+    {
+      "epoch": 27.8,
+      "eval_loss": 0.15840862691402435,
+      "eval_runtime": 204.5713,
+      "eval_samples_per_second": 19.343,
+      "eval_steps_per_second": 2.42,
+      "eval_wer": 0.17086638940341803,
+      "step": 30800
+    },
+    {
+      "epoch": 28.16,
+      "learning_rate": 0.0002072122555936303,
+      "loss": 0.1438,
+      "step": 31200
+    },
+    {
+      "epoch": 28.16,
+      "eval_loss": 0.15680429339408875,
+      "eval_runtime": 204.0022,
+      "eval_samples_per_second": 19.397,
+      "eval_steps_per_second": 2.426,
+      "eval_wer": 0.1630727291790445,
+      "step": 31200
+    },
+    {
+      "epoch": 28.52,
+      "learning_rate": 0.00020600282201169116,
+      "loss": 0.1423,
+      "step": 31600
+    },
+    {
+      "epoch": 28.52,
+      "eval_loss": 0.15523846447467804,
+      "eval_runtime": 203.5692,
+      "eval_samples_per_second": 19.438,
+      "eval_steps_per_second": 2.432,
+      "eval_wer": 0.16090588194177471,
+      "step": 31600
+    },
+    {
+      "epoch": 28.88,
+      "learning_rate": 0.00020479338842975206,
+      "loss": 0.1451,
+      "step": 32000
+    },
+    {
+      "epoch": 28.88,
+      "eval_loss": 0.1542510688304901,
+      "eval_runtime": 203.7413,
+      "eval_samples_per_second": 19.422,
+      "eval_steps_per_second": 2.43,
+      "eval_wer": 0.16314262747702094,
+      "step": 32000
+    },
+    {
+      "epoch": 29.24,
+      "learning_rate": 0.00020358395484781292,
+      "loss": 0.1396,
+      "step": 32400
+    },
+    {
+      "epoch": 29.24,
+      "eval_loss": 0.15091465413570404,
+      "eval_runtime": 203.6781,
+      "eval_samples_per_second": 19.428,
+      "eval_steps_per_second": 2.43,
+      "eval_wer": 0.16317757662600915,
+      "step": 32400
+    },
+    {
+      "epoch": 29.6,
+      "learning_rate": 0.0002023745212658738,
+      "loss": 0.142,
+      "step": 32800
+    },
+    {
+      "epoch": 29.6,
+      "eval_loss": 0.15581683814525604,
+      "eval_runtime": 203.4725,
+      "eval_samples_per_second": 19.447,
+      "eval_steps_per_second": 2.433,
+      "eval_wer": 0.1635620172648796,
+      "step": 32800
+    },
+    {
+      "epoch": 29.96,
+      "learning_rate": 0.0002011650876839347,
+      "loss": 0.1385,
+      "step": 33200
+    },
+    {
+      "epoch": 29.96,
+      "eval_loss": 0.145892933011055,
+      "eval_runtime": 203.8769,
+      "eval_samples_per_second": 19.409,
+      "eval_steps_per_second": 2.428,
+      "eval_wer": 0.17338272813057,
+      "step": 33200
+    },
+    {
+      "epoch": 30.32,
+      "learning_rate": 0.00019995565410199556,
+      "loss": 0.1376,
+      "step": 33600
+    },
+    {
+      "epoch": 30.32,
+      "eval_loss": 0.15049244463443756,
+      "eval_runtime": 203.9232,
+      "eval_samples_per_second": 19.404,
+      "eval_steps_per_second": 2.427,
+      "eval_wer": 0.17236920280991158,
+      "step": 33600
+    },
+    {
+      "epoch": 30.69,
+      "learning_rate": 0.00019874924410401127,
+      "loss": 0.1399,
+      "step": 34000
+    },
+    {
+      "epoch": 30.69,
+      "eval_loss": 0.14067970216274261,
+      "eval_runtime": 203.8686,
+      "eval_samples_per_second": 19.41,
+      "eval_steps_per_second": 2.428,
+      "eval_wer": 0.1610107293887394,
+      "step": 34000
+    },
+    {
+      "epoch": 31.05,
+      "learning_rate": 0.00019753981052207217,
+      "loss": 0.1377,
+      "step": 34400
+    },
+    {
+      "epoch": 31.05,
+      "eval_loss": 0.1523168534040451,
+      "eval_runtime": 203.6263,
+      "eval_samples_per_second": 19.433,
+      "eval_steps_per_second": 2.431,
+      "eval_wer": 0.17292838919372314,
+      "step": 34400
+    },
+    {
+      "epoch": 31.41,
+      "learning_rate": 0.000196330376940133,
+      "loss": 0.1331,
+      "step": 34800
+    },
+    {
+      "epoch": 31.41,
+      "eval_loss": 0.14309507608413696,
+      "eval_runtime": 204.8423,
+      "eval_samples_per_second": 19.317,
+      "eval_steps_per_second": 2.416,
+      "eval_wer": 0.1706566945094887,
+      "step": 34800
+    },
+    {
+      "epoch": 31.77,
+      "learning_rate": 0.0001951209433581939,
+      "loss": 0.1356,
+      "step": 35200
+    },
+    {
+      "epoch": 31.77,
+      "eval_loss": 0.1558520793914795,
+      "eval_runtime": 204.495,
+      "eval_samples_per_second": 19.35,
+      "eval_steps_per_second": 2.421,
+      "eval_wer": 0.16391150875476182,
+      "step": 35200
+    },
+    {
+      "epoch": 32.13,
+      "learning_rate": 0.00019391150977625477,
+      "loss": 0.1381,
+      "step": 35600
+    },
+    {
+      "epoch": 32.13,
+      "eval_loss": 0.14920052886009216,
+      "eval_runtime": 204.3124,
+      "eval_samples_per_second": 19.367,
+      "eval_steps_per_second": 2.423,
+      "eval_wer": 0.1660783559920316,
+      "step": 35600
+    },
+    {
+      "epoch": 32.49,
+      "learning_rate": 0.00019270207619431564,
+      "loss": 0.1332,
+      "step": 36000
+    },
+    {
+      "epoch": 32.49,
+      "eval_loss": 0.15177668631076813,
+      "eval_runtime": 204.8291,
+      "eval_samples_per_second": 19.319,
+      "eval_steps_per_second": 2.417,
+      "eval_wer": 0.16139517002760984,
+      "step": 36000
+    },
+    {
+      "epoch": 32.85,
+      "learning_rate": 0.00019149264261237654,
+      "loss": 0.1345,
+      "step": 36400
+    },
+    {
+      "epoch": 32.85,
+      "eval_loss": 0.14764094352722168,
+      "eval_runtime": 204.5031,
+      "eval_samples_per_second": 19.349,
+      "eval_steps_per_second": 2.421,
+      "eval_wer": 0.1562925942753294,
+      "step": 36400
+    },
+    {
+      "epoch": 33.21,
+      "learning_rate": 0.00019028320903043738,
+      "loss": 0.1307,
+      "step": 36800
+    },
+    {
+      "epoch": 33.21,
+      "eval_loss": 0.1433647871017456,
+      "eval_runtime": 205.0597,
+      "eval_samples_per_second": 19.297,
+      "eval_steps_per_second": 2.414,
+      "eval_wer": 0.15922832279034005,
+      "step": 36800
+    },
+    {
+      "epoch": 33.57,
+      "learning_rate": 0.00018907679903245312,
+      "loss": 0.1309,
+      "step": 37200
+    },
+    {
+      "epoch": 33.57,
+      "eval_loss": 0.1497233361005783,
+      "eval_runtime": 204.4523,
+      "eval_samples_per_second": 19.354,
+      "eval_steps_per_second": 2.421,
+      "eval_wer": 0.17090133855240625,
+      "step": 37200
+    },
+    {
+      "epoch": 33.93,
+      "learning_rate": 0.00018786736545051402,
+      "loss": 0.1319,
+      "step": 37600
+    },
+    {
+      "epoch": 33.93,
+      "eval_loss": 0.15207722783088684,
+      "eval_runtime": 204.6556,
+      "eval_samples_per_second": 19.335,
+      "eval_steps_per_second": 2.419,
+      "eval_wer": 0.1708314402544298,
+      "step": 37600
+    },
+    {
+      "epoch": 34.3,
+      "learning_rate": 0.00018665793186857486,
+      "loss": 0.1279,
+      "step": 38000
+    },
+    {
+      "epoch": 34.3,
+      "eval_loss": 0.14533580839633942,
+      "eval_runtime": 205.2587,
+      "eval_samples_per_second": 19.278,
+      "eval_steps_per_second": 2.412,
+      "eval_wer": 0.1569566281061056,
+      "step": 38000
+    },
+    {
+      "epoch": 34.66,
+      "learning_rate": 0.00018544849828663575,
+      "loss": 0.1268,
+      "step": 38400
+    },
+    {
+      "epoch": 34.66,
+      "eval_loss": 0.14409175515174866,
+      "eval_runtime": 204.8962,
+      "eval_samples_per_second": 19.312,
+      "eval_steps_per_second": 2.416,
+      "eval_wer": 0.1608709327927865,
+      "step": 38400
+    },
+    {
+      "epoch": 35.02,
+      "learning_rate": 0.0001842390647046966,
+      "loss": 0.1301,
+      "step": 38800
+    },
+    {
+      "epoch": 35.02,
+      "eval_loss": 0.1421143114566803,
+      "eval_runtime": 205.2147,
+      "eval_samples_per_second": 19.282,
+      "eval_steps_per_second": 2.412,
+      "eval_wer": 0.1567818823611645,
+      "step": 38800
+    },
+    {
+      "epoch": 35.38,
+      "learning_rate": 0.0001830296311227575,
+      "loss": 0.1248,
+      "step": 39200
+    },
+    {
+      "epoch": 35.38,
+      "eval_loss": 0.14348700642585754,
+      "eval_runtime": 209.2746,
+      "eval_samples_per_second": 18.908,
+      "eval_steps_per_second": 2.365,
+      "eval_wer": 0.15727117044699962,
+      "step": 39200
+    },
+    {
+      "epoch": 35.74,
+      "learning_rate": 0.00018182322112477323,
+      "loss": 0.1256,
+      "step": 39600
+    },
+    {
+      "epoch": 35.74,
+      "eval_loss": 0.14100748300552368,
+      "eval_runtime": 214.9156,
+      "eval_samples_per_second": 18.412,
+      "eval_steps_per_second": 2.303,
+      "eval_wer": 0.1528326285254954,
+      "step": 39600
+    }
+  ],
+  "max_steps": 99720,
+  "num_train_epochs": 90,
+  "total_flos": 1.728945548938538e+20,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a14684982016a59a1ac5f3e95d14e445c0af8431dab5efc04d3bde3ec2b1ae6e
+size 2799

vocab.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"a": 1, "b": 2, "c": 3, "d": 4, "e": 5, "f": 6, "g": 7, "h": 8, "i": 9, "j": 10, "k": 11, "l": 12, "m": 13, "n": 14, "o": 15, "p": 16, "q": 17, "r": 18, "s": 19, "t": 20, "u": 21, "v": 22, "w": 23, "x": 24, "y": 25, "z": 26, "\u00e7": 27, "\u00eb": 28, "\u00f6": 29, "\u00fc": 30, "\u011f": 31, "\u0131": 32, "\u015f": 33, "\u0307": 34, "\|": 0, "[UNK]": 35, "[PAD]": 36}