End of training

Browse files

Files changed (6) hide show

README.md +3 -1
all_results.json +10 -10
eval_results.json +5 -5
runs/May16_06-09-07_2e698a9c250f/events.out.tfevents.1715843587.2e698a9c250f.30.1 +3 -0
train_results.json +5 -5
trainer_state.json +139 -139

README.md CHANGED Viewed

@@ -2,6 +2,8 @@
 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
 - generated_from_trainer
 metrics:
 - wer
@@ -15,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-xlsr-53-ft-btb-cy
-This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.4584
 - Wer: 0.3783

 license: apache-2.0
 base_model: facebook/wav2vec2-large-xlsr-53
 tags:
+- automatic-speech-recognition
+- DewiBrynJones/banc-trawsgrifiadau-bangor-normalized
 - generated_from_trainer
 metrics:
 - wer
 # wav2vec2-xlsr-53-ft-btb-cy
+This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on the DEWIBRYNJONES/BANC-TRAWSGRIFIADAU-BANGOR-NORMALIZED - DEFAULT dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.4584
 - Wer: 0.3783

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
     "epoch": 3.536067892503536,
-    "eval_loss": 0.3846580684185028,
-    "eval_runtime": 154.4496,
     "eval_samples": 5656,
-    "eval_samples_per_second": 36.62,
-    "eval_steps_per_second": 4.578,
-    "eval_wer": 0.29666778646958136,
-    "total_flos": 9.55129266706546e+18,
-    "train_loss": 1.1546670959472656,
-    "train_runtime": 6557.446,
     "train_samples": 22621,
-    "train_samples_per_second": 12.2,
-    "train_steps_per_second": 0.381
 }

 {
     "epoch": 3.536067892503536,
+    "eval_loss": 0.4583967626094818,
+    "eval_runtime": 161.895,
     "eval_samples": 5656,
+    "eval_samples_per_second": 34.936,
+    "eval_steps_per_second": 4.367,
+    "eval_wer": 0.37831418116453747,
+    "total_flos": 9.55169606524761e+18,
+    "train_loss": 1.2462444946289062,
+    "train_runtime": 6962.0027,
     "train_samples": 22621,
+    "train_samples_per_second": 11.491,
+    "train_steps_per_second": 0.359
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 3.536067892503536,
-    "eval_loss": 0.3846580684185028,
-    "eval_runtime": 154.4496,
     "eval_samples": 5656,
-    "eval_samples_per_second": 36.62,
-    "eval_steps_per_second": 4.578,
-    "eval_wer": 0.29666778646958136
 }

 {
     "epoch": 3.536067892503536,
+    "eval_loss": 0.4583967626094818,
+    "eval_runtime": 161.895,
     "eval_samples": 5656,
+    "eval_samples_per_second": 34.936,
+    "eval_steps_per_second": 4.367,
+    "eval_wer": 0.37831418116453747
 }

runs/May16_06-09-07_2e698a9c250f/events.out.tfevents.1715843587.2e698a9c250f.30.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32c4642ec71be603384ad46b87e0e3c3860701786fba15088a457e4b1eda138a
+size 406

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 3.536067892503536,
-    "total_flos": 9.55129266706546e+18,
-    "train_loss": 1.1546670959472656,
-    "train_runtime": 6557.446,
     "train_samples": 22621,
-    "train_samples_per_second": 12.2,
-    "train_steps_per_second": 0.381
 }

 {
     "epoch": 3.536067892503536,
+    "total_flos": 9.55169606524761e+18,
+    "train_loss": 1.2462444946289062,
+    "train_runtime": 6962.0027,
     "train_samples": 22621,
+    "train_samples_per_second": 11.491,
+    "train_steps_per_second": 0.359
 }

trainer_state.json CHANGED Viewed

@@ -10,272 +10,272 @@
   "log_history": [
     {
       "epoch": 0.14144271570014144,
-      "eval_loss": 3.7463672161102295,
-      "eval_runtime": 153.5435,
-      "eval_samples_per_second": 36.836,
-      "eval_steps_per_second": 4.605,
       "eval_wer": 1.0,
       "step": 100
     },
     {
       "epoch": 0.2828854314002829,
-      "eval_loss": 2.9399216175079346,
-      "eval_runtime": 150.7703,
-      "eval_samples_per_second": 37.514,
-      "eval_steps_per_second": 4.689,
       "eval_wer": 1.0,
       "step": 200
     },
     {
       "epoch": 0.4243281471004243,
-      "eval_loss": 2.5961458683013916,
-      "eval_runtime": 151.4236,
-      "eval_samples_per_second": 37.352,
-      "eval_steps_per_second": 4.669,
-      "eval_wer": 0.9991041576682503,
       "step": 300
     },
     {
       "epoch": 0.5657708628005658,
-      "eval_loss": 1.1618728637695312,
-      "eval_runtime": 152.5862,
-      "eval_samples_per_second": 37.068,
-      "eval_steps_per_second": 4.633,
-      "eval_wer": 0.7905328662155461,
       "step": 400
     },
     {
       "epoch": 0.7072135785007072,
-      "grad_norm": 1.7047498226165771,
       "learning_rate": 0.00029699999999999996,
-      "loss": 3.5448,
       "step": 500
     },
     {
       "epoch": 0.7072135785007072,
-      "eval_loss": 0.946560800075531,
-      "eval_runtime": 153.1427,
-      "eval_samples_per_second": 36.933,
-      "eval_steps_per_second": 4.617,
-      "eval_wer": 0.6897506038937147,
       "step": 500
     },
     {
       "epoch": 0.8486562942008486,
-      "eval_loss": 0.7894724607467651,
-      "eval_runtime": 151.7162,
-      "eval_samples_per_second": 37.28,
-      "eval_steps_per_second": 4.66,
-      "eval_wer": 0.6110604533602086,
       "step": 600
     },
     {
       "epoch": 0.9900990099009901,
-      "eval_loss": 0.6820164918899536,
-      "eval_runtime": 152.0086,
-      "eval_samples_per_second": 37.208,
-      "eval_steps_per_second": 4.651,
-      "eval_wer": 0.5378893314776599,
       "step": 700
     },
     {
       "epoch": 1.1315417256011315,
-      "eval_loss": 0.6039016842842102,
-      "eval_runtime": 152.002,
-      "eval_samples_per_second": 37.21,
-      "eval_steps_per_second": 4.651,
-      "eval_wer": 0.47239685815296506,
       "step": 800
     },
     {
       "epoch": 1.272984441301273,
-      "eval_loss": 0.5631398558616638,
-      "eval_runtime": 153.0321,
-      "eval_samples_per_second": 36.96,
-      "eval_steps_per_second": 4.62,
-      "eval_wer": 0.46745372814384667,
       "step": 900
     },
     {
       "epoch": 1.4144271570014144,
-      "grad_norm": 0.8790757656097412,
       "learning_rate": 0.00022574999999999996,
-      "loss": 0.7808,
       "step": 1000
     },
     {
       "epoch": 1.4144271570014144,
-      "eval_loss": 0.5279428958892822,
-      "eval_runtime": 152.9768,
-      "eval_samples_per_second": 36.973,
-      "eval_steps_per_second": 4.622,
-      "eval_wer": 0.4291084769080642,
       "step": 1000
     },
     {
       "epoch": 1.5558698727015559,
-      "eval_loss": 0.5024306178092957,
-      "eval_runtime": 152.8927,
-      "eval_samples_per_second": 36.993,
-      "eval_steps_per_second": 4.624,
-      "eval_wer": 0.39940170529986724,
       "step": 1100
     },
     {
       "epoch": 1.6973125884016973,
-      "eval_loss": 0.4894837439060211,
-      "eval_runtime": 153.3103,
-      "eval_samples_per_second": 36.892,
-      "eval_steps_per_second": 4.612,
-      "eval_wer": 0.3894514565436483,
       "step": 1200
     },
     {
       "epoch": 1.8387553041018387,
-      "eval_loss": 0.4595918357372284,
-      "eval_runtime": 153.0651,
-      "eval_samples_per_second": 36.952,
-      "eval_steps_per_second": 4.619,
-      "eval_wer": 0.3695829534002016,
       "step": 1300
     },
     {
       "epoch": 1.9801980198019802,
-      "eval_loss": 0.44729524850845337,
-      "eval_runtime": 154.1998,
-      "eval_samples_per_second": 36.68,
-      "eval_steps_per_second": 4.585,
-      "eval_wer": 0.3610884484330758,
       "step": 1400
     },
     {
       "epoch": 2.1216407355021216,
-      "grad_norm": 0.8205087184906006,
       "learning_rate": 0.0001512,
-      "loss": 0.6005,
       "step": 1500
     },
     {
       "epoch": 2.1216407355021216,
-      "eval_loss": 0.43324384093284607,
-      "eval_runtime": 150.9169,
-      "eval_samples_per_second": 37.478,
-      "eval_steps_per_second": 4.685,
-      "eval_wer": 0.3474268528738942,
       "step": 1500
     },
     {
       "epoch": 2.263083451202263,
-      "eval_loss": 0.4268616735935211,
-      "eval_runtime": 152.3911,
-      "eval_samples_per_second": 37.115,
-      "eval_steps_per_second": 4.639,
-      "eval_wer": 0.3418118411159636,
       "step": 1600
     },
     {
       "epoch": 2.4045261669024045,
-      "eval_loss": 0.4155045449733734,
-      "eval_runtime": 153.4832,
-      "eval_samples_per_second": 36.851,
-      "eval_steps_per_second": 4.606,
-      "eval_wer": 0.33606885188206875,
       "step": 1700
     },
     {
       "epoch": 2.545968882602546,
-      "eval_loss": 0.4121190905570984,
-      "eval_runtime": 153.7529,
-      "eval_samples_per_second": 36.786,
-      "eval_steps_per_second": 4.598,
-      "eval_wer": 0.32143142806865993,
       "step": 1800
     },
     {
       "epoch": 2.6874115983026874,
-      "eval_loss": 0.4145391285419464,
-      "eval_runtime": 159.3319,
-      "eval_samples_per_second": 35.498,
-      "eval_steps_per_second": 4.437,
-      "eval_wer": 0.3366447505239078,
       "step": 1900
     },
     {
       "epoch": 2.828854314002829,
-      "grad_norm": 0.8615767359733582,
       "learning_rate": 7.664999999999999e-05,
-      "loss": 0.4666,
       "step": 2000
     },
     {
       "epoch": 2.828854314002829,
-      "eval_loss": 0.39387884736061096,
-      "eval_runtime": 153.1343,
-      "eval_samples_per_second": 36.935,
-      "eval_steps_per_second": 4.617,
-      "eval_wer": 0.3114171905744589,
       "step": 2000
     },
     {
       "epoch": 2.9702970297029703,
-      "eval_loss": 0.38894009590148926,
-      "eval_runtime": 152.8789,
-      "eval_samples_per_second": 36.997,
-      "eval_steps_per_second": 4.625,
-      "eval_wer": 0.30807377901489336,
       "step": 2100
     },
     {
       "epoch": 3.1117397454031117,
-      "eval_loss": 0.3909347653388977,
-      "eval_runtime": 154.4919,
-      "eval_samples_per_second": 36.61,
-      "eval_steps_per_second": 4.576,
-      "eval_wer": 0.30644206619634945,
       "step": 2200
     },
     {
       "epoch": 3.253182461103253,
-      "eval_loss": 0.3874327838420868,
-      "eval_runtime": 153.3025,
-      "eval_samples_per_second": 36.894,
-      "eval_steps_per_second": 4.612,
-      "eval_wer": 0.3015469277407176,
       "step": 2300
     },
     {
       "epoch": 3.3946251768033946,
-      "eval_loss": 0.386868953704834,
-      "eval_runtime": 153.0443,
-      "eval_samples_per_second": 36.957,
-      "eval_steps_per_second": 4.62,
-      "eval_wer": 0.29833149365711636,
       "step": 2400
     },
     {
       "epoch": 3.536067892503536,
-      "grad_norm": 0.6678842902183533,
       "learning_rate": 1.9499999999999995e-06,
-      "loss": 0.3805,
       "step": 2500
     },
     {
       "epoch": 3.536067892503536,
-      "eval_loss": 0.3846580684185028,
-      "eval_runtime": 154.6331,
-      "eval_samples_per_second": 36.577,
-      "eval_steps_per_second": 4.572,
-      "eval_wer": 0.29666778646958136,
       "step": 2500
     },
     {
       "epoch": 3.536067892503536,
       "step": 2500,
-      "total_flos": 9.55129266706546e+18,
-      "train_loss": 1.1546670959472656,
-      "train_runtime": 6557.446,
-      "train_samples_per_second": 12.2,
-      "train_steps_per_second": 0.381
     }
   ],
   "logging_steps": 500,
@@ -283,7 +283,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 4,
   "save_steps": 400,
-  "total_flos": 9.55129266706546e+18,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "log_history": [
     {
       "epoch": 0.14144271570014144,
+      "eval_loss": 4.031618595123291,
+      "eval_runtime": 161.4756,
+      "eval_samples_per_second": 35.027,
+      "eval_steps_per_second": 4.378,
       "eval_wer": 1.0,
       "step": 100
     },
     {
       "epoch": 0.2828854314002829,
+      "eval_loss": 3.0548782348632812,
+      "eval_runtime": 158.3539,
+      "eval_samples_per_second": 35.717,
+      "eval_steps_per_second": 4.465,
       "eval_wer": 1.0,
       "step": 200
     },
     {
       "epoch": 0.4243281471004243,
+      "eval_loss": 2.5533947944641113,
+      "eval_runtime": 158.9465,
+      "eval_samples_per_second": 35.584,
+      "eval_steps_per_second": 4.448,
+      "eval_wer": 0.9862296976311228,
       "step": 300
     },
     {
       "epoch": 0.5657708628005658,
+      "eval_loss": 1.4279608726501465,
+      "eval_runtime": 159.2587,
+      "eval_samples_per_second": 35.515,
+      "eval_steps_per_second": 4.439,
+      "eval_wer": 0.8846536560313283,
       "step": 400
     },
     {
       "epoch": 0.7072135785007072,
+      "grad_norm": 1.9099421501159668,
       "learning_rate": 0.00029699999999999996,
+      "loss": 3.6818,
       "step": 500
     },
     {
       "epoch": 0.7072135785007072,
+      "eval_loss": 1.1378353834152222,
+      "eval_runtime": 160.4319,
+      "eval_samples_per_second": 35.255,
+      "eval_steps_per_second": 4.407,
+      "eval_wer": 0.7958368106824164,
       "step": 500
     },
     {
       "epoch": 0.8486562942008486,
+      "eval_loss": 0.9263126254081726,
+      "eval_runtime": 159.8222,
+      "eval_samples_per_second": 35.389,
+      "eval_steps_per_second": 4.424,
+      "eval_wer": 0.6777299865185851,
       "step": 600
     },
     {
       "epoch": 0.9900990099009901,
+      "eval_loss": 0.8501134514808655,
+      "eval_runtime": 160.338,
+      "eval_samples_per_second": 35.275,
+      "eval_steps_per_second": 4.409,
+      "eval_wer": 0.6388104256275278,
       "step": 700
     },
     {
       "epoch": 1.1315417256011315,
+      "eval_loss": 0.6984566450119019,
+      "eval_runtime": 159.8325,
+      "eval_samples_per_second": 35.387,
+      "eval_steps_per_second": 4.423,
+      "eval_wer": 0.5563972523592476,
       "step": 800
     },
     {
       "epoch": 1.272984441301273,
+      "eval_loss": 0.6664860248565674,
+      "eval_runtime": 162.9316,
+      "eval_samples_per_second": 34.714,
+      "eval_steps_per_second": 4.339,
+      "eval_wer": 0.5401393079540348,
       "step": 900
     },
     {
       "epoch": 1.4144271570014144,
+      "grad_norm": 0.8423302173614502,
       "learning_rate": 0.00022574999999999996,
+      "loss": 0.895,
       "step": 1000
     },
     {
       "epoch": 1.4144271570014144,
+      "eval_loss": 0.6228350400924683,
+      "eval_runtime": 161.5875,
+      "eval_samples_per_second": 35.003,
+      "eval_steps_per_second": 4.375,
+      "eval_wer": 0.5000802465173011,
       "step": 1000
     },
     {
       "epoch": 1.5558698727015559,
+      "eval_loss": 0.5974757075309753,
+      "eval_runtime": 160.961,
+      "eval_samples_per_second": 35.139,
+      "eval_steps_per_second": 4.392,
+      "eval_wer": 0.48359761186364514,
       "step": 1100
     },
     {
       "epoch": 1.6973125884016973,
+      "eval_loss": 0.5826218128204346,
+      "eval_runtime": 162.2219,
+      "eval_samples_per_second": 34.866,
+      "eval_steps_per_second": 4.358,
+      "eval_wer": 0.4677248507414778,
       "step": 1200
     },
     {
       "epoch": 1.8387553041018387,
+      "eval_loss": 0.5473496317863464,
+      "eval_runtime": 164.7294,
+      "eval_samples_per_second": 34.335,
+      "eval_steps_per_second": 4.292,
+      "eval_wer": 0.4512903639982025,
       "step": 1300
     },
     {
       "epoch": 1.9801980198019802,
+      "eval_loss": 0.5284178256988525,
+      "eval_runtime": 168.0547,
+      "eval_samples_per_second": 33.656,
+      "eval_steps_per_second": 4.207,
+      "eval_wer": 0.4376966039673878,
       "step": 1400
     },
     {
       "epoch": 2.1216407355021216,
+      "grad_norm": 1.0099021196365356,
       "learning_rate": 0.0001512,
+      "loss": 0.687,
       "step": 1500
     },
     {
       "epoch": 2.1216407355021216,
+      "eval_loss": 0.5137470960617065,
+      "eval_runtime": 160.3266,
+      "eval_samples_per_second": 35.278,
+      "eval_steps_per_second": 4.41,
+      "eval_wer": 0.42363741413622646,
       "step": 1500
     },
     {
       "epoch": 2.263083451202263,
+      "eval_loss": 0.5110819339752197,
+      "eval_runtime": 161.254,
+      "eval_samples_per_second": 35.075,
+      "eval_steps_per_second": 4.384,
+      "eval_wer": 0.4103004429607755,
       "step": 1600
     },
     {
       "epoch": 2.4045261669024045,
+      "eval_loss": 0.49603915214538574,
+      "eval_runtime": 160.5657,
+      "eval_samples_per_second": 35.225,
+      "eval_steps_per_second": 4.403,
+      "eval_wer": 0.4084226744559286,
       "step": 1700
     },
     {
       "epoch": 2.545968882602546,
+      "eval_loss": 0.4876905679702759,
+      "eval_runtime": 161.8676,
+      "eval_samples_per_second": 34.942,
+      "eval_steps_per_second": 4.368,
+      "eval_wer": 0.40148937536110935,
       "step": 1800
     },
     {
       "epoch": 2.6874115983026874,
+      "eval_loss": 0.47859108448028564,
+      "eval_runtime": 161.5548,
+      "eval_samples_per_second": 35.01,
+      "eval_steps_per_second": 4.376,
+      "eval_wer": 0.39929062078705785,
       "step": 1900
     },
     {
       "epoch": 2.828854314002829,
+      "grad_norm": 0.5755736231803894,
       "learning_rate": 7.664999999999999e-05,
+      "loss": 0.5319,
       "step": 2000
     },
     {
       "epoch": 2.828854314002829,
+      "eval_loss": 0.47312092781066895,
+      "eval_runtime": 162.5051,
+      "eval_samples_per_second": 34.805,
+      "eval_steps_per_second": 4.351,
+      "eval_wer": 0.39299929383064774,
       "step": 2000
     },
     {
       "epoch": 2.9702970297029703,
+      "eval_loss": 0.4668172001838684,
+      "eval_runtime": 162.21,
+      "eval_samples_per_second": 34.868,
+      "eval_steps_per_second": 4.359,
+      "eval_wer": 0.3877190729922321,
       "step": 2100
     },
     {
       "epoch": 3.1117397454031117,
+      "eval_loss": 0.46727854013442993,
+      "eval_runtime": 161.4684,
+      "eval_samples_per_second": 35.029,
+      "eval_steps_per_second": 4.379,
+      "eval_wer": 0.3849585927970726,
       "step": 2200
     },
     {
       "epoch": 3.253182461103253,
+      "eval_loss": 0.46300554275512695,
+      "eval_runtime": 161.1936,
+      "eval_samples_per_second": 35.088,
+      "eval_steps_per_second": 4.386,
+      "eval_wer": 0.3804326892212878,
       "step": 2300
     },
     {
       "epoch": 3.3946251768033946,
+      "eval_loss": 0.4593857228755951,
+      "eval_runtime": 161.5089,
+      "eval_samples_per_second": 35.02,
+      "eval_steps_per_second": 4.377,
+      "eval_wer": 0.3768697438531168,
       "step": 2400
     },
     {
       "epoch": 3.536067892503536,
+      "grad_norm": 0.887208104133606,
       "learning_rate": 1.9499999999999995e-06,
+      "loss": 0.4355,
       "step": 2500
     },
     {
       "epoch": 3.536067892503536,
+      "eval_loss": 0.4583967626094818,
+      "eval_runtime": 162.1219,
+      "eval_samples_per_second": 34.887,
+      "eval_steps_per_second": 4.361,
+      "eval_wer": 0.37831418116453747,
       "step": 2500
     },
     {
       "epoch": 3.536067892503536,
       "step": 2500,
+      "total_flos": 9.55169606524761e+18,
+      "train_loss": 1.2462444946289062,
+      "train_runtime": 6962.0027,
+      "train_samples_per_second": 11.491,
+      "train_steps_per_second": 0.359
     }
   ],
   "logging_steps": 500,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 4,
   "save_steps": 400,
+  "total_flos": 9.55169606524761e+18,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null