End of training

Browse files

Files changed (6) hide show

README.md +3 -1
all_results.json +9 -9
eval_results.json +5 -5
runs/Aug31_06-47-48_ebde17386124/events.out.tfevents.1725088526.ebde17386124.1085.1 +3 -0
train_results.json +4 -4
trainer_state.json +97 -97

README.md CHANGED Viewed

@@ -2,6 +2,8 @@
 license: apache-2.0
 base_model: DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy
 tags:
 - generated_from_trainer
 metrics:
 - wer
@@ -15,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-btb-ccv-ft-btb-cy
-This model is a fine-tuned version of [DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy](https://huggingface.co/DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.4314
 - Wer: 0.3285

 license: apache-2.0
 base_model: DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy
 tags:
+- automatic-speech-recognition
+- DewiBrynJones/banc-trawsgrifiadau-bangor-clean
 - generated_from_trainer
 metrics:
 - wer
 # wav2vec2-btb-ccv-ft-btb-cy
+This model is a fine-tuned version of [DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy](https://huggingface.co/DewiBrynJones/wav2vec2-xlsr-53-ft-btb-ccv-cy) on the DEWIBRYNJONES/BANC-TRAWSGRIFIADAU-BANGOR-CLEAN - DEFAULT dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.4314
 - Wer: 0.3285

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
     "epoch": 1.7084282460136673,
-    "eval_loss": 0.4376124143600464,
-    "eval_runtime": 206.2027,
     "eval_samples": 7022,
-    "eval_samples_per_second": 34.054,
-    "eval_steps_per_second": 0.533,
-    "eval_wer": 0.339454417411871,
     "total_flos": 5.591115044514249e+18,
-    "train_loss": 0.8770465799967448,
-    "train_runtime": 4793.5663,
     "train_samples": 28086,
-    "train_samples_per_second": 10.013,
-    "train_steps_per_second": 0.626
 }

 {
     "epoch": 1.7084282460136673,
+    "eval_loss": 0.4313787817955017,
+    "eval_runtime": 194.7378,
     "eval_samples": 7022,
+    "eval_samples_per_second": 36.059,
+    "eval_steps_per_second": 0.565,
+    "eval_wer": 0.3285321356914123,
     "total_flos": 5.591115044514249e+18,
+    "train_loss": 0.7769642333984375,
+    "train_runtime": 4540.3637,
     "train_samples": 28086,
+    "train_samples_per_second": 10.572,
+    "train_steps_per_second": 0.661
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 1.7084282460136673,
-    "eval_loss": 0.4376124143600464,
-    "eval_runtime": 206.2027,
     "eval_samples": 7022,
-    "eval_samples_per_second": 34.054,
-    "eval_steps_per_second": 0.533,
-    "eval_wer": 0.339454417411871
 }

 {
     "epoch": 1.7084282460136673,
+    "eval_loss": 0.4313787817955017,
+    "eval_runtime": 194.7378,
     "eval_samples": 7022,
+    "eval_samples_per_second": 36.059,
+    "eval_steps_per_second": 0.565,
+    "eval_wer": 0.3285321356914123
 }

runs/Aug31_06-47-48_ebde17386124/events.out.tfevents.1725088526.ebde17386124.1085.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d0e7e96d8849ebd055b1bb27c525382b83285005bcf20d8e6557055fd98d4bde
+size 406

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 1.7084282460136673,
     "total_flos": 5.591115044514249e+18,
-    "train_loss": 0.8770465799967448,
-    "train_runtime": 4793.5663,
     "train_samples": 28086,
-    "train_samples_per_second": 10.013,
-    "train_steps_per_second": 0.626
 }

 {
     "epoch": 1.7084282460136673,
     "total_flos": 5.591115044514249e+18,
+    "train_loss": 0.7769642333984375,
+    "train_runtime": 4540.3637,
     "train_samples": 28086,
+    "train_samples_per_second": 10.572,
+    "train_steps_per_second": 0.661
 }

trainer_state.json CHANGED Viewed

@@ -10,189 +10,189 @@
   "log_history": [
     {
       "epoch": 0.11389521640091116,
-      "eval_loss": 0.7527692914009094,
-      "eval_runtime": 198.1592,
-      "eval_samples_per_second": 35.436,
-      "eval_steps_per_second": 0.555,
-      "eval_wer": 0.5048698494532216,
       "step": 200
     },
     {
       "epoch": 0.22779043280182232,
-      "eval_loss": 0.6966450810432434,
-      "eval_runtime": 197.214,
-      "eval_samples_per_second": 35.606,
-      "eval_steps_per_second": 0.558,
-      "eval_wer": 0.5050160113740549,
       "step": 400
     },
     {
       "epoch": 0.2847380410022779,
-      "grad_norm": 4.219395637512207,
-      "learning_rate": 0.00027833333333333334,
-      "loss": 2.117,
       "step": 500
     },
     {
       "epoch": 0.3416856492027335,
-      "eval_loss": 0.6128434538841248,
-      "eval_runtime": 200.109,
-      "eval_samples_per_second": 35.091,
-      "eval_steps_per_second": 0.55,
-      "eval_wer": 0.47608923849639245,
       "step": 600
     },
     {
       "epoch": 0.45558086560364464,
-      "eval_loss": 0.6331803202629089,
-      "eval_runtime": 200.832,
-      "eval_samples_per_second": 34.965,
-      "eval_steps_per_second": 0.548,
-      "eval_wer": 0.5017472993263264,
       "step": 800
     },
     {
       "epoch": 0.5694760820045558,
-      "grad_norm": 3.2030014991760254,
-      "learning_rate": 0.00022288888888888887,
-      "loss": 0.7606,
       "step": 1000
     },
     {
       "epoch": 0.5694760820045558,
-      "eval_loss": 0.5895215272903442,
-      "eval_runtime": 203.9306,
-      "eval_samples_per_second": 34.433,
-      "eval_steps_per_second": 0.539,
-      "eval_wer": 0.457659549024037,
       "step": 1000
     },
     {
       "epoch": 0.683371298405467,
-      "eval_loss": 0.5552608370780945,
-      "eval_runtime": 205.5709,
-      "eval_samples_per_second": 34.159,
-      "eval_steps_per_second": 0.535,
-      "eval_wer": 0.4211057813683413,
       "step": 1200
     },
     {
       "epoch": 0.7972665148063781,
-      "eval_loss": 0.530360996723175,
-      "eval_runtime": 215.1898,
-      "eval_samples_per_second": 32.632,
-      "eval_steps_per_second": 0.511,
-      "eval_wer": 0.419604299817962,
       "step": 1400
     },
     {
       "epoch": 0.8542141230068337,
-      "grad_norm": 2.892026424407959,
-      "learning_rate": 0.00016766666666666666,
-      "loss": 0.7049,
       "step": 1500
     },
     {
       "epoch": 0.9111617312072893,
-      "eval_loss": 0.5060806274414062,
-      "eval_runtime": 208.7711,
-      "eval_samples_per_second": 33.635,
-      "eval_steps_per_second": 0.527,
-      "eval_wer": 0.38730251531378307,
       "step": 1600
     },
     {
       "epoch": 1.0250569476082005,
-      "eval_loss": 0.5090161561965942,
-      "eval_runtime": 207.1232,
-      "eval_samples_per_second": 33.903,
-      "eval_steps_per_second": 0.531,
-      "eval_wer": 0.3959127811956045,
       "step": 1800
     },
     {
       "epoch": 1.1389521640091116,
-      "grad_norm": 2.3204939365386963,
-      "learning_rate": 0.00011233333333333333,
-      "loss": 0.6136,
       "step": 2000
     },
     {
       "epoch": 1.1389521640091116,
-      "eval_loss": 0.4839297831058502,
-      "eval_runtime": 206.3623,
-      "eval_samples_per_second": 34.028,
-      "eval_steps_per_second": 0.533,
-      "eval_wer": 0.3758088733573393,
       "step": 2000
     },
     {
       "epoch": 1.2528473804100229,
-      "eval_loss": 0.46924272179603577,
-      "eval_runtime": 205.266,
-      "eval_samples_per_second": 34.209,
-      "eval_steps_per_second": 0.536,
-      "eval_wer": 0.3658565752933204,
       "step": 2200
     },
     {
       "epoch": 1.366742596810934,
-      "eval_loss": 0.4569305181503296,
-      "eval_runtime": 207.0588,
-      "eval_samples_per_second": 33.913,
-      "eval_steps_per_second": 0.531,
-      "eval_wer": 0.35436293333687663,
       "step": 2400
     },
     {
       "epoch": 1.4236902050113895,
-      "grad_norm": 3.092404365539551,
-      "learning_rate": 5.688888888888888e-05,
-      "loss": 0.5388,
       "step": 2500
     },
     {
       "epoch": 1.4806378132118452,
-      "eval_loss": 0.4487648606300354,
-      "eval_runtime": 205.0091,
-      "eval_samples_per_second": 34.252,
-      "eval_steps_per_second": 0.537,
-      "eval_wer": 0.3484765941614956,
       "step": 2600
     },
     {
       "epoch": 1.5945330296127562,
-      "eval_loss": 0.441054105758667,
-      "eval_runtime": 211.0185,
-      "eval_samples_per_second": 33.277,
-      "eval_steps_per_second": 0.521,
-      "eval_wer": 0.3423112185917963,
       "step": 2800
     },
     {
       "epoch": 1.7084282460136673,
-      "grad_norm": 0.7985823154449463,
-      "learning_rate": 1.4444444444444445e-06,
-      "loss": 0.5275,
       "step": 3000
     },
     {
       "epoch": 1.7084282460136673,
-      "eval_loss": 0.4376124143600464,
-      "eval_runtime": 210.3633,
-      "eval_samples_per_second": 33.38,
-      "eval_steps_per_second": 0.523,
-      "eval_wer": 0.339454417411871,
       "step": 3000
     },
     {
       "epoch": 1.7084282460136673,
       "step": 3000,
       "total_flos": 5.591115044514249e+18,
-      "train_loss": 0.8770465799967448,
-      "train_runtime": 4793.5663,
-      "train_samples_per_second": 10.013,
-      "train_steps_per_second": 0.626
     }
   ],
   "logging_steps": 500,

   "log_history": [
     {
       "epoch": 0.11389521640091116,
+      "eval_loss": 0.7147656679153442,
+      "eval_runtime": 189.2611,
+      "eval_samples_per_second": 37.102,
+      "eval_steps_per_second": 0.581,
+      "eval_wer": 0.46031703849373495,
       "step": 200
     },
     {
       "epoch": 0.22779043280182232,
+      "eval_loss": 0.6810471415519714,
+      "eval_runtime": 189.9773,
+      "eval_samples_per_second": 36.962,
+      "eval_steps_per_second": 0.579,
+      "eval_wer": 0.4794509626755604,
       "step": 400
     },
     {
       "epoch": 0.2847380410022779,
+      "grad_norm": 3.062281370162964,
+      "learning_rate": 0.0002781111111111111,
+      "loss": 1.4735,
       "step": 500
     },
     {
       "epoch": 0.3416856492027335,
+      "eval_loss": 0.6035017371177673,
+      "eval_runtime": 190.2908,
+      "eval_samples_per_second": 36.901,
+      "eval_steps_per_second": 0.578,
+      "eval_wer": 0.4485975099323669,
       "step": 600
     },
     {
       "epoch": 0.45558086560364464,
+      "eval_loss": 0.6222513914108276,
+      "eval_runtime": 191.1122,
+      "eval_samples_per_second": 36.743,
+      "eval_steps_per_second": 0.576,
+      "eval_wer": 0.5104638647869357,
       "step": 800
     },
     {
       "epoch": 0.5694760820045558,
+      "grad_norm": 3.101222515106201,
+      "learning_rate": 0.00022266666666666664,
+      "loss": 0.7681,
       "step": 1000
     },
     {
       "epoch": 0.5694760820045558,
+      "eval_loss": 0.5656484365463257,
+      "eval_runtime": 192.373,
+      "eval_samples_per_second": 36.502,
+      "eval_steps_per_second": 0.572,
+      "eval_wer": 0.4336225567706188,
       "step": 1000
     },
     {
       "epoch": 0.683371298405467,
+      "eval_loss": 0.5275253057479858,
+      "eval_runtime": 193.09,
+      "eval_samples_per_second": 36.366,
+      "eval_steps_per_second": 0.57,
+      "eval_wer": 0.4008291367145458,
       "step": 1200
     },
     {
       "epoch": 0.7972665148063781,
+      "eval_loss": 0.5284231305122375,
+      "eval_runtime": 193.9644,
+      "eval_samples_per_second": 36.203,
+      "eval_steps_per_second": 0.567,
+      "eval_wer": 0.40279567892212226,
       "step": 1400
     },
     {
       "epoch": 0.8542141230068337,
+      "grad_norm": 6.068333148956299,
+      "learning_rate": 0.00016744444444444443,
+      "loss": 0.7159,
       "step": 1500
     },
     {
       "epoch": 0.9111617312072893,
+      "eval_loss": 0.4989575147628784,
+      "eval_runtime": 194.0102,
+      "eval_samples_per_second": 36.194,
+      "eval_steps_per_second": 0.567,
+      "eval_wer": 0.39135518675507247,
       "step": 1600
     },
     {
       "epoch": 1.0250569476082005,
+      "eval_loss": 0.4855109453201294,
+      "eval_runtime": 193.5264,
+      "eval_samples_per_second": 36.284,
+      "eval_steps_per_second": 0.568,
+      "eval_wer": 0.37300522196680796,
       "step": 1800
     },
     {
       "epoch": 1.1389521640091116,
+      "grad_norm": 2.826504707336426,
+      "learning_rate": 0.0001121111111111111,
+      "loss": 0.6203,
       "step": 2000
     },
     {
       "epoch": 1.1389521640091116,
+      "eval_loss": 0.47395312786102295,
+      "eval_runtime": 193.5198,
+      "eval_samples_per_second": 36.286,
+      "eval_steps_per_second": 0.568,
+      "eval_wer": 0.3622822519565766,
       "step": 2000
     },
     {
       "epoch": 1.2528473804100229,
+      "eval_loss": 0.45885559916496277,
+      "eval_runtime": 194.4002,
+      "eval_samples_per_second": 36.121,
+      "eval_steps_per_second": 0.566,
+      "eval_wer": 0.3536454111800582,
       "step": 2200
     },
     {
       "epoch": 1.366742596810934,
+      "eval_loss": 0.4538777470588684,
+      "eval_runtime": 194.3098,
+      "eval_samples_per_second": 36.138,
+      "eval_steps_per_second": 0.566,
+      "eval_wer": 0.34074329980467455,
       "step": 2400
     },
     {
       "epoch": 1.4236902050113895,
+      "grad_norm": 1.8585691452026367,
+      "learning_rate": 5.666666666666666e-05,
+      "loss": 0.5447,
       "step": 2500
     },
     {
       "epoch": 1.4806378132118452,
+      "eval_loss": 0.4409582316875458,
+      "eval_runtime": 193.3591,
+      "eval_samples_per_second": 36.316,
+      "eval_steps_per_second": 0.569,
+      "eval_wer": 0.3357339321542938,
       "step": 2600
     },
     {
       "epoch": 1.5945330296127562,
+      "eval_loss": 0.43471136689186096,
+      "eval_runtime": 193.3767,
+      "eval_samples_per_second": 36.313,
+      "eval_steps_per_second": 0.569,
+      "eval_wer": 0.3293426699796702,
       "step": 2800
     },
     {
       "epoch": 1.7084282460136673,
+      "grad_norm": 1.961743712425232,
+      "learning_rate": 1.222222222222222e-06,
+      "loss": 0.5392,
       "step": 3000
     },
     {
       "epoch": 1.7084282460136673,
+      "eval_loss": 0.4313787817955017,
+      "eval_runtime": 192.9526,
+      "eval_samples_per_second": 36.392,
+      "eval_steps_per_second": 0.57,
+      "eval_wer": 0.3285321356914123,
       "step": 3000
     },
     {
       "epoch": 1.7084282460136673,
       "step": 3000,
       "total_flos": 5.591115044514249e+18,
+      "train_loss": 0.7769642333984375,
+      "train_runtime": 4540.3637,
+      "train_samples_per_second": 10.572,
+      "train_steps_per_second": 0.661
     }
   ],
   "logging_steps": 500,