Training in progress, step 15000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c929302bb74af8414f1457bdac983a5167c48fc62743f2a944292a9ec355ff19
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:36dbc50cf9140fb7f0d07a538501afa688944f7d4db346dd9f7ac42fb1be590a
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:29b1dd609226add0a62fefe86375dc5ab0e6ba03119c133d085ae905f7776bb4
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:1327fc0bd4b84f3f75a5ae566a31c8d3866b9addc072e36ebcf7aa9bd4b067fa
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e0ebdb9d6f339d52dd1aed7a35020ec74669f26e08d2625423357b179393847c
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:a48bbb35f10fc80761770aebcc3f7c466fe7a23a21b518a2ddab7c9475727995
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb80279c059163717a04958ac0f1db273c6cbef42cd2cc5782804246c1bb647e
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:870e427bfebba6376a09e42afc7cf27343ead25cf07419d6ca98b32ac4723fc2
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b246a509473d8d83986a3f679e62ae072d94abb1f10b20f190de183087d405e3
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee2e34fac94bd8efbe6863121732ff5580c12a2335033285d23cf8ff6a7c8cb1
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.4859592488458468,
-  "global_step": 14000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3492,11 +3492,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.09559709797472452,
       "step": 14000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 4.755903086592e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.5206706237634072,
+  "global_step": 15000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.09559709797472452,
       "step": 14000
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.484081632653062e-06,
+      "loss": 0.1841,
+      "step": 14025
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.4738775510204085e-06,
+      "loss": 0.1254,
+      "step": 14050
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.463673469387755e-06,
+      "loss": 0.1598,
+      "step": 14075
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.453469387755103e-06,
+      "loss": 0.1339,
+      "step": 14100
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.443265306122449e-06,
+      "loss": 0.1844,
+      "step": 14125
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.433061224489797e-06,
+      "loss": 0.1493,
+      "step": 14150
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.422857142857143e-06,
+      "loss": 0.1661,
+      "step": 14175
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.41265306122449e-06,
+      "loss": 0.1306,
+      "step": 14200
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.4024489795918375e-06,
+      "loss": 0.1602,
+      "step": 14225
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.392244897959184e-06,
+      "loss": 0.1421,
+      "step": 14250
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.382040816326531e-06,
+      "loss": 0.1714,
+      "step": 14275
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.371836734693878e-06,
+      "loss": 0.1213,
+      "step": 14300
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.361632653061225e-06,
+      "loss": 0.1728,
+      "step": 14325
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.351428571428572e-06,
+      "loss": 0.1521,
+      "step": 14350
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.341224489795919e-06,
+      "loss": 0.1479,
+      "step": 14375
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.331020408163266e-06,
+      "loss": 0.1485,
+      "step": 14400
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.320816326530612e-06,
+      "loss": 0.1618,
+      "step": 14425
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.310612244897959e-06,
+      "loss": 0.1676,
+      "step": 14450
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.300408163265306e-06,
+      "loss": 0.1593,
+      "step": 14475
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.290204081632653e-06,
+      "loss": 0.1525,
+      "step": 14500
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.2800000000000005e-06,
+      "loss": 0.1589,
+      "step": 14525
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.269795918367347e-06,
+      "loss": 0.182,
+      "step": 14550
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.259591836734695e-06,
+      "loss": 0.1746,
+      "step": 14575
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.249387755102041e-06,
+      "loss": 0.1475,
+      "step": 14600
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.239183673469388e-06,
+      "loss": 0.1718,
+      "step": 14625
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.2289795918367346e-06,
+      "loss": 0.1515,
+      "step": 14650
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.218775510204082e-06,
+      "loss": 0.1739,
+      "step": 14675
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.208571428571429e-06,
+      "loss": 0.1415,
+      "step": 14700
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.198367346938776e-06,
+      "loss": 0.175,
+      "step": 14725
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.188163265306123e-06,
+      "loss": 0.1489,
+      "step": 14750
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.1779591836734695e-06,
+      "loss": 0.165,
+      "step": 14775
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.167755102040817e-06,
+      "loss": 0.1568,
+      "step": 14800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.157551020408164e-06,
+      "loss": 0.1959,
+      "step": 14825
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.14734693877551e-06,
+      "loss": 0.1389,
+      "step": 14850
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.137142857142858e-06,
+      "loss": 0.1741,
+      "step": 14875
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.126938775510204e-06,
+      "loss": 0.1576,
+      "step": 14900
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.116734693877552e-06,
+      "loss": 0.1984,
+      "step": 14925
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.1065306122448985e-06,
+      "loss": 0.1307,
+      "step": 14950
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.096326530612245e-06,
+      "loss": 0.1745,
+      "step": 14975
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.086122448979592e-06,
+      "loss": 0.1556,
+      "step": 15000
+    },
+    {
+      "epoch": 0.52,
+      "eval_loss": 0.16709309816360474,
+      "eval_runtime": 31213.067,
+      "eval_samples_per_second": 0.994,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.09415070849968464,
+      "step": 15000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 5.09561044992e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:29b1dd609226add0a62fefe86375dc5ab0e6ba03119c133d085ae905f7776bb4
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:1327fc0bd4b84f3f75a5ae566a31c8d3866b9addc072e36ebcf7aa9bd4b067fa
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a774424dd1f706b0778295046bad47acca2f0a8722db7ce4662169f20deeee88
-size 96761

 version https://git-lfs.github.com/spec/v1
+oid sha256:6358803618c5f009d0a7ba4001fd025bc6f24e6e4315f0b1153ccc109884fa00
+size 103359