Training in progress, step 14000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9b82e023bcdce3d9867de00994de7448663053d12658724461977f225ef150ba
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:c929302bb74af8414f1457bdac983a5167c48fc62743f2a944292a9ec355ff19
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b873f46f3287d785fe9e0e65cbecdf06f727c84e188245367c48b687b9339708
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:29b1dd609226add0a62fefe86375dc5ab0e6ba03119c133d085ae905f7776bb4
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c516e23ac00a4fed94805529a2f025da998c6366d20bf4032bb8f1a2f5ae0ce3
-size 14511

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0ebdb9d6f339d52dd1aed7a35020ec74669f26e08d2625423357b179393847c
+size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c19297e7f4fe97d7584a052fffbfde0e921e6770e0bba0e78fc588359f317245
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:fb80279c059163717a04958ac0f1db273c6cbef42cd2cc5782804246c1bb647e
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52755b2d249438bf866dbd6a565d7c609e276075f6ad3cb63ef2a63e3670f1cd
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:b246a509473d8d83986a3f679e62ae072d94abb1f10b20f190de183087d405e3
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.4512478739282863,
-  "global_step": 13000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3243,11 +3243,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.09758505793813547,
       "step": 13000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 4.416195723264e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.4859592488458468,
+  "global_step": 14000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.09758505793813547,
       "step": 13000
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.8918367346938775e-06,
+      "loss": 0.171,
+      "step": 13025
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.881632653061225e-06,
+      "loss": 0.1501,
+      "step": 13050
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.871428571428572e-06,
+      "loss": 0.1588,
+      "step": 13075
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.861224489795919e-06,
+      "loss": 0.1441,
+      "step": 13100
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.851020408163266e-06,
+      "loss": 0.1788,
+      "step": 13125
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.840816326530612e-06,
+      "loss": 0.143,
+      "step": 13150
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.83061224489796e-06,
+      "loss": 0.1754,
+      "step": 13175
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.8204081632653065e-06,
+      "loss": 0.164,
+      "step": 13200
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.810204081632653e-06,
+      "loss": 0.1595,
+      "step": 13225
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.800000000000001e-06,
+      "loss": 0.1265,
+      "step": 13250
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.789795918367347e-06,
+      "loss": 0.1808,
+      "step": 13275
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.779591836734695e-06,
+      "loss": 0.1587,
+      "step": 13300
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.769387755102041e-06,
+      "loss": 0.1571,
+      "step": 13325
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.759183673469388e-06,
+      "loss": 0.1386,
+      "step": 13350
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.749387755102042e-06,
+      "loss": 0.1759,
+      "step": 13375
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.739183673469388e-06,
+      "loss": 0.1349,
+      "step": 13400
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.728979591836735e-06,
+      "loss": 0.1766,
+      "step": 13425
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.718775510204082e-06,
+      "loss": 0.128,
+      "step": 13450
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.708571428571429e-06,
+      "loss": 0.1595,
+      "step": 13475
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.698367346938776e-06,
+      "loss": 0.1543,
+      "step": 13500
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.688163265306122e-06,
+      "loss": 0.175,
+      "step": 13525
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.67795918367347e-06,
+      "loss": 0.1498,
+      "step": 13550
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.667755102040817e-06,
+      "loss": 0.1575,
+      "step": 13575
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.657551020408164e-06,
+      "loss": 0.1401,
+      "step": 13600
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.6473469387755105e-06,
+      "loss": 0.1734,
+      "step": 13625
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.637142857142857e-06,
+      "loss": 0.1205,
+      "step": 13650
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.626938775510205e-06,
+      "loss": 0.1529,
+      "step": 13675
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.616734693877551e-06,
+      "loss": 0.1529,
+      "step": 13700
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.606530612244898e-06,
+      "loss": 0.1689,
+      "step": 13725
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.596326530612245e-06,
+      "loss": 0.138,
+      "step": 13750
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.586122448979593e-06,
+      "loss": 0.1709,
+      "step": 13775
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.5759183673469395e-06,
+      "loss": 0.1455,
+      "step": 13800
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.565714285714286e-06,
+      "loss": 0.1806,
+      "step": 13825
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.555510204081633e-06,
+      "loss": 0.1415,
+      "step": 13850
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.5453061224489794e-06,
+      "loss": 0.1753,
+      "step": 13875
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.535102040816327e-06,
+      "loss": 0.1414,
+      "step": 13900
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.5248979591836736e-06,
+      "loss": 0.17,
+      "step": 13925
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.514693877551021e-06,
+      "loss": 0.1453,
+      "step": 13950
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.504489795918368e-06,
+      "loss": 0.1933,
+      "step": 13975
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.494285714285715e-06,
+      "loss": 0.1616,
+      "step": 14000
+    },
+    {
+      "epoch": 0.49,
+      "eval_loss": 0.16927780210971832,
+      "eval_runtime": 31097.4541,
+      "eval_samples_per_second": 0.998,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.09559709797472452,
+      "step": 14000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 4.755903086592e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b873f46f3287d785fe9e0e65cbecdf06f727c84e188245367c48b687b9339708
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:29b1dd609226add0a62fefe86375dc5ab0e6ba03119c133d085ae905f7776bb4
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a3ad336968cb511fe9ae780cd83e8101970e1c047eb76f8596c5e84f34771a2
-size 90163

 version https://git-lfs.github.com/spec/v1
+oid sha256:a774424dd1f706b0778295046bad47acca2f0a8722db7ce4662169f20deeee88
+size 96761