Training in progress, step 20000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:181c2bd989506934f36609329ae3277eb855e8acf49b3c12e326fb79cb004eb3
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:3070aeb72d29088489c0fb6e92c23b06f3de39671f0b9c078f18da734e95bf6b
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:15b5954cb47199f441cbbb70307c72621abf9248aa385660bfdb147a516624ef
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:47bc5d383a893937307b6252269bc95121112ddd7c888bf951e25cc0f6233b96
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9460131d11a73df83270a4796c5192126900329b0b2274773520724725f4b12d
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:4979e2334c039bb7332b1f1ca1ec119b85c014a960ba0dbab629d4dd618f0ad2
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f6a09c97ace5e5a49360efd6cac2da516ffa83c9ee08cb64155c59b3a316ab7a
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:0e95ea4d51ce3dbab01e59ff8912c2f7044fb7bd804fa1afc7ea77264e8c7d84
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec3490e7ac28e19432d614c125578d2d66d232f9a51b472efd2d122fe9c6b708
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:e664770f258aac914190f0cd016b820f86cc722eb7db2dbd9de5aff987606154
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.6595161234336492,
-  "global_step": 19000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4737,11 +4737,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.08945159383534276,
       "step": 19000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 6.454439903232e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.6942274983512097,
+  "global_step": 20000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.08945159383534276,
       "step": 19000
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.4432653061224493e-06,
+      "loss": 0.1517,
+      "step": 19025
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.433061224489796e-06,
+      "loss": 0.1327,
+      "step": 19050
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.422857142857143e-06,
+      "loss": 0.1714,
+      "step": 19075
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.41265306122449e-06,
+      "loss": 0.1268,
+      "step": 19100
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.4024489795918367e-06,
+      "loss": 0.1597,
+      "step": 19125
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.3922448979591838e-06,
+      "loss": 0.1326,
+      "step": 19150
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.382040816326531e-06,
+      "loss": 0.1758,
+      "step": 19175
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.371836734693878e-06,
+      "loss": 0.1347,
+      "step": 19200
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3616326530612245e-06,
+      "loss": 0.161,
+      "step": 19225
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3514285714285716e-06,
+      "loss": 0.1375,
+      "step": 19250
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3412244897959187e-06,
+      "loss": 0.1475,
+      "step": 19275
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3310204081632653e-06,
+      "loss": 0.122,
+      "step": 19300
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3208163265306124e-06,
+      "loss": 0.1556,
+      "step": 19325
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3106122448979594e-06,
+      "loss": 0.1204,
+      "step": 19350
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.3004081632653065e-06,
+      "loss": 0.1576,
+      "step": 19375
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.290204081632653e-06,
+      "loss": 0.1134,
+      "step": 19400
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.28e-06,
+      "loss": 0.1533,
+      "step": 19425
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.2697959183673473e-06,
+      "loss": 0.1423,
+      "step": 19450
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.2595918367346943e-06,
+      "loss": 0.1725,
+      "step": 19475
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.249387755102041e-06,
+      "loss": 0.1464,
+      "step": 19500
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.239183673469388e-06,
+      "loss": 0.1739,
+      "step": 19525
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.228979591836735e-06,
+      "loss": 0.1394,
+      "step": 19550
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.2187755102040817e-06,
+      "loss": 0.1521,
+      "step": 19575
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.2085714285714288e-06,
+      "loss": 0.1378,
+      "step": 19600
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.1983673469387754e-06,
+      "loss": 0.1519,
+      "step": 19625
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.188163265306123e-06,
+      "loss": 0.1261,
+      "step": 19650
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.1779591836734695e-06,
+      "loss": 0.1455,
+      "step": 19675
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.1677551020408166e-06,
+      "loss": 0.1268,
+      "step": 19700
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 2.1575510204081632e-06,
+      "loss": 0.1652,
+      "step": 19725
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.1473469387755103e-06,
+      "loss": 0.149,
+      "step": 19750
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.1371428571428574e-06,
+      "loss": 0.148,
+      "step": 19775
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.126938775510204e-06,
+      "loss": 0.1455,
+      "step": 19800
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.116734693877551e-06,
+      "loss": 0.148,
+      "step": 19825
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.106530612244898e-06,
+      "loss": 0.1317,
+      "step": 19850
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.096326530612245e-06,
+      "loss": 0.1464,
+      "step": 19875
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.086122448979592e-06,
+      "loss": 0.1339,
+      "step": 19900
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.075918367346939e-06,
+      "loss": 0.1638,
+      "step": 19925
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.065714285714286e-06,
+      "loss": 0.1253,
+      "step": 19950
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.0555102040816326e-06,
+      "loss": 0.1537,
+      "step": 19975
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 2.0453061224489797e-06,
+      "loss": 0.1255,
+      "step": 20000
+    },
+    {
+      "epoch": 0.69,
+      "eval_loss": 0.15466098487377167,
+      "eval_runtime": 31000.8642,
+      "eval_samples_per_second": 1.001,
+      "eval_steps_per_second": 0.063,
+      "eval_wer": 0.08736786835874422,
+      "step": 20000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 6.79414726656e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:15b5954cb47199f441cbbb70307c72621abf9248aa385660bfdb147a516624ef
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:47bc5d383a893937307b6252269bc95121112ddd7c888bf951e25cc0f6233b96
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6547ad8d8b1ed3f418b525a96f2b38ff44683cdf8d77997c10dc189dea1b0ef9
-size 130084

 version https://git-lfs.github.com/spec/v1
+oid sha256:4222f5599f934e25008ca9c74695648d0516086fca35c66323f38f875ddff30c
+size 136808