Training in progress, step 4000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:524b22890142e47419a06d19ae61852f9787098118564b0f950aec1179e74230
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:071c5f4b0d6b94f41e4ec3d1d9e0d746d356fee79d390bbf5696fdec12d09eee
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:292c0ca92f5d9cb9248a1b9129a7ce107758f2f0a9b6c7ce62018b59f5e453ca
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d13c1515c5bec3b1b6df88233162654239b2f0a7c1119dddff788e8c045bd24
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d9598b49b7afca30659c27619764c7fd04e3ef4e5f28cc734910a1ae47804866
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec70788b682d89359da85d225e858c6024d3fd2773541d2690bca2b322a42f06
+size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac1686cb80dfe456f1ee071e6b209db73517d8bbd97cb9595254e481a753285f
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:d92186bd8b7a36cbab743326563ee77d960ade57f12c3c59d4d213b20af4bd62
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c01e440b61cade1b20bb9e797abdc166ebdff6380a8b18ea5ba5855bc546f3fa
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8e131db79df8f2c3d12190a618e4f984ac87c57b6930e6ec08f7edadfe13646
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.10413412475268145,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -753,11 +753,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.11325757951014288,
       "step": 3000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 1.019122089984e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.13884549967024193,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.11325757951014288,
       "step": 3000
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.971836734693879e-06,
+      "loss": 0.1969,
+      "step": 3025
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.961632653061225e-06,
+      "loss": 0.1797,
+      "step": 3050
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.951428571428572e-06,
+      "loss": 0.2003,
+      "step": 3075
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.941224489795918e-06,
+      "loss": 0.1641,
+      "step": 3100
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.931020408163266e-06,
+      "loss": 0.2025,
+      "step": 3125
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.921224489795918e-06,
+      "loss": 0.1992,
+      "step": 3150
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.911020408163266e-06,
+      "loss": 0.2187,
+      "step": 3175
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.900816326530612e-06,
+      "loss": 0.1746,
+      "step": 3200
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.89061224489796e-06,
+      "loss": 0.1978,
+      "step": 3225
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.880408163265307e-06,
+      "loss": 0.2066,
+      "step": 3250
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.870204081632654e-06,
+      "loss": 0.2032,
+      "step": 3275
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 8.860000000000002e-06,
+      "loss": 0.1744,
+      "step": 3300
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.849795918367347e-06,
+      "loss": 0.2074,
+      "step": 3325
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.839591836734695e-06,
+      "loss": 0.1732,
+      "step": 3350
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.82938775510204e-06,
+      "loss": 0.2097,
+      "step": 3375
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.819183673469388e-06,
+      "loss": 0.1759,
+      "step": 3400
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.808979591836736e-06,
+      "loss": 0.198,
+      "step": 3425
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.798775510204083e-06,
+      "loss": 0.2081,
+      "step": 3450
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.788571428571429e-06,
+      "loss": 0.205,
+      "step": 3475
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.778367346938776e-06,
+      "loss": 0.2008,
+      "step": 3500
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.768163265306124e-06,
+      "loss": 0.1978,
+      "step": 3525
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.75795918367347e-06,
+      "loss": 0.2026,
+      "step": 3550
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.747755102040817e-06,
+      "loss": 0.2027,
+      "step": 3575
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 8.737551020408163e-06,
+      "loss": 0.2174,
+      "step": 3600
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.72734693877551e-06,
+      "loss": 0.2304,
+      "step": 3625
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.717142857142858e-06,
+      "loss": 0.2116,
+      "step": 3650
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.706938775510205e-06,
+      "loss": 0.1946,
+      "step": 3675
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.696734693877553e-06,
+      "loss": 0.1663,
+      "step": 3700
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.686530612244899e-06,
+      "loss": 0.2299,
+      "step": 3725
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.676326530612246e-06,
+      "loss": 0.1811,
+      "step": 3750
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.666122448979592e-06,
+      "loss": 0.2082,
+      "step": 3775
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.65591836734694e-06,
+      "loss": 0.1697,
+      "step": 3800
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.645714285714287e-06,
+      "loss": 0.2177,
+      "step": 3825
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.635510204081633e-06,
+      "loss": 0.1829,
+      "step": 3850
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 8.62530612244898e-06,
+      "loss": 0.2004,
+      "step": 3875
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 8.615102040816328e-06,
+      "loss": 0.1872,
+      "step": 3900
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 8.604897959183675e-06,
+      "loss": 0.1981,
+      "step": 3925
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 8.594693877551021e-06,
+      "loss": 0.1981,
+      "step": 3950
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 8.584489795918368e-06,
+      "loss": 0.1967,
+      "step": 3975
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 8.574285714285714e-06,
+      "loss": 0.1752,
+      "step": 4000
+    },
+    {
+      "epoch": 0.14,
+      "eval_loss": 0.2080826610326767,
+      "eval_runtime": 31400.8611,
+      "eval_samples_per_second": 0.988,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.11463792380367409,
+      "step": 4000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 1.358829453312e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:292c0ca92f5d9cb9248a1b9129a7ce107758f2f0a9b6c7ce62018b59f5e453ca
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d13c1515c5bec3b1b6df88233162654239b2f0a7c1119dddff788e8c045bd24
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6ad16952cc6df1dc554ae3afa7930fec5d15256f3fee9a4261fcb24610e6c56
-size 24183

 version https://git-lfs.github.com/spec/v1
+oid sha256:3be876d39b9ffab345bd37299ad53f20801693f40e6411525ec37c8d2d55b4dd
+size 30781