Training in progress, step 3000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24c369c8776f1d8bbc3ed46a23dee4fc1c4e7bed3a383f11325adc1996199e2e
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:524b22890142e47419a06d19ae61852f9787098118564b0f950aec1179e74230
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1e2e9b2d8a6b71aca3a201dfdf9d5a8975658e82c8fdc5eb479bf91513d7de5
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:292c0ca92f5d9cb9248a1b9129a7ce107758f2f0a9b6c7ce62018b59f5e453ca
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e3df258f0547ec2d8be103a88caf8ca6a1bb43373f3e23e93edf5a078821006
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:d9598b49b7afca30659c27619764c7fd04e3ef4e5f28cc734910a1ae47804866
+size 14639

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24e3f2f8deed500d0480cfb6cae701de6428749c6cff4864a11c535491f3c53d
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac1686cb80dfe456f1ee071e6b209db73517d8bbd97cb9595254e481a753285f
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:39554cad34a34a80d4b0d52798fa2ca7cde8896ce0157d14076822670fd4690a
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:c01e440b61cade1b20bb9e797abdc166ebdff6380a8b18ea5ba5855bc546f3fa
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.06942274983512096,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -504,11 +504,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.11313539592435184,
       "step": 2000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 6.79414726656e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.10413412475268145,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.11313539592435184,
       "step": 2000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.38e-06,
+      "loss": 0.2271,
+      "step": 2025
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.369795918367347e-06,
+      "loss": 0.2161,
+      "step": 2050
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.359591836734695e-06,
+      "loss": 0.1912,
+      "step": 2075
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.349387755102042e-06,
+      "loss": 0.1926,
+      "step": 2100
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.339183673469388e-06,
+      "loss": 0.2196,
+      "step": 2125
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.328979591836736e-06,
+      "loss": 0.1775,
+      "step": 2150
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.318775510204082e-06,
+      "loss": 0.2127,
+      "step": 2175
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.308571428571429e-06,
+      "loss": 0.2074,
+      "step": 2200
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.298367346938776e-06,
+      "loss": 0.1982,
+      "step": 2225
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.288163265306122e-06,
+      "loss": 0.2007,
+      "step": 2250
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.27795918367347e-06,
+      "loss": 0.2084,
+      "step": 2275
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.267755102040817e-06,
+      "loss": 0.1873,
+      "step": 2300
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.257551020408165e-06,
+      "loss": 0.2065,
+      "step": 2325
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.24734693877551e-06,
+      "loss": 0.1805,
+      "step": 2350
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.237142857142858e-06,
+      "loss": 0.2109,
+      "step": 2375
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.226938775510205e-06,
+      "loss": 0.2101,
+      "step": 2400
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 9.216734693877551e-06,
+      "loss": 0.2151,
+      "step": 2425
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.206530612244899e-06,
+      "loss": 0.2071,
+      "step": 2450
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.196326530612245e-06,
+      "loss": 0.2099,
+      "step": 2475
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.186122448979594e-06,
+      "loss": 0.1788,
+      "step": 2500
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.17591836734694e-06,
+      "loss": 0.2066,
+      "step": 2525
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.165714285714287e-06,
+      "loss": 0.177,
+      "step": 2550
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.155510204081633e-06,
+      "loss": 0.2211,
+      "step": 2575
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.14530612244898e-06,
+      "loss": 0.1929,
+      "step": 2600
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.135102040816328e-06,
+      "loss": 0.2171,
+      "step": 2625
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.124897959183674e-06,
+      "loss": 0.1591,
+      "step": 2650
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.114693877551021e-06,
+      "loss": 0.2001,
+      "step": 2675
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.104489795918367e-06,
+      "loss": 0.1912,
+      "step": 2700
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 9.094285714285716e-06,
+      "loss": 0.2166,
+      "step": 2725
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.084081632653062e-06,
+      "loss": 0.1903,
+      "step": 2750
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.07387755102041e-06,
+      "loss": 0.2228,
+      "step": 2775
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.063673469387755e-06,
+      "loss": 0.2053,
+      "step": 2800
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.053469387755103e-06,
+      "loss": 0.2006,
+      "step": 2825
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.04326530612245e-06,
+      "loss": 0.191,
+      "step": 2850
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.033061224489796e-06,
+      "loss": 0.225,
+      "step": 2875
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.022857142857143e-06,
+      "loss": 0.2079,
+      "step": 2900
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.01265306122449e-06,
+      "loss": 0.2039,
+      "step": 2925
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 9.002448979591838e-06,
+      "loss": 0.1795,
+      "step": 2950
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 8.992244897959184e-06,
+      "loss": 0.2053,
+      "step": 2975
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 8.982040816326532e-06,
+      "loss": 0.167,
+      "step": 3000
+    },
+    {
+      "epoch": 0.1,
+      "eval_loss": 0.21150387823581696,
+      "eval_runtime": 31085.4661,
+      "eval_samples_per_second": 0.998,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.11325757951014288,
+      "step": 3000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 1.019122089984e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1e2e9b2d8a6b71aca3a201dfdf9d5a8975658e82c8fdc5eb479bf91513d7de5
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:292c0ca92f5d9cb9248a1b9129a7ce107758f2f0a9b6c7ce62018b59f5e453ca
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cc1976bb9aa3aa2282f8a4933412a747b15621808bb2de8544db13179c0b4c00
-size 17585

 version https://git-lfs.github.com/spec/v1
+oid sha256:a6ad16952cc6df1dc554ae3afa7930fec5d15256f3fee9a4261fcb24610e6c56
+size 24183