Training in progress, step 2000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7caccb4814ea111a55de79f3b0f1b7eb20582444f51cf2089aad345126b34b9
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:24c369c8776f1d8bbc3ed46a23dee4fc1c4e7bed3a383f11325adc1996199e2e
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f77f043740c59e3f92e8854de8cbf501f8b2ebb4879d9251a07b28a085d8540
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1e2e9b2d8a6b71aca3a201dfdf9d5a8975658e82c8fdc5eb479bf91513d7de5
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6dc60cce2d38966cefce7400b19fe51042929b4467fc1fb949feebc41453404d
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e3df258f0547ec2d8be103a88caf8ca6a1bb43373f3e23e93edf5a078821006
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:de76d1924076a6f3ba31996f9c19d828fb19747461069f774423f20cc1b7bd1b
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:24e3f2f8deed500d0480cfb6cae701de6428749c6cff4864a11c535491f3c53d
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:781c6e782cde2f269dcaede95e567ef88774fa64959dc73143f1f45777794033
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:39554cad34a34a80d4b0d52798fa2ca7cde8896ce0157d14076822670fd4690a
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.03471137491756048,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -255,11 +255,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.11536111854119403,
       "step": 1000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 3.39707363328e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.06942274983512096,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.11536111854119403,
       "step": 1000
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.788163265306123e-06,
+      "loss": 0.2357,
+      "step": 1025
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.77795918367347e-06,
+      "loss": 0.1857,
+      "step": 1050
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.767755102040818e-06,
+      "loss": 0.2053,
+      "step": 1075
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.757551020408163e-06,
+      "loss": 0.1809,
+      "step": 1100
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.74734693877551e-06,
+      "loss": 0.2423,
+      "step": 1125
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.737142857142858e-06,
+      "loss": 0.2082,
+      "step": 1150
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.726938775510206e-06,
+      "loss": 0.2195,
+      "step": 1175
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.716734693877552e-06,
+      "loss": 0.2152,
+      "step": 1200
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.706530612244899e-06,
+      "loss": 0.2174,
+      "step": 1225
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.696326530612245e-06,
+      "loss": 0.2078,
+      "step": 1250
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 9.686122448979592e-06,
+      "loss": 0.2472,
+      "step": 1275
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.67591836734694e-06,
+      "loss": 0.1914,
+      "step": 1300
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.665714285714286e-06,
+      "loss": 0.2179,
+      "step": 1325
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.655510204081635e-06,
+      "loss": 0.2018,
+      "step": 1350
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.64530612244898e-06,
+      "loss": 0.2004,
+      "step": 1375
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.635102040816328e-06,
+      "loss": 0.2058,
+      "step": 1400
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.624897959183674e-06,
+      "loss": 0.2167,
+      "step": 1425
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.614693877551021e-06,
+      "loss": 0.1683,
+      "step": 1450
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.604489795918369e-06,
+      "loss": 0.177,
+      "step": 1475
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.594285714285715e-06,
+      "loss": 0.1716,
+      "step": 1500
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.584081632653062e-06,
+      "loss": 0.245,
+      "step": 1525
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.573877551020408e-06,
+      "loss": 0.1928,
+      "step": 1550
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.563673469387757e-06,
+      "loss": 0.2055,
+      "step": 1575
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.553469387755103e-06,
+      "loss": 0.2019,
+      "step": 1600
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.54326530612245e-06,
+      "loss": 0.2102,
+      "step": 1625
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.533061224489796e-06,
+      "loss": 0.2043,
+      "step": 1650
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.522857142857144e-06,
+      "loss": 0.2076,
+      "step": 1675
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.512653061224491e-06,
+      "loss": 0.1988,
+      "step": 1700
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.502448979591837e-06,
+      "loss": 0.2055,
+      "step": 1725
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.492244897959184e-06,
+      "loss": 0.1982,
+      "step": 1750
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.48204081632653e-06,
+      "loss": 0.2156,
+      "step": 1775
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.47183673469388e-06,
+      "loss": 0.18,
+      "step": 1800
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.461632653061225e-06,
+      "loss": 0.1985,
+      "step": 1825
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.451428571428573e-06,
+      "loss": 0.2107,
+      "step": 1850
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.44122448979592e-06,
+      "loss": 0.2168,
+      "step": 1875
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.431020408163266e-06,
+      "loss": 0.2024,
+      "step": 1900
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.420816326530613e-06,
+      "loss": 0.2318,
+      "step": 1925
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.41061224489796e-06,
+      "loss": 0.1885,
+      "step": 1950
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.400408163265307e-06,
+      "loss": 0.1939,
+      "step": 1975
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.390204081632654e-06,
+      "loss": 0.1888,
+      "step": 2000
+    },
+    {
+      "epoch": 0.07,
+      "eval_loss": 0.21315988898277283,
+      "eval_runtime": 31190.3149,
+      "eval_samples_per_second": 0.995,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.11313539592435184,
+      "step": 2000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 6.79414726656e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f77f043740c59e3f92e8854de8cbf501f8b2ebb4879d9251a07b28a085d8540
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1e2e9b2d8a6b71aca3a201dfdf9d5a8975658e82c8fdc5eb479bf91513d7de5
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:893f6b4ba91fc4613defcac59be86f805f3ce586dde326edb555f99d00c99d05
-size 10987

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc1976bb9aa3aa2282f8a4933412a747b15621808bb2de8544db13179c0b4c00
+size 17585