Training in progress, step 17000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b2828bba9c0610d92bcb9ced115dba1825e24c111402867d65a37cba2fd4cdf3
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:0afdff77222472257de0ba34c36739c26555750dfdb27e7b6f2ffed753b60d4e
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41ddc7f21fd5cb7cbeac420cbf26556fe05d0d0276c5d96c3c5d572508243cc6
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:a46b6b71b47c9b3cdde4a1d39cea580e81a6bbf969d5738793f41c7f51939ad5
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d6024b9a42abf2c5787dca8b8ac21caaa78ef8edc18fdd3f5727713a6bded2de
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:009dbf954364aba5d9d07623c2bc3be59611e798b46569f55549a02c3eabd95e
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8beddb254d719968614077f7da7885f0decec146856dee753939f87ce125fd6c
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b9006cc2f9bf0c15a1ea19a9fdf3bcc02dfdb969110e593a43ce6b82aac6cf3
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0fd534b0cae4142fc61b98b6723afbc5b4255a5022df3ad8a29653d61c4f84f8
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:3675e25dffe1ac318cb230ca76cdb84aec69a7bf2cb79f6d7b5f6265ec4df7c8
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.5553819986809677,
-  "global_step": 16000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -3990,11 +3990,260 @@
       "eval_steps_per_second": 0.063,
       "eval_wer": 0.09301142911866007,
       "step": 16000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 5.435317813248e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.5900933735985282,
+  "global_step": 17000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.063,
       "eval_wer": 0.09301142911866007,
       "step": 16000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.6677551020408162e-06,
+      "loss": 0.1708,
+      "step": 16025
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.6575510204081637e-06,
+      "loss": 0.1467,
+      "step": 16050
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.6473469387755108e-06,
+      "loss": 0.1532,
+      "step": 16075
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.6371428571428574e-06,
+      "loss": 0.1422,
+      "step": 16100
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.626938775510204e-06,
+      "loss": 0.1711,
+      "step": 16125
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.616734693877551e-06,
+      "loss": 0.1462,
+      "step": 16150
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.6065306122448986e-06,
+      "loss": 0.1686,
+      "step": 16175
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.5963265306122452e-06,
+      "loss": 0.1512,
+      "step": 16200
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.586122448979592e-06,
+      "loss": 0.1702,
+      "step": 16225
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.575918367346939e-06,
+      "loss": 0.1339,
+      "step": 16250
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 3.5657142857142864e-06,
+      "loss": 0.17,
+      "step": 16275
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.555510204081633e-06,
+      "loss": 0.1701,
+      "step": 16300
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.5453061224489797e-06,
+      "loss": 0.1606,
+      "step": 16325
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.5351020408163268e-06,
+      "loss": 0.1479,
+      "step": 16350
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.5248979591836734e-06,
+      "loss": 0.1524,
+      "step": 16375
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.514693877551021e-06,
+      "loss": 0.1392,
+      "step": 16400
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.5044897959183675e-06,
+      "loss": 0.1603,
+      "step": 16425
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.4942857142857146e-06,
+      "loss": 0.1426,
+      "step": 16450
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.4840816326530612e-06,
+      "loss": 0.1652,
+      "step": 16475
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.4738775510204087e-06,
+      "loss": 0.1475,
+      "step": 16500
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.4636734693877554e-06,
+      "loss": 0.1568,
+      "step": 16525
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 3.4534693877551024e-06,
+      "loss": 0.135,
+      "step": 16550
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.443265306122449e-06,
+      "loss": 0.1683,
+      "step": 16575
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.433061224489796e-06,
+      "loss": 0.1449,
+      "step": 16600
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.422857142857143e-06,
+      "loss": 0.1593,
+      "step": 16625
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.4126530612244902e-06,
+      "loss": 0.1336,
+      "step": 16650
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.402448979591837e-06,
+      "loss": 0.1527,
+      "step": 16675
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.392244897959184e-06,
+      "loss": 0.1499,
+      "step": 16700
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.382040816326531e-06,
+      "loss": 0.1686,
+      "step": 16725
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.371836734693878e-06,
+      "loss": 0.124,
+      "step": 16750
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.3616326530612247e-06,
+      "loss": 0.143,
+      "step": 16775
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.3514285714285718e-06,
+      "loss": 0.1338,
+      "step": 16800
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.3412244897959184e-06,
+      "loss": 0.1613,
+      "step": 16825
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.331020408163266e-06,
+      "loss": 0.1334,
+      "step": 16850
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.3208163265306125e-06,
+      "loss": 0.1633,
+      "step": 16875
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.3106122448979596e-06,
+      "loss": 0.1399,
+      "step": 16900
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.3004081632653062e-06,
+      "loss": 0.1783,
+      "step": 16925
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.2902040816326537e-06,
+      "loss": 0.1448,
+      "step": 16950
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.2800000000000004e-06,
+      "loss": 0.167,
+      "step": 16975
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 3.2697959183673474e-06,
+      "loss": 0.117,
+      "step": 17000
+    },
+    {
+      "epoch": 0.59,
+      "eval_loss": 0.16128729283809662,
+      "eval_runtime": 31248.2115,
+      "eval_samples_per_second": 0.993,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.09140322894892396,
+      "step": 17000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 5.775025176576e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41ddc7f21fd5cb7cbeac420cbf26556fe05d0d0276c5d96c3c5d572508243cc6
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:a46b6b71b47c9b3cdde4a1d39cea580e81a6bbf969d5738793f41c7f51939ad5
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:75cd60efea19799c78e56543455f4479b2c2960615ec3453f56a3b9470094bf2
-size 109957

 version https://git-lfs.github.com/spec/v1
+oid sha256:e78bc9cee84c391c8ae997316cec7200e593d160d602a2fd280af39d860d9f6a
+size 116636