Training in progress, step 19000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8a90d99fa5e493d103776713ee2ee6b9fca9948380c5ad509565e448a0d3c2f
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:181c2bd989506934f36609329ae3277eb855e8acf49b3c12e326fb79cb004eb3
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b690154ee77cdbea8a14f2965218b2b3790caf8955482e539a12fa93fdc53f8
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:15b5954cb47199f441cbbb70307c72621abf9248aa385660bfdb147a516624ef
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:537f8d4bc472f85d8aaced00700f04502f899659cbfa067468feee29a0f0233a
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:9460131d11a73df83270a4796c5192126900329b0b2274773520724725f4b12d
 size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90be1018263c5a8b0b93a055ffb96e8625ade303fea979c01cbf658c8aed8c95
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:f6a09c97ace5e5a49360efd6cac2da516ffa83c9ee08cb64155c59b3a316ab7a
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9205cfac3dc2d508e85efbdf6cfda796cb8dde46c8f1bd9e062253fea417d2b3
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec3490e7ac28e19432d614c125578d2d66d232f9a51b472efd2d122fe9c6b708
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.6248047485160887,
-  "global_step": 18000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4488,11 +4488,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.08993702591943148,
       "step": 18000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 6.114732539904e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.6595161234336492,
+  "global_step": 19000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.08993702591943148,
       "step": 18000
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.8514285714285715e-06,
+      "loss": 0.1658,
+      "step": 18025
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.8412244897959185e-06,
+      "loss": 0.1237,
+      "step": 18050
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.831020408163265e-06,
+      "loss": 0.1672,
+      "step": 18075
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.8208163265306127e-06,
+      "loss": 0.1319,
+      "step": 18100
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.8106122448979593e-06,
+      "loss": 0.1543,
+      "step": 18125
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.8004081632653064e-06,
+      "loss": 0.1167,
+      "step": 18150
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.790204081632653e-06,
+      "loss": 0.1708,
+      "step": 18175
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.7800000000000005e-06,
+      "loss": 0.1265,
+      "step": 18200
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.769795918367347e-06,
+      "loss": 0.1588,
+      "step": 18225
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.759591836734694e-06,
+      "loss": 0.133,
+      "step": 18250
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 2.749387755102041e-06,
+      "loss": 0.1744,
+      "step": 18275
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.739183673469388e-06,
+      "loss": 0.1305,
+      "step": 18300
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.728979591836735e-06,
+      "loss": 0.1486,
+      "step": 18325
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.718775510204082e-06,
+      "loss": 0.1379,
+      "step": 18350
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.7085714285714287e-06,
+      "loss": 0.1669,
+      "step": 18375
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.6983673469387757e-06,
+      "loss": 0.1447,
+      "step": 18400
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.6881632653061228e-06,
+      "loss": 0.1751,
+      "step": 18425
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.67795918367347e-06,
+      "loss": 0.1259,
+      "step": 18450
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.6677551020408165e-06,
+      "loss": 0.1406,
+      "step": 18475
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.6575510204081635e-06,
+      "loss": 0.1463,
+      "step": 18500
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.64734693877551e-06,
+      "loss": 0.164,
+      "step": 18525
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.6371428571428577e-06,
+      "loss": 0.1241,
+      "step": 18550
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 2.6269387755102043e-06,
+      "loss": 0.1574,
+      "step": 18575
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.6167346938775514e-06,
+      "loss": 0.1365,
+      "step": 18600
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.606530612244898e-06,
+      "loss": 0.1641,
+      "step": 18625
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.5963265306122455e-06,
+      "loss": 0.1235,
+      "step": 18650
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.586122448979592e-06,
+      "loss": 0.1604,
+      "step": 18675
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.575918367346939e-06,
+      "loss": 0.1296,
+      "step": 18700
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.565714285714286e-06,
+      "loss": 0.1757,
+      "step": 18725
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.5555102040816325e-06,
+      "loss": 0.1293,
+      "step": 18750
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.54530612244898e-06,
+      "loss": 0.1602,
+      "step": 18775
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.535102040816327e-06,
+      "loss": 0.1641,
+      "step": 18800
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.5248979591836737e-06,
+      "loss": 0.1445,
+      "step": 18825
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.5146938775510203e-06,
+      "loss": 0.1292,
+      "step": 18850
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.5044897959183678e-06,
+      "loss": 0.1642,
+      "step": 18875
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.4942857142857144e-06,
+      "loss": 0.13,
+      "step": 18900
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.4840816326530615e-06,
+      "loss": 0.1527,
+      "step": 18925
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.473877551020408e-06,
+      "loss": 0.1325,
+      "step": 18950
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.463673469387755e-06,
+      "loss": 0.1569,
+      "step": 18975
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 2.4534693877551023e-06,
+      "loss": 0.148,
+      "step": 19000
+    },
+    {
+      "epoch": 0.66,
+      "eval_loss": 0.15705841779708862,
+      "eval_runtime": 31110.7125,
+      "eval_samples_per_second": 0.998,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.08945159383534276,
+      "step": 19000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 6.454439903232e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b690154ee77cdbea8a14f2965218b2b3790caf8955482e539a12fa93fdc53f8
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:15b5954cb47199f441cbbb70307c72621abf9248aa385660bfdb147a516624ef
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:54f4f30667756976745aebfb4e84b0aa810e69c9ffaa1a0e78323a5e4c0623c1
-size 123360

 version https://git-lfs.github.com/spec/v1
+oid sha256:6547ad8d8b1ed3f418b525a96f2b38ff44683cdf8d77997c10dc189dea1b0ef9
+size 130084