Training in progress, step 4000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +255 -5
pytorch_model.bin +1 -1
runs/Aug17_16-46-37_8582233f681d/events.out.tfevents.1692290809.8582233f681d.216.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a64142a477ac995752a5a07600ba81b284532e8e4d4037e38e0f8eb87ad0740
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:5948a7ee44e31ea06a7e61c4b6e04d8656f582d82f6fb80834e5461835499046
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b5e8a23f34e7b9601f22dcc073ac75de81211e5c61813bbbd64f9c96d30afbd
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4b876019bf694adee9c9238f3e1357059ae51ca004fd16638879e785129283b
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac80e31889643159eab6698b68e325c45c28c5fc3ac3d7375688097866a7d5e9
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:fea25640b33473c2c750c09b44cf70fb34a378c8114c19ff3af953a9b65fac26
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7714285e54100d4ac40dc418b750401bda88dd754c30602720da851473b84959
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:3be3e16e7a5628d50352078d8c3f4228325e660ea5cf0f4ec5b03b9a13573f4c
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 109.13163064833007,
-  "best_model_checkpoint": "./whisper-vietnamese-3/checkpoint-3000",
-  "epoch": 21.58273381294964,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -756,11 +756,261 @@
       "eval_steps_per_second": 0.122,
       "eval_wer": 109.13163064833007,
       "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 29,
-  "total_flos": 1.380967716151296e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 104.12573673870334,
+  "best_model_checkpoint": "./whisper-vietnamese-3/checkpoint-4000",
+  "epoch": 28.776978417266186,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.122,
       "eval_wer": 109.13163064833007,
       "step": 3000
+    },
+    {
+      "epoch": 21.76,
+      "learning_rate": 2.7914285714285716e-06,
+      "loss": 0.0007,
+      "step": 3025
+    },
+    {
+      "epoch": 21.94,
+      "learning_rate": 2.7200000000000002e-06,
+      "loss": 0.0008,
+      "step": 3050
+    },
+    {
+      "epoch": 22.12,
+      "learning_rate": 2.648571428571429e-06,
+      "loss": 0.0008,
+      "step": 3075
+    },
+    {
+      "epoch": 22.3,
+      "learning_rate": 2.5771428571428574e-06,
+      "loss": 0.0008,
+      "step": 3100
+    },
+    {
+      "epoch": 22.48,
+      "learning_rate": 2.5057142857142856e-06,
+      "loss": 0.0007,
+      "step": 3125
+    },
+    {
+      "epoch": 22.66,
+      "learning_rate": 2.4342857142857146e-06,
+      "loss": 0.0007,
+      "step": 3150
+    },
+    {
+      "epoch": 22.84,
+      "learning_rate": 2.362857142857143e-06,
+      "loss": 0.0007,
+      "step": 3175
+    },
+    {
+      "epoch": 23.02,
+      "learning_rate": 2.2914285714285718e-06,
+      "loss": 0.0008,
+      "step": 3200
+    },
+    {
+      "epoch": 23.2,
+      "learning_rate": 2.2200000000000003e-06,
+      "loss": 0.0007,
+      "step": 3225
+    },
+    {
+      "epoch": 23.38,
+      "learning_rate": 2.148571428571429e-06,
+      "loss": 0.0007,
+      "step": 3250
+    },
+    {
+      "epoch": 23.56,
+      "learning_rate": 2.077142857142857e-06,
+      "loss": 0.0007,
+      "step": 3275
+    },
+    {
+      "epoch": 23.74,
+      "learning_rate": 2.0057142857142857e-06,
+      "loss": 0.0007,
+      "step": 3300
+    },
+    {
+      "epoch": 23.92,
+      "learning_rate": 1.9342857142857143e-06,
+      "loss": 0.0007,
+      "step": 3325
+    },
+    {
+      "epoch": 24.1,
+      "learning_rate": 1.8628571428571429e-06,
+      "loss": 0.0007,
+      "step": 3350
+    },
+    {
+      "epoch": 24.28,
+      "learning_rate": 1.7914285714285715e-06,
+      "loss": 0.0007,
+      "step": 3375
+    },
+    {
+      "epoch": 24.46,
+      "learning_rate": 1.72e-06,
+      "loss": 0.0006,
+      "step": 3400
+    },
+    {
+      "epoch": 24.64,
+      "learning_rate": 1.6485714285714289e-06,
+      "loss": 0.0006,
+      "step": 3425
+    },
+    {
+      "epoch": 24.82,
+      "learning_rate": 1.5771428571428574e-06,
+      "loss": 0.0006,
+      "step": 3450
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 1.5057142857142858e-06,
+      "loss": 0.0006,
+      "step": 3475
+    },
+    {
+      "epoch": 25.18,
+      "learning_rate": 1.4342857142857144e-06,
+      "loss": 0.0007,
+      "step": 3500
+    },
+    {
+      "epoch": 25.36,
+      "learning_rate": 1.362857142857143e-06,
+      "loss": 0.0006,
+      "step": 3525
+    },
+    {
+      "epoch": 25.54,
+      "learning_rate": 1.2914285714285716e-06,
+      "loss": 0.0006,
+      "step": 3550
+    },
+    {
+      "epoch": 25.72,
+      "learning_rate": 1.2200000000000002e-06,
+      "loss": 0.0006,
+      "step": 3575
+    },
+    {
+      "epoch": 25.9,
+      "learning_rate": 1.1485714285714286e-06,
+      "loss": 0.0006,
+      "step": 3600
+    },
+    {
+      "epoch": 26.08,
+      "learning_rate": 1.0771428571428574e-06,
+      "loss": 0.0006,
+      "step": 3625
+    },
+    {
+      "epoch": 26.26,
+      "learning_rate": 1.0057142857142857e-06,
+      "loss": 0.0006,
+      "step": 3650
+    },
+    {
+      "epoch": 26.44,
+      "learning_rate": 9.342857142857144e-07,
+      "loss": 0.0006,
+      "step": 3675
+    },
+    {
+      "epoch": 26.62,
+      "learning_rate": 8.628571428571429e-07,
+      "loss": 0.0006,
+      "step": 3700
+    },
+    {
+      "epoch": 26.8,
+      "learning_rate": 7.914285714285715e-07,
+      "loss": 0.0006,
+      "step": 3725
+    },
+    {
+      "epoch": 26.98,
+      "learning_rate": 7.2e-07,
+      "loss": 0.0007,
+      "step": 3750
+    },
+    {
+      "epoch": 27.16,
+      "learning_rate": 6.485714285714287e-07,
+      "loss": 0.0006,
+      "step": 3775
+    },
+    {
+      "epoch": 27.34,
+      "learning_rate": 5.771428571428572e-07,
+      "loss": 0.0006,
+      "step": 3800
+    },
+    {
+      "epoch": 27.52,
+      "learning_rate": 5.057142857142858e-07,
+      "loss": 0.0006,
+      "step": 3825
+    },
+    {
+      "epoch": 27.7,
+      "learning_rate": 4.342857142857143e-07,
+      "loss": 0.0006,
+      "step": 3850
+    },
+    {
+      "epoch": 27.88,
+      "learning_rate": 3.6285714285714283e-07,
+      "loss": 0.0006,
+      "step": 3875
+    },
+    {
+      "epoch": 28.06,
+      "learning_rate": 2.914285714285715e-07,
+      "loss": 0.0006,
+      "step": 3900
+    },
+    {
+      "epoch": 28.24,
+      "learning_rate": 2.2e-07,
+      "loss": 0.0006,
+      "step": 3925
+    },
+    {
+      "epoch": 28.42,
+      "learning_rate": 1.4857142857142857e-07,
+      "loss": 0.0006,
+      "step": 3950
+    },
+    {
+      "epoch": 28.6,
+      "learning_rate": 7.714285714285715e-08,
+      "loss": 0.0006,
+      "step": 3975
+    },
+    {
+      "epoch": 28.78,
+      "learning_rate": 5.714285714285715e-09,
+      "loss": 0.0006,
+      "step": 4000
+    },
+    {
+      "epoch": 28.78,
+      "eval_cer": 100.82641572223558,
+      "eval_loss": 0.6164063811302185,
+      "eval_runtime": 252.3206,
+      "eval_samples_per_second": 0.979,
+      "eval_steps_per_second": 0.123,
+      "eval_wer": 104.12573673870334,
+      "step": 4000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 29,
+  "total_flos": 1.841290288201728e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b5e8a23f34e7b9601f22dcc073ac75de81211e5c61813bbbd64f9c96d30afbd
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4b876019bf694adee9c9238f3e1357059ae51ca004fd16638879e785129283b
 size 967102729

runs/Aug17_16-46-37_8582233f681d/events.out.tfevents.1692290809.8582233f681d.216.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c280ec21aa54cf98fe2a2c7712a454106a1a24645c93578c704ad15b98de349
-size 24821

 version https://git-lfs.github.com/spec/v1
+oid sha256:888a1289dfa30d5e985b32553043fa759e533438856c0461c16f165bcba19c46
+size 31466