Training in progress, step 4000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +253 -3
pytorch_model.bin +1 -1
runs/Aug21_16-43-21_8bad39564bfa/events.out.tfevents.1692636213.8bad39564bfa.55.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e7cf542d1162861a412322de0843a71f9b7d2a2491fed87f740beafd324feb87
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:907aac9c83b6b79968f0febc00dccd07a40b6d1fda09d66dc7fb8b344f3335d8
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3aed36cd0774277c3bc7d2577938faa840a081b7219a5939e6d8e3f7908a9e51
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:9444715d1c7dae1eff48b8c035739bfd6101a03c0047cdb26f72b4f864a81984
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85dcd9588829e28a34b471fbefe47c5b729c37261cb017e050a2c52e69019df0
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bd79c6dc311729172b27086764740160249cf885002e068daabb1df29b526ba
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f375f0ec2d81d3bc0adbea21cfba80dd771ec303d1e16586405d497868a3b309
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:c05c5f02f34690b6cdc36257cc6f4b53027dee7ea004e5e07023153262401341
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 15.545946505787006,
   "best_model_checkpoint": "./whisper-small-vietnamese/checkpoint-3000",
-  "epoch": 8.595988538681949,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -756,11 +756,261 @@
       "eval_steps_per_second": 0.099,
       "eval_wer": 15.545946505787006,
       "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 12,
-  "total_flos": 1.382439501692928e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 15.545946505787006,
   "best_model_checkpoint": "./whisper-small-vietnamese/checkpoint-3000",
+  "epoch": 11.461318051575931,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.099,
       "eval_wer": 15.545946505787006,
       "step": 3000
+    },
+    {
+      "epoch": 8.67,
+      "learning_rate": 1e-05,
+      "loss": 0.0065,
+      "step": 3025
+    },
+    {
+      "epoch": 8.74,
+      "learning_rate": 1e-05,
+      "loss": 0.0068,
+      "step": 3050
+    },
+    {
+      "epoch": 8.81,
+      "learning_rate": 1e-05,
+      "loss": 0.0058,
+      "step": 3075
+    },
+    {
+      "epoch": 8.88,
+      "learning_rate": 1e-05,
+      "loss": 0.0066,
+      "step": 3100
+    },
+    {
+      "epoch": 8.95,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3125
+    },
+    {
+      "epoch": 9.03,
+      "learning_rate": 1e-05,
+      "loss": 0.0041,
+      "step": 3150
+    },
+    {
+      "epoch": 9.1,
+      "learning_rate": 1e-05,
+      "loss": 0.0049,
+      "step": 3175
+    },
+    {
+      "epoch": 9.17,
+      "learning_rate": 1e-05,
+      "loss": 0.0049,
+      "step": 3200
+    },
+    {
+      "epoch": 9.24,
+      "learning_rate": 1e-05,
+      "loss": 0.0063,
+      "step": 3225
+    },
+    {
+      "epoch": 9.31,
+      "learning_rate": 1e-05,
+      "loss": 0.0059,
+      "step": 3250
+    },
+    {
+      "epoch": 9.38,
+      "learning_rate": 1e-05,
+      "loss": 0.0051,
+      "step": 3275
+    },
+    {
+      "epoch": 9.46,
+      "learning_rate": 1e-05,
+      "loss": 0.0053,
+      "step": 3300
+    },
+    {
+      "epoch": 9.53,
+      "learning_rate": 1e-05,
+      "loss": 0.0052,
+      "step": 3325
+    },
+    {
+      "epoch": 9.6,
+      "learning_rate": 1e-05,
+      "loss": 0.005,
+      "step": 3350
+    },
+    {
+      "epoch": 9.67,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3375
+    },
+    {
+      "epoch": 9.74,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3400
+    },
+    {
+      "epoch": 9.81,
+      "learning_rate": 1e-05,
+      "loss": 0.0049,
+      "step": 3425
+    },
+    {
+      "epoch": 9.89,
+      "learning_rate": 1e-05,
+      "loss": 0.006,
+      "step": 3450
+    },
+    {
+      "epoch": 9.96,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3475
+    },
+    {
+      "epoch": 10.03,
+      "learning_rate": 1e-05,
+      "loss": 0.0059,
+      "step": 3500
+    },
+    {
+      "epoch": 10.1,
+      "learning_rate": 1e-05,
+      "loss": 0.0044,
+      "step": 3525
+    },
+    {
+      "epoch": 10.17,
+      "learning_rate": 1e-05,
+      "loss": 0.0034,
+      "step": 3550
+    },
+    {
+      "epoch": 10.24,
+      "learning_rate": 1e-05,
+      "loss": 0.004,
+      "step": 3575
+    },
+    {
+      "epoch": 10.32,
+      "learning_rate": 1e-05,
+      "loss": 0.0048,
+      "step": 3600
+    },
+    {
+      "epoch": 10.39,
+      "learning_rate": 1e-05,
+      "loss": 0.0029,
+      "step": 3625
+    },
+    {
+      "epoch": 10.46,
+      "learning_rate": 1e-05,
+      "loss": 0.0039,
+      "step": 3650
+    },
+    {
+      "epoch": 10.53,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3675
+    },
+    {
+      "epoch": 10.6,
+      "learning_rate": 1e-05,
+      "loss": 0.0048,
+      "step": 3700
+    },
+    {
+      "epoch": 10.67,
+      "learning_rate": 1e-05,
+      "loss": 0.0036,
+      "step": 3725
+    },
+    {
+      "epoch": 10.74,
+      "learning_rate": 1e-05,
+      "loss": 0.0036,
+      "step": 3750
+    },
+    {
+      "epoch": 10.82,
+      "learning_rate": 1e-05,
+      "loss": 0.0065,
+      "step": 3775
+    },
+    {
+      "epoch": 10.89,
+      "learning_rate": 1e-05,
+      "loss": 0.0052,
+      "step": 3800
+    },
+    {
+      "epoch": 10.96,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3825
+    },
+    {
+      "epoch": 11.03,
+      "learning_rate": 1e-05,
+      "loss": 0.0044,
+      "step": 3850
+    },
+    {
+      "epoch": 11.1,
+      "learning_rate": 1e-05,
+      "loss": 0.0045,
+      "step": 3875
+    },
+    {
+      "epoch": 11.17,
+      "learning_rate": 1e-05,
+      "loss": 0.0047,
+      "step": 3900
+    },
+    {
+      "epoch": 11.25,
+      "learning_rate": 1e-05,
+      "loss": 0.0043,
+      "step": 3925
+    },
+    {
+      "epoch": 11.32,
+      "learning_rate": 1e-05,
+      "loss": 0.006,
+      "step": 3950
+    },
+    {
+      "epoch": 11.39,
+      "learning_rate": 1e-05,
+      "loss": 0.0062,
+      "step": 3975
+    },
+    {
+      "epoch": 11.46,
+      "learning_rate": 1e-05,
+      "loss": 0.0049,
+      "step": 4000
+    },
+    {
+      "epoch": 11.46,
+      "eval_cer": 8.560486329385162,
+      "eval_loss": 0.4479295611381531,
+      "eval_runtime": 720.058,
+      "eval_samples_per_second": 1.533,
+      "eval_steps_per_second": 0.096,
+      "eval_wer": 16.030139043525544,
+      "step": 4000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 12,
+  "total_flos": 1.843137234763776e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3aed36cd0774277c3bc7d2577938faa840a081b7219a5939e6d8e3f7908a9e51
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:9444715d1c7dae1eff48b8c035739bfd6101a03c0047cdb26f72b4f864a81984
 size 967102729

runs/Aug21_16-43-21_8bad39564bfa/events.out.tfevents.1692636213.8bad39564bfa.55.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:234771433c64a48dbfa61992972eca3ff4220b661982fa138194e7c8a3af2d0e
-size 25784

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe6648219f404076f6212b04fb8698ba6bf20f93c3762bb341e6a10a29c6ad1a
+size 32429