Training in progress, step 3000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +255 -5
pytorch_model.bin +1 -1
runs/Aug21_16-43-21_8bad39564bfa/events.out.tfevents.1692636213.8bad39564bfa.55.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06d9f310e7215fa53772a26e73c8bfe99258430f637a0e7c6a57b1411a3fc046
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:e7cf542d1162861a412322de0843a71f9b7d2a2491fed87f740beafd324feb87
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08268c9356743b28c4219f4829b0833b9e174958fd62a1cb1e2061f4cf025441
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:3aed36cd0774277c3bc7d2577938faa840a081b7219a5939e6d8e3f7908a9e51
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:11dbcedeb462d624e874b21e47f755022f531a9db8eea64f2e44191aab46241b
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:85dcd9588829e28a34b471fbefe47c5b729c37261cb017e050a2c52e69019df0
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5cd37dd530bd467817ba99df096031e0ec04862523fd363efae5f40294a6a156
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:f375f0ec2d81d3bc0adbea21cfba80dd771ec303d1e16586405d497868a3b309
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 16.120763315294788,
-  "best_model_checkpoint": "./whisper-small-vietnamese/checkpoint-1000",
-  "epoch": 5.730659025787966,
-  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -506,11 +506,261 @@
       "eval_steps_per_second": 0.097,
       "eval_wer": 16.708526449341033,
       "step": 2000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 12,
-  "total_flos": 9.2174176862208e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 15.545946505787006,
+  "best_model_checkpoint": "./whisper-small-vietnamese/checkpoint-3000",
+  "epoch": 8.595988538681949,
+  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.097,
       "eval_wer": 16.708526449341033,
       "step": 2000
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 1e-05,
+      "loss": 0.0201,
+      "step": 2025
+    },
+    {
+      "epoch": 5.87,
+      "learning_rate": 1e-05,
+      "loss": 0.0236,
+      "step": 2050
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 1e-05,
+      "loss": 0.0199,
+      "step": 2075
+    },
+    {
+      "epoch": 6.02,
+      "learning_rate": 1e-05,
+      "loss": 0.0175,
+      "step": 2100
+    },
+    {
+      "epoch": 6.09,
+      "learning_rate": 1e-05,
+      "loss": 0.0115,
+      "step": 2125
+    },
+    {
+      "epoch": 6.16,
+      "learning_rate": 1e-05,
+      "loss": 0.0111,
+      "step": 2150
+    },
+    {
+      "epoch": 6.23,
+      "learning_rate": 1e-05,
+      "loss": 0.011,
+      "step": 2175
+    },
+    {
+      "epoch": 6.3,
+      "learning_rate": 1e-05,
+      "loss": 0.0108,
+      "step": 2200
+    },
+    {
+      "epoch": 6.38,
+      "learning_rate": 1e-05,
+      "loss": 0.0133,
+      "step": 2225
+    },
+    {
+      "epoch": 6.45,
+      "learning_rate": 1e-05,
+      "loss": 0.0093,
+      "step": 2250
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 1e-05,
+      "loss": 0.0114,
+      "step": 2275
+    },
+    {
+      "epoch": 6.59,
+      "learning_rate": 1e-05,
+      "loss": 0.012,
+      "step": 2300
+    },
+    {
+      "epoch": 6.66,
+      "learning_rate": 1e-05,
+      "loss": 0.0103,
+      "step": 2325
+    },
+    {
+      "epoch": 6.73,
+      "learning_rate": 1e-05,
+      "loss": 0.0142,
+      "step": 2350
+    },
+    {
+      "epoch": 6.81,
+      "learning_rate": 1e-05,
+      "loss": 0.0115,
+      "step": 2375
+    },
+    {
+      "epoch": 6.88,
+      "learning_rate": 1e-05,
+      "loss": 0.0117,
+      "step": 2400
+    },
+    {
+      "epoch": 6.95,
+      "learning_rate": 1e-05,
+      "loss": 0.0156,
+      "step": 2425
+    },
+    {
+      "epoch": 7.02,
+      "learning_rate": 1e-05,
+      "loss": 0.0124,
+      "step": 2450
+    },
+    {
+      "epoch": 7.09,
+      "learning_rate": 1e-05,
+      "loss": 0.0077,
+      "step": 2475
+    },
+    {
+      "epoch": 7.16,
+      "learning_rate": 1e-05,
+      "loss": 0.0075,
+      "step": 2500
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 1e-05,
+      "loss": 0.0097,
+      "step": 2525
+    },
+    {
+      "epoch": 7.31,
+      "learning_rate": 1e-05,
+      "loss": 0.009,
+      "step": 2550
+    },
+    {
+      "epoch": 7.38,
+      "learning_rate": 1e-05,
+      "loss": 0.0081,
+      "step": 2575
+    },
+    {
+      "epoch": 7.45,
+      "learning_rate": 1e-05,
+      "loss": 0.0076,
+      "step": 2600
+    },
+    {
+      "epoch": 7.52,
+      "learning_rate": 1e-05,
+      "loss": 0.0079,
+      "step": 2625
+    },
+    {
+      "epoch": 7.59,
+      "learning_rate": 1e-05,
+      "loss": 0.0093,
+      "step": 2650
+    },
+    {
+      "epoch": 7.66,
+      "learning_rate": 1e-05,
+      "loss": 0.0086,
+      "step": 2675
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 1e-05,
+      "loss": 0.0093,
+      "step": 2700
+    },
+    {
+      "epoch": 7.81,
+      "learning_rate": 1e-05,
+      "loss": 0.009,
+      "step": 2725
+    },
+    {
+      "epoch": 7.88,
+      "learning_rate": 1e-05,
+      "loss": 0.0093,
+      "step": 2750
+    },
+    {
+      "epoch": 7.95,
+      "learning_rate": 1e-05,
+      "loss": 0.0085,
+      "step": 2775
+    },
+    {
+      "epoch": 8.02,
+      "learning_rate": 1e-05,
+      "loss": 0.0076,
+      "step": 2800
+    },
+    {
+      "epoch": 8.09,
+      "learning_rate": 1e-05,
+      "loss": 0.0055,
+      "step": 2825
+    },
+    {
+      "epoch": 8.17,
+      "learning_rate": 1e-05,
+      "loss": 0.0049,
+      "step": 2850
+    },
+    {
+      "epoch": 8.24,
+      "learning_rate": 1e-05,
+      "loss": 0.0055,
+      "step": 2875
+    },
+    {
+      "epoch": 8.31,
+      "learning_rate": 1e-05,
+      "loss": 0.0063,
+      "step": 2900
+    },
+    {
+      "epoch": 8.38,
+      "learning_rate": 1e-05,
+      "loss": 0.0078,
+      "step": 2925
+    },
+    {
+      "epoch": 8.45,
+      "learning_rate": 1e-05,
+      "loss": 0.0069,
+      "step": 2950
+    },
+    {
+      "epoch": 8.52,
+      "learning_rate": 1e-05,
+      "loss": 0.0063,
+      "step": 2975
+    },
+    {
+      "epoch": 8.6,
+      "learning_rate": 1e-05,
+      "loss": 0.0059,
+      "step": 3000
+    },
+    {
+      "epoch": 8.6,
+      "eval_cer": 8.218942932064238,
+      "eval_loss": 0.4233042001724243,
+      "eval_runtime": 697.1158,
+      "eval_samples_per_second": 1.584,
+      "eval_steps_per_second": 0.099,
+      "eval_wer": 15.545946505787006,
+      "step": 3000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 12,
+  "total_flos": 1.382439501692928e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08268c9356743b28c4219f4829b0833b9e174958fd62a1cb1e2061f4cf025441
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:3aed36cd0774277c3bc7d2577938faa840a081b7219a5939e6d8e3f7908a9e51
 size 967102729

runs/Aug21_16-43-21_8bad39564bfa/events.out.tfevents.1692636213.8bad39564bfa.55.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffd7e56f2ee548b2300e461b19266ec105f9ed5c6c75687d5ded64b101777e0c
-size 19139

 version https://git-lfs.github.com/spec/v1
+oid sha256:234771433c64a48dbfa61992972eca3ff4220b661982fa138194e7c8a3af2d0e
+size 25784