Training in progress, step 2000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +253 -3
pytorch_model.bin +1 -1
runs/Aug21_16-43-21_8bad39564bfa/events.out.tfevents.1692636213.8bad39564bfa.55.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:70ac9a1100fe08433429d4ef61555e6f26a0841e2993c699bc40cef2a156d6a3
 size 1934161157

 version https://git-lfs.github.com/spec/v1
+oid sha256:06d9f310e7215fa53772a26e73c8bfe99258430f637a0e7c6a57b1411a3fc046
 size 1934161157

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74715a76afe58148a58e60fd60640fb48ee3007e4b51f3fc186ec4d3e2f6432f
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:08268c9356743b28c4219f4829b0833b9e174958fd62a1cb1e2061f4cf025441
 size 967102729

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd6139d29a3af961e597704354b793fa883745b34895fbb57194352edccac9ed
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:11dbcedeb462d624e874b21e47f755022f531a9db8eea64f2e44191aab46241b
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59963924066510fdace06e40de705170e7801273e45f984c4330d09d2783e55d
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:5cd37dd530bd467817ba99df096031e0ec04862523fd363efae5f40294a6a156
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 16.120763315294788,
   "best_model_checkpoint": "./whisper-small-vietnamese/checkpoint-1000",
-  "epoch": 2.865329512893983,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -256,11 +256,261 @@
       "eval_steps_per_second": 0.099,
       "eval_wer": 16.120763315294788,
       "step": 1000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 12,
-  "total_flos": 4.61044035551232e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 16.120763315294788,
   "best_model_checkpoint": "./whisper-small-vietnamese/checkpoint-1000",
+  "epoch": 5.730659025787966,
+  "global_step": 2000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.099,
       "eval_wer": 16.120763315294788,
       "step": 1000
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 1e-05,
+      "loss": 0.1508,
+      "step": 1025
+    },
+    {
+      "epoch": 3.01,
+      "learning_rate": 1e-05,
+      "loss": 0.1379,
+      "step": 1050
+    },
+    {
+      "epoch": 3.08,
+      "learning_rate": 1e-05,
+      "loss": 0.0688,
+      "step": 1075
+    },
+    {
+      "epoch": 3.15,
+      "learning_rate": 1e-05,
+      "loss": 0.0738,
+      "step": 1100
+    },
+    {
+      "epoch": 3.22,
+      "learning_rate": 1e-05,
+      "loss": 0.0731,
+      "step": 1125
+    },
+    {
+      "epoch": 3.3,
+      "learning_rate": 1e-05,
+      "loss": 0.0767,
+      "step": 1150
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 1e-05,
+      "loss": 0.0742,
+      "step": 1175
+    },
+    {
+      "epoch": 3.44,
+      "learning_rate": 1e-05,
+      "loss": 0.0734,
+      "step": 1200
+    },
+    {
+      "epoch": 3.51,
+      "learning_rate": 1e-05,
+      "loss": 0.0774,
+      "step": 1225
+    },
+    {
+      "epoch": 3.58,
+      "learning_rate": 1e-05,
+      "loss": 0.0738,
+      "step": 1250
+    },
+    {
+      "epoch": 3.65,
+      "learning_rate": 1e-05,
+      "loss": 0.0742,
+      "step": 1275
+    },
+    {
+      "epoch": 3.72,
+      "learning_rate": 1e-05,
+      "loss": 0.0737,
+      "step": 1300
+    },
+    {
+      "epoch": 3.8,
+      "learning_rate": 1e-05,
+      "loss": 0.0781,
+      "step": 1325
+    },
+    {
+      "epoch": 3.87,
+      "learning_rate": 1e-05,
+      "loss": 0.0741,
+      "step": 1350
+    },
+    {
+      "epoch": 3.94,
+      "learning_rate": 1e-05,
+      "loss": 0.0732,
+      "step": 1375
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 1e-05,
+      "loss": 0.0726,
+      "step": 1400
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 1e-05,
+      "loss": 0.0364,
+      "step": 1425
+    },
+    {
+      "epoch": 4.15,
+      "learning_rate": 1e-05,
+      "loss": 0.0324,
+      "step": 1450
+    },
+    {
+      "epoch": 4.23,
+      "learning_rate": 1e-05,
+      "loss": 0.0331,
+      "step": 1475
+    },
+    {
+      "epoch": 4.3,
+      "learning_rate": 1e-05,
+      "loss": 0.0339,
+      "step": 1500
+    },
+    {
+      "epoch": 4.37,
+      "learning_rate": 1e-05,
+      "loss": 0.043,
+      "step": 1525
+    },
+    {
+      "epoch": 4.44,
+      "learning_rate": 1e-05,
+      "loss": 0.0402,
+      "step": 1550
+    },
+    {
+      "epoch": 4.51,
+      "learning_rate": 1e-05,
+      "loss": 0.0359,
+      "step": 1575
+    },
+    {
+      "epoch": 4.58,
+      "learning_rate": 1e-05,
+      "loss": 0.0351,
+      "step": 1600
+    },
+    {
+      "epoch": 4.66,
+      "learning_rate": 1e-05,
+      "loss": 0.0381,
+      "step": 1625
+    },
+    {
+      "epoch": 4.73,
+      "learning_rate": 1e-05,
+      "loss": 0.0391,
+      "step": 1650
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 1e-05,
+      "loss": 0.0357,
+      "step": 1675
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 1e-05,
+      "loss": 0.0372,
+      "step": 1700
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 1e-05,
+      "loss": 0.039,
+      "step": 1725
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 1e-05,
+      "loss": 0.0318,
+      "step": 1750
+    },
+    {
+      "epoch": 5.09,
+      "learning_rate": 1e-05,
+      "loss": 0.0191,
+      "step": 1775
+    },
+    {
+      "epoch": 5.16,
+      "learning_rate": 1e-05,
+      "loss": 0.0216,
+      "step": 1800
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 1e-05,
+      "loss": 0.019,
+      "step": 1825
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 1e-05,
+      "loss": 0.0203,
+      "step": 1850
+    },
+    {
+      "epoch": 5.37,
+      "learning_rate": 1e-05,
+      "loss": 0.0198,
+      "step": 1875
+    },
+    {
+      "epoch": 5.44,
+      "learning_rate": 1e-05,
+      "loss": 0.0191,
+      "step": 1900
+    },
+    {
+      "epoch": 5.52,
+      "learning_rate": 1e-05,
+      "loss": 0.018,
+      "step": 1925
+    },
+    {
+      "epoch": 5.59,
+      "learning_rate": 1e-05,
+      "loss": 0.0198,
+      "step": 1950
+    },
+    {
+      "epoch": 5.66,
+      "learning_rate": 1e-05,
+      "loss": 0.0236,
+      "step": 1975
+    },
+    {
+      "epoch": 5.73,
+      "learning_rate": 1e-05,
+      "loss": 0.0198,
+      "step": 2000
+    },
+    {
+      "epoch": 5.73,
+      "eval_cer": 9.205097697985662,
+      "eval_loss": 0.4001982510089874,
+      "eval_runtime": 712.4165,
+      "eval_samples_per_second": 1.55,
+      "eval_steps_per_second": 0.097,
+      "eval_wer": 16.708526449341033,
+      "step": 2000
     }
   ],
   "max_steps": 4000,
   "num_train_epochs": 12,
+  "total_flos": 9.2174176862208e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74715a76afe58148a58e60fd60640fb48ee3007e4b51f3fc186ec4d3e2f6432f
 size 967102729

 version https://git-lfs.github.com/spec/v1
+oid sha256:08268c9356743b28c4219f4829b0833b9e174958fd62a1cb1e2061f4cf025441
 size 967102729

runs/Aug21_16-43-21_8bad39564bfa/events.out.tfevents.1692636213.8bad39564bfa.55.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9e663811895efe0c3519d166c491e09afc9b573b83de53f4c752fb8831083e6
-size 12494

 version https://git-lfs.github.com/spec/v1
+oid sha256:ffd7e56f2ee548b2300e461b19266ec105f9ed5c6c75687d5ded64b101777e0c
+size 19139