Training in progress, step 100000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Feb06_07-50-48_t1v-n-ddbbc52f-w-0/events.out.tfevents.1675669872.t1v-n-ddbbc52f-w-0.12174.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c3eaddf7efc56544567f4a4183997b8e54e580c56d9a9067098902fce85030eb
-size 885324633

 version https://git-lfs.github.com/spec/v1
+oid sha256:d7de678e3eb4316d13ed15337255de818fcba19dc468fc2e664978fa5840e0f6
+size 885325017

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb52a91ca7db3e27020e977bb9700207dd283e260489890071175dacdc1c8848
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:fff60c38fbce30a0d0970841e11987d536dd4e121b40c196a768bef52288bf27
 size 442675755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74107da37598d5bb6bc779934fa91686ae3470dc25d0f1b64c3fe18e46a365d1
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:feaad036623e0818c278e7df0b8c3dc501e6b5b74f677795a14ca972139ab142
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4eda5fed79fbfae57d1a589b135999ab70f7c329a9938c428058fd62dc77c658
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:4178362c6bd24374be7907f1b74df811389bf304534a9b4cb11df3bada4d661b
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 12.00088,
-  "global_step": 50000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -314,11 +314,319 @@
       "eval_samples_per_second": 266.161,
       "eval_steps_per_second": 2.129,
       "step": 50000
     }
   ],
   "max_steps": 200000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 8.422699302912e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 24.00176,
+  "global_step": 100000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 266.161,
       "eval_steps_per_second": 2.129,
       "step": 50000
+    },
+    {
+      "epoch": 12.01,
+      "learning_rate": 8.894386393810563e-05,
+      "loss": 0.8543,
+      "step": 51000
+    },
+    {
+      "epoch": 12.01,
+      "learning_rate": 8.842005554284296e-05,
+      "loss": 0.7843,
+      "step": 52000
+    },
+    {
+      "epoch": 12.02,
+      "learning_rate": 8.788574348801675e-05,
+      "loss": 0.7706,
+      "step": 53000
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 8.73410738492077e-05,
+      "loss": 0.8663,
+      "step": 54000
+    },
+    {
+      "epoch": 13.01,
+      "learning_rate": 8.678619553365659e-05,
+      "loss": 0.8679,
+      "step": 55000
+    },
+    {
+      "epoch": 13.01,
+      "learning_rate": 8.622126023955446e-05,
+      "loss": 0.7686,
+      "step": 56000
+    },
+    {
+      "epoch": 13.02,
+      "learning_rate": 8.564642241456986e-05,
+      "loss": 0.7342,
+      "step": 57000
+    },
+    {
+      "epoch": 13.02,
+      "learning_rate": 8.506183921362443e-05,
+      "loss": 0.8567,
+      "step": 58000
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 8.44676704559283e-05,
+      "loss": 0.86,
+      "step": 59000
+    },
+    {
+      "epoch": 14.01,
+      "learning_rate": 8.386407858128706e-05,
+      "loss": 0.777,
+      "step": 60000
+    },
+    {
+      "epoch": 14.01,
+      "learning_rate": 8.32512286056924e-05,
+      "loss": 0.7027,
+      "step": 61000
+    },
+    {
+      "epoch": 14.02,
+      "learning_rate": 8.262928807620843e-05,
+      "loss": 0.8554,
+      "step": 62000
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 8.199842702516583e-05,
+      "loss": 0.8428,
+      "step": 63000
+    },
+    {
+      "epoch": 15.01,
+      "learning_rate": 8.135881792367686e-05,
+      "loss": 0.7819,
+      "step": 64000
+    },
+    {
+      "epoch": 15.01,
+      "learning_rate": 8.07106356344834e-05,
+      "loss": 0.6988,
+      "step": 65000
+    },
+    {
+      "epoch": 15.02,
+      "learning_rate": 8.005405736415126e-05,
+      "loss": 0.8313,
+      "step": 66000
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 7.938926261462366e-05,
+      "loss": 0.823,
+      "step": 67000
+    },
+    {
+      "epoch": 16.01,
+      "learning_rate": 7.871643313414718e-05,
+      "loss": 0.7899,
+      "step": 68000
+    },
+    {
+      "epoch": 16.01,
+      "learning_rate": 7.803575286758364e-05,
+      "loss": 0.7085,
+      "step": 69000
+    },
+    {
+      "epoch": 16.02,
+      "learning_rate": 7.734740790612136e-05,
+      "loss": 0.7936,
+      "step": 70000
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 7.66515864363997e-05,
+      "loss": 0.8175,
+      "step": 71000
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 7.594847868906076e-05,
+      "loss": 0.8032,
+      "step": 72000
+    },
+    {
+      "epoch": 17.01,
+      "learning_rate": 7.52382768867422e-05,
+      "loss": 0.7058,
+      "step": 73000
+    },
+    {
+      "epoch": 17.02,
+      "learning_rate": 7.452117519152542e-05,
+      "loss": 0.762,
+      "step": 74000
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 7.379736965185368e-05,
+      "loss": 0.8109,
+      "step": 75000
+    },
+    {
+      "epoch": 18.01,
+      "learning_rate": 7.30670581489344e-05,
+      "loss": 0.7983,
+      "step": 76000
+    },
+    {
+      "epoch": 18.01,
+      "learning_rate": 7.233044034264034e-05,
+      "loss": 0.7184,
+      "step": 77000
+    },
+    {
+      "epoch": 18.02,
+      "learning_rate": 7.158771761692464e-05,
+      "loss": 0.7324,
+      "step": 78000
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 7.083909302476453e-05,
+      "loss": 0.8052,
+      "step": 79000
+    },
+    {
+      "epoch": 19.01,
+      "learning_rate": 7.008477123264848e-05,
+      "loss": 0.7942,
+      "step": 80000
+    },
+    {
+      "epoch": 19.01,
+      "learning_rate": 6.932495846462261e-05,
+      "loss": 0.728,
+      "step": 81000
+    },
+    {
+      "epoch": 19.02,
+      "learning_rate": 6.855986244591104e-05,
+      "loss": 0.7019,
+      "step": 82000
+    },
+    {
+      "epoch": 19.02,
+      "learning_rate": 6.778969234612584e-05,
+      "loss": 0.8063,
+      "step": 83000
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 6.701465872208216e-05,
+      "loss": 0.8064,
+      "step": 84000
+    },
+    {
+      "epoch": 20.01,
+      "learning_rate": 6.623497346023418e-05,
+      "loss": 0.7211,
+      "step": 85000
+    },
+    {
+      "epoch": 20.01,
+      "learning_rate": 6.545084971874738e-05,
+      "loss": 0.6696,
+      "step": 86000
+    },
+    {
+      "epoch": 20.02,
+      "learning_rate": 6.466250186922325e-05,
+      "loss": 0.804,
+      "step": 87000
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 6.387014543809223e-05,
+      "loss": 0.7977,
+      "step": 88000
+    },
+    {
+      "epoch": 21.01,
+      "learning_rate": 6.307399704769099e-05,
+      "loss": 0.7326,
+      "step": 89000
+    },
+    {
+      "epoch": 21.01,
+      "learning_rate": 6.227427435703997e-05,
+      "loss": 0.6482,
+      "step": 90000
+    },
+    {
+      "epoch": 21.02,
+      "learning_rate": 6.147119600233758e-05,
+      "loss": 0.806,
+      "step": 91000
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 6.066498153718735e-05,
+      "loss": 0.7806,
+      "step": 92000
+    },
+    {
+      "epoch": 22.01,
+      "learning_rate": 5.985585137257401e-05,
+      "loss": 0.7416,
+      "step": 93000
+    },
+    {
+      "epoch": 22.01,
+      "learning_rate": 5.90440267166055e-05,
+      "loss": 0.6584,
+      "step": 94000
+    },
+    {
+      "epoch": 22.02,
+      "learning_rate": 5.8229729514036705e-05,
+      "loss": 0.7708,
+      "step": 95000
+    },
+    {
+      "epoch": 23.0,
+      "learning_rate": 5.74131823855921e-05,
+      "loss": 0.7716,
+      "step": 96000
+    },
+    {
+      "epoch": 23.01,
+      "learning_rate": 5.6594608567103456e-05,
+      "loss": 0.7505,
+      "step": 97000
+    },
+    {
+      "epoch": 23.01,
+      "learning_rate": 5.577423184847932e-05,
+      "loss": 0.6682,
+      "step": 98000
+    },
+    {
+      "epoch": 23.02,
+      "learning_rate": 5.495227651252315e-05,
+      "loss": 0.7379,
+      "step": 99000
+    },
+    {
+      "epoch": 24.0,
+      "learning_rate": 5.4128967273616625e-05,
+      "loss": 0.7713,
+      "step": 100000
+    },
+    {
+      "epoch": 24.0,
+      "eval_loss": 0.5763441324234009,
+      "eval_runtime": 12.9231,
+      "eval_samples_per_second": 386.903,
+      "eval_steps_per_second": 3.095,
+      "step": 100000
     }
   ],
   "max_steps": 200000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 1.6845398605824e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb52a91ca7db3e27020e977bb9700207dd283e260489890071175dacdc1c8848
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:fff60c38fbce30a0d0970841e11987d536dd4e121b40c196a768bef52288bf27
 size 442675755

runs/Feb06_07-50-48_t1v-n-ddbbc52f-w-0/events.out.tfevents.1675669872.t1v-n-ddbbc52f-w-0.12174.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c9758eb216b80b50235c6989c71649acb88c175ac64acf9b4cea9a088763523b
-size 11998

 version https://git-lfs.github.com/spec/v1
+oid sha256:c703b616824f0a6fdb8ae91d275f2d3277c3eb20d53e9d923ddec1d24b229ac9
+size 20274