Training in progress, step 250000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Nov11_11-14-20_t1v-n-088af867-w-0/events.out.tfevents.1668165319.t1v-n-088af867-w-0.346597.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c430997f3d9bb90bdeacaf02ec92c873fdfb8f77e978ff156968a6a25447c4d
 size 996067161

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d9d58b863f445cf13a128b7d68b4c52e75ea4608eed1cf7c198a1d43b0d74b8
 size 996067161

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b99e2a10bd476979b5e5acd98e23352e193709ba2af786c72d1511b539698808
 size 498046827

 version https://git-lfs.github.com/spec/v1
+oid sha256:d438b6ed8010601cc4f6b524d0b7dbe87e3bb98199e4fa9d2b4f3a42527b4aab
 size 498046827

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:16c63f8adbcfcbd82ddc15a61e6c7342c69d3cf624add0fa33065ed86a4044e7
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be1ccf49f4804619cd7d22b74b595a694a368e629a10492b4089d6536d07bdf2
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:7924e9d3f9ed054868d3ddaa60025f26707d231e7eacc5684e8550acfee9e9c0
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.2,
-  "global_step": 200000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1238,11 +1238,319 @@
       "eval_samples_per_second": 436.11,
       "eval_steps_per_second": 1.744,
       "step": 200000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 3.3697875099648e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.25,
+  "global_step": 250000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 436.11,
       "eval_steps_per_second": 1.744,
       "step": 200000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.389475079423988e-05,
+      "loss": 0.9179,
+      "step": 201000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.381533400219318e-05,
+      "loss": 0.9087,
+      "step": 202000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.373543805267368e-05,
+      "loss": 0.9254,
+      "step": 203000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.365506381941066e-05,
+      "loss": 0.9171,
+      "step": 204000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.357421218136386e-05,
+      "loss": 0.9152,
+      "step": 205000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.349288402271388e-05,
+      "loss": 0.9229,
+      "step": 206000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.341108023285238e-05,
+      "loss": 0.9087,
+      "step": 207000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.332880170637252e-05,
+      "loss": 0.9095,
+      "step": 208000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.32460493430591e-05,
+      "loss": 0.9072,
+      "step": 209000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.316282404787871e-05,
+      "loss": 0.9093,
+      "step": 210000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.30791267309698e-05,
+      "loss": 0.9148,
+      "step": 211000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.299495830763286e-05,
+      "loss": 0.9021,
+      "step": 212000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.291031969832026e-05,
+      "loss": 0.9069,
+      "step": 213000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.282521182862629e-05,
+      "loss": 0.9112,
+      "step": 214000
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 9.273963562927695e-05,
+      "loss": 0.914,
+      "step": 215000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.265359203611987e-05,
+      "loss": 0.9049,
+      "step": 216000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.256708199011401e-05,
+      "loss": 0.9117,
+      "step": 217000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.248010643731935e-05,
+      "loss": 0.9158,
+      "step": 218000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.239266632888659e-05,
+      "loss": 0.9139,
+      "step": 219000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.230476262104677e-05,
+      "loss": 0.8969,
+      "step": 220000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.221639627510076e-05,
+      "loss": 0.8961,
+      "step": 221000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.212756825740873e-05,
+      "loss": 0.8985,
+      "step": 222000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.20382795393797e-05,
+      "loss": 0.8919,
+      "step": 223000
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 9.194853109746074e-05,
+      "loss": 0.9034,
+      "step": 224000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.185832391312644e-05,
+      "loss": 0.8969,
+      "step": 225000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.176765897286813e-05,
+      "loss": 0.8996,
+      "step": 226000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.167653726818305e-05,
+      "loss": 0.8878,
+      "step": 227000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.158495979556358e-05,
+      "loss": 0.9062,
+      "step": 228000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.14929275564863e-05,
+      "loss": 0.9026,
+      "step": 229000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.140044155740101e-05,
+      "loss": 0.9016,
+      "step": 230000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.130750280971978e-05,
+      "loss": 0.9022,
+      "step": 231000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.121411232980588e-05,
+      "loss": 0.9027,
+      "step": 232000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.112027113896262e-05,
+      "loss": 0.9063,
+      "step": 233000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.102598026342222e-05,
+      "loss": 0.8991,
+      "step": 234000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 9.093124073433463e-05,
+      "loss": 0.886,
+      "step": 235000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.083605358775612e-05,
+      "loss": 0.8975,
+      "step": 236000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.074041986463808e-05,
+      "loss": 0.9021,
+      "step": 237000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.064434061081562e-05,
+      "loss": 0.8998,
+      "step": 238000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.0547816876996e-05,
+      "loss": 0.8875,
+      "step": 239000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.045084971874738e-05,
+      "loss": 0.902,
+      "step": 240000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.035344019648702e-05,
+      "loss": 0.9064,
+      "step": 241000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.025558937546988e-05,
+      "loss": 0.9044,
+      "step": 242000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.015729832577681e-05,
+      "loss": 0.9037,
+      "step": 243000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 9.005856812230304e-05,
+      "loss": 0.9025,
+      "step": 244000
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 8.995939984474624e-05,
+      "loss": 0.9233,
+      "step": 245000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.98597945775948e-05,
+      "loss": 0.8967,
+      "step": 246000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.975975341011596e-05,
+      "loss": 0.8927,
+      "step": 247000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.965927743634391e-05,
+      "loss": 0.8981,
+      "step": 248000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.955836775506776e-05,
+      "loss": 0.8957,
+      "step": 249000
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.945702546981969e-05,
+      "loss": 0.8981,
+      "step": 250000
+    },
+    {
+      "epoch": 0.25,
+      "eval_loss": 0.85121750831604,
+      "eval_runtime": 20.5031,
+      "eval_samples_per_second": 487.732,
+      "eval_steps_per_second": 1.951,
+      "step": 250000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 4.212234387456e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b99e2a10bd476979b5e5acd98e23352e193709ba2af786c72d1511b539698808
 size 498046827

 version https://git-lfs.github.com/spec/v1
+oid sha256:d438b6ed8010601cc4f6b524d0b7dbe87e3bb98199e4fa9d2b4f3a42527b4aab
 size 498046827

runs/Nov11_11-14-20_t1v-n-088af867-w-0/events.out.tfevents.1668165319.t1v-n-088af867-w-0.346597.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:428c1563898e046c157e5f0cc07d3b9c8862563202a919189836b0a1383d3e81
-size 36803

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee9cc80b61c7f028e3ce63f46e6e2ab7e275cae218d52525d9a3b4ec19abf192
+size 45079