Training in progress, step 350000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Dec28_00-25-33_t1v-n-07cfb9e3-w-0/events.out.tfevents.1672187175.t1v-n-07cfb9e3-w-0.13817.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ece6fbc9b8237ac29daa64e9c07ae9fc87587d512b4405d59f0b59fee71d402
 size 1475917081

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c52232d11fb22065b9a1764d40fd5ebc0893be5c54f7d94fbb3c44304df71d5
 size 1475917081

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:95da880ddfc7c5a94fe9f64885985df1592401d4e712cee7ee0e2954be511def
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd6069e422d2b3d5dfffd698b2b7e4ffabc9afe2433ba9e17ada2dfe9b3bb50b
 size 737971755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78957a8e67c10188ecbf7b87fac550a5e15834a1bedab06244fbfd096963cc82
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b28f2cdb609abd729db42c9ade49e27af98a9184885aa5352dade81369f5a52c
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d41c6734c2aef1f60ed0fbc886cbc351448520889799ebfa66c14f8f9e99059
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8f220426de5a076dbb6f66f54955d3a3fc0acbab10b1bd60cf9472b552bfdca
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.3,
-  "global_step": 300000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1854,11 +1854,319 @@
       "eval_samples_per_second": 306.526,
       "eval_steps_per_second": 2.452,
       "step": 300000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 5.0592818921472e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.35,
+  "global_step": 350000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 306.526,
       "eval_steps_per_second": 2.452,
       "step": 300000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 8.37422439088976e-05,
+      "loss": 0.8761,
+      "step": 301000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 8.362004023673474e-05,
+      "loss": 0.8332,
+      "step": 302000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 8.349746890119826e-05,
+      "loss": 0.8323,
+      "step": 303000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 8.337453124270863e-05,
+      "loss": 0.8263,
+      "step": 304000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 8.32512286056924e-05,
+      "loss": 0.8849,
+      "step": 305000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.31275623385675e-05,
+      "loss": 0.836,
+      "step": 306000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.300353379372834e-05,
+      "loss": 0.7309,
+      "step": 307000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.287914432753123e-05,
+      "loss": 0.8178,
+      "step": 308000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.275439530027948e-05,
+      "loss": 0.8386,
+      "step": 309000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.262928807620843e-05,
+      "loss": 0.8499,
+      "step": 310000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.250382402347065e-05,
+      "loss": 0.8717,
+      "step": 311000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.237800451412095e-05,
+      "loss": 0.8789,
+      "step": 312000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.225183092410128e-05,
+      "loss": 0.84,
+      "step": 313000
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 8.212530463322583e-05,
+      "loss": 0.8335,
+      "step": 314000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.199842702516583e-05,
+      "loss": 0.8586,
+      "step": 315000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.18711994874345e-05,
+      "loss": 0.8505,
+      "step": 316000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.174362341137177e-05,
+      "loss": 0.7487,
+      "step": 317000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.161570019212921e-05,
+      "loss": 0.7956,
+      "step": 318000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.148743122865463e-05,
+      "loss": 0.8061,
+      "step": 319000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.135881792367686e-05,
+      "loss": 0.8592,
+      "step": 320000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.12298616836904e-05,
+      "loss": 0.8756,
+      "step": 321000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.110056391894005e-05,
+      "loss": 0.8483,
+      "step": 322000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.097092604340542e-05,
+      "loss": 0.8791,
+      "step": 323000
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 8.084094947478556e-05,
+      "loss": 0.8753,
+      "step": 324000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 8.07106356344834e-05,
+      "loss": 0.9062,
+      "step": 325000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 8.057998594759022e-05,
+      "loss": 0.9046,
+      "step": 326000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 8.044900184287007e-05,
+      "loss": 0.8811,
+      "step": 327000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 8.031768475274413e-05,
+      "loss": 0.7818,
+      "step": 328000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 8.018603611327504e-05,
+      "loss": 0.8072,
+      "step": 329000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 8.005405736415126e-05,
+      "loss": 0.8352,
+      "step": 330000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 7.992174994867123e-05,
+      "loss": 0.8794,
+      "step": 331000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 7.978911531372765e-05,
+      "loss": 0.7905,
+      "step": 332000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 7.965615490979163e-05,
+      "loss": 0.8265,
+      "step": 333000
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 7.952287019089685e-05,
+      "loss": 0.8899,
+      "step": 334000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.938926261462366e-05,
+      "loss": 0.9168,
+      "step": 335000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.925533364208309e-05,
+      "loss": 0.9157,
+      "step": 336000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.912108473790092e-05,
+      "loss": 0.886,
+      "step": 337000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.898651737020166e-05,
+      "loss": 0.934,
+      "step": 338000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.88516330105925e-05,
+      "loss": 0.9396,
+      "step": 339000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.871643313414718e-05,
+      "loss": 0.8977,
+      "step": 340000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.858091921938988e-05,
+      "loss": 0.9168,
+      "step": 341000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.844509274827907e-05,
+      "loss": 0.9228,
+      "step": 342000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.830895520619128e-05,
+      "loss": 0.8509,
+      "step": 343000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.817250808190483e-05,
+      "loss": 0.8648,
+      "step": 344000
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 7.803575286758364e-05,
+      "loss": 0.8531,
+      "step": 345000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 7.789869105876083e-05,
+      "loss": 0.7922,
+      "step": 346000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 7.776132415432234e-05,
+      "loss": 0.7278,
+      "step": 347000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 7.762365365649067e-05,
+      "loss": 0.7823,
+      "step": 348000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 7.748568107080832e-05,
+      "loss": 0.8588,
+      "step": 349000
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 7.734740790612136e-05,
+      "loss": 0.8575,
+      "step": 350000
+    },
+    {
+      "epoch": 0.35,
+      "eval_loss": 0.668906033039093,
+      "eval_runtime": 17.164,
+      "eval_samples_per_second": 291.307,
+      "eval_steps_per_second": 2.33,
+      "step": 350000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 5.9024955408384e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:95da880ddfc7c5a94fe9f64885985df1592401d4e712cee7ee0e2954be511def
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd6069e422d2b3d5dfffd698b2b7e4ffabc9afe2433ba9e17ada2dfe9b3bb50b
 size 737971755

runs/Dec28_00-25-33_t1v-n-07cfb9e3-w-0/events.out.tfevents.1672187175.t1v-n-07cfb9e3-w-0.13817.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:038504f96ef2750189383d13aeb359fad8f18ee4ed7b9d8170da1c8b0bc5f095
-size 53380

 version https://git-lfs.github.com/spec/v1
+oid sha256:75f497d89363b2722963700c40c1df56f9810f0268b188d27e9c7f16934427f8
+size 61656