joelniklaus commited on Feb 20, 2023

Commit

6c1cc51

•

1 Parent(s): 0253f1e

Training in progress, step 100000

Browse files

Files changed (17) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
last-checkpoint/training_args.bin +2 -2
pytorch_model.bin +1 -1
runs/Feb17_16-44-14_t1v-n-91d26b69-w-0/1676652795.6460006/events.out.tfevents.1676652795.t1v-n-91d26b69-w-0.1590282.1 +3 -0
runs/Feb17_16-44-14_t1v-n-91d26b69-w-0/events.out.tfevents.1676652795.t1v-n-91d26b69-w-0.1590282.0 +3 -0
training_args.bin +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c57da68878e140aac92e0e305cc4e36eeab07dd23d4e3e2c57aa5b74cfb989be
-size 2693741721

 version https://git-lfs.github.com/spec/v1
+oid sha256:90896b5081c841f5c896cd27201edec3a834ddf5ff97721a4988999ef95d051f
+size 2693742553

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a420ea97fdbabd057832103ac7f72925c7000bc312917af36dfdf77cc15a394
 size 1346893675

 version https://git-lfs.github.com/spec/v1
+oid sha256:72210ddc5a03c29df4e488fe110d112c8b5dcd865f434eebeec4c5357bf30f3e
 size 1346893675

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0cba4c4280fe2708987ba830760c10347d94e259759f59f6c8b17c2643d54d1d
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:524c23c847bcf10bc48c85a9acbf3b41aee0f0c95369d379f5dffc1ef101a72e
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d3c7b27bde8b1f5a5595802aeb17178a4cf1850adf7366fbf6ace3edc933ed8
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:647800033a1fe4aa55a6bc8c002ddb2326a52950bde89b878eccf8a697eacefa
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.05,
-  "global_step": 50000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -314,11 +314,319 @@
       "eval_samples_per_second": 165.95,
       "eval_steps_per_second": 2.622,
       "step": 50000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 2.9824949157888e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.025175,
+  "global_step": 100000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 165.95,
       "eval_steps_per_second": 2.622,
       "step": 50000
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.999972660400536e-05,
+      "loss": 0.6375,
+      "step": 51000
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.999890641901125e-05,
+      "loss": 0.7625,
+      "step": 52000
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.999753945398704e-05,
+      "loss": 0.7111,
+      "step": 53000
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 9.99956257238817e-05,
+      "loss": 0.5652,
+      "step": 54000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.999316524962345e-05,
+      "loss": 0.5796,
+      "step": 55000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.999015805811965e-05,
+      "loss": 0.7634,
+      "step": 56000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.998660418225645e-05,
+      "loss": 0.7296,
+      "step": 57000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.998250366089848e-05,
+      "loss": 0.5758,
+      "step": 58000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.997785653888835e-05,
+      "loss": 0.6196,
+      "step": 59000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.997266286704631e-05,
+      "loss": 0.7018,
+      "step": 60000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.996692270216947e-05,
+      "loss": 0.6875,
+      "step": 61000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.996063610703137e-05,
+      "loss": 0.6113,
+      "step": 62000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.995380315038119e-05,
+      "loss": 0.7141,
+      "step": 63000
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.994642390694308e-05,
+      "loss": 0.814,
+      "step": 64000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.993849845741524e-05,
+      "loss": 0.7573,
+      "step": 65000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.993002688846913e-05,
+      "loss": 0.6522,
+      "step": 66000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.992100929274846e-05,
+      "loss": 0.6774,
+      "step": 67000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.991144576886823e-05,
+      "loss": 0.7855,
+      "step": 68000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.990133642141359e-05,
+      "loss": 0.7461,
+      "step": 69000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.989068136093873e-05,
+      "loss": 0.634,
+      "step": 70000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.987948070396571e-05,
+      "loss": 0.6621,
+      "step": 71000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.986773457298311e-05,
+      "loss": 0.769,
+      "step": 72000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.985544309644475e-05,
+      "loss": 0.7128,
+      "step": 73000
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 9.984260640876821e-05,
+      "loss": 0.6125,
+      "step": 74000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.98292246503335e-05,
+      "loss": 0.6764,
+      "step": 75000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.981529796748134e-05,
+      "loss": 0.7392,
+      "step": 76000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.980082651251175e-05,
+      "loss": 0.6323,
+      "step": 77000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.97858104436822e-05,
+      "loss": 0.6628,
+      "step": 78000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.977024992520602e-05,
+      "loss": 0.7715,
+      "step": 79000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.975414512725057e-05,
+      "loss": 0.7154,
+      "step": 80000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.973749622593534e-05,
+      "loss": 0.6102,
+      "step": 81000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.972030340333001e-05,
+      "loss": 0.6467,
+      "step": 82000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.970256684745258e-05,
+      "loss": 0.7534,
+      "step": 83000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.968428675226714e-05,
+      "loss": 0.704,
+      "step": 84000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.966546331768191e-05,
+      "loss": 0.6225,
+      "step": 85000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.964609674954696e-05,
+      "loss": 0.6437,
+      "step": 86000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.962618725965196e-05,
+      "loss": 0.754,
+      "step": 87000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.96057350657239e-05,
+      "loss": 0.6902,
+      "step": 88000
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.95847403914247e-05,
+      "loss": 0.6096,
+      "step": 89000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.956320346634876e-05,
+      "loss": 0.6426,
+      "step": 90000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.954112452602045e-05,
+      "loss": 0.7444,
+      "step": 91000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.95185038118915e-05,
+      "loss": 0.6821,
+      "step": 92000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.949534157133844e-05,
+      "loss": 0.5948,
+      "step": 93000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.94716380576598e-05,
+      "loss": 0.6266,
+      "step": 94000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.944739353007344e-05,
+      "loss": 0.7387,
+      "step": 95000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.942260825371358e-05,
+      "loss": 0.6734,
+      "step": 96000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.939728249962807e-05,
+      "loss": 0.5943,
+      "step": 97000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.937141654477528e-05,
+      "loss": 0.6332,
+      "step": 98000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.934501067202117e-05,
+      "loss": 0.7306,
+      "step": 99000
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 9.931806517013612e-05,
+      "loss": 0.6654,
+      "step": 100000
+    },
+    {
+      "epoch": 1.03,
+      "eval_loss": 0.4750686585903168,
+      "eval_runtime": 31.6698,
+      "eval_samples_per_second": 157.879,
+      "eval_steps_per_second": 2.494,
+      "step": 100000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 5.965012200289468e+18,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:845508cc38007d8b2a7a8855373b6b11d5c4e94a423856e2b9c4963c713988dc
-size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2fdc390cc059f4ea67f02d60dce87ec4a8bb54eedf9e688c28d4d67ce830c58
+size 3503

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a420ea97fdbabd057832103ac7f72925c7000bc312917af36dfdf77cc15a394
 size 1346893675

 version https://git-lfs.github.com/spec/v1
+oid sha256:72210ddc5a03c29df4e488fe110d112c8b5dcd865f434eebeec4c5357bf30f3e
 size 1346893675

runs/Feb17_16-44-14_t1v-n-91d26b69-w-0/1676652795.6460006/events.out.tfevents.1676652795.t1v-n-91d26b69-w-0.1590282.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:db9345dd823268b8790c224dc1959d0e880174954598e53768e07e012d8eb154
+size 5514

runs/Feb17_16-44-14_t1v-n-91d26b69-w-0/events.out.tfevents.1676652795.t1v-n-91d26b69-w-0.1590282.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f53d4d95acff7c0420d87d6e952d529ddf6986facb47c97e4b3fca90e141c906
+size 12130

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:845508cc38007d8b2a7a8855373b6b11d5c4e94a423856e2b9c4963c713988dc
-size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2fdc390cc059f4ea67f02d60dce87ec4a8bb54eedf9e688c28d4d67ce830c58
+size 3503