Training in progress, step 200000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Nov11_11-14-20_t1v-n-088af867-w-0/events.out.tfevents.1668165319.t1v-n-088af867-w-0.346597.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:952fe6bdf6cabe1f38488b9a599fc2e440dfdfb5644f5414a3b079183fe1ac6d
 size 996067161

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c430997f3d9bb90bdeacaf02ec92c873fdfb8f77e978ff156968a6a25447c4d
 size 996067161

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3cdb5302e913b902c7056d65629709427b4b2a496357048964e3bd03228237e
 size 498046827

 version https://git-lfs.github.com/spec/v1
+oid sha256:b99e2a10bd476979b5e5acd98e23352e193709ba2af786c72d1511b539698808
 size 498046827

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1211185a7eba6b0cf3d9f71afa3315b83f37a5f5862b6e954e8d5331666f2dc6
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a79ef100218a14fbbbbbf8611e43dcea0f4e44882243b8c765ab2cf7300ee71d
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:04ad030a150fa0d8eb5e5920300951e9645dc85319159f9dd4f177aff4c5b722
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:be1ccf49f4804619cd7d22b74b595a694a368e629a10492b4089d6536d07bdf2
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.15,
-  "global_step": 150000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -930,11 +930,319 @@
       "eval_samples_per_second": 547.07,
       "eval_steps_per_second": 2.188,
       "step": 150000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 2.5273406324736e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.2,
+  "global_step": 200000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 547.07,
       "eval_steps_per_second": 2.188,
       "step": 150000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.723691552302562e-05,
+      "loss": 0.9292,
+      "step": 151000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.718245238567939e-05,
+      "loss": 0.9244,
+      "step": 152000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.712747326859315e-05,
+      "loss": 0.9281,
+      "step": 153000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.707197877300974e-05,
+      "loss": 0.9301,
+      "step": 154000
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 9.701596950580806e-05,
+      "loss": 0.9208,
+      "step": 155000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.695944607949649e-05,
+      "loss": 0.9191,
+      "step": 156000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.690240911220618e-05,
+      "loss": 0.926,
+      "step": 157000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.684485922768422e-05,
+      "loss": 0.9271,
+      "step": 158000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.6786797055287e-05,
+      "loss": 0.9205,
+      "step": 159000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.672822322997305e-05,
+      "loss": 0.9101,
+      "step": 160000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.66691383922964e-05,
+      "loss": 0.9243,
+      "step": 161000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.660954318839933e-05,
+      "loss": 0.9272,
+      "step": 162000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.654943827000548e-05,
+      "loss": 0.9264,
+      "step": 163000
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 9.648882429441257e-05,
+      "loss": 0.9186,
+      "step": 164000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.642770192448536e-05,
+      "loss": 0.9291,
+      "step": 165000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.636607182864827e-05,
+      "loss": 0.9422,
+      "step": 166000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.630393468087818e-05,
+      "loss": 0.9203,
+      "step": 167000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.624129116069694e-05,
+      "loss": 0.9145,
+      "step": 168000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.617814195316411e-05,
+      "loss": 0.9202,
+      "step": 169000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.611448774886924e-05,
+      "loss": 0.9239,
+      "step": 170000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.605032924392457e-05,
+      "loss": 0.9308,
+      "step": 171000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.598566713995718e-05,
+      "loss": 0.9306,
+      "step": 172000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.59205021441015e-05,
+      "loss": 0.9246,
+      "step": 173000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.58548349689915e-05,
+      "loss": 0.9115,
+      "step": 174000
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 9.578866633275288e-05,
+      "loss": 0.9368,
+      "step": 175000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.572199695899522e-05,
+      "loss": 0.9156,
+      "step": 176000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.565482757680415e-05,
+      "loss": 0.9237,
+      "step": 177000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.558715892073323e-05,
+      "loss": 0.9225,
+      "step": 178000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.551899173079607e-05,
+      "loss": 0.9257,
+      "step": 179000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.545032675245813e-05,
+      "loss": 0.9277,
+      "step": 180000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.538116473662861e-05,
+      "loss": 0.924,
+      "step": 181000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.531150643965223e-05,
+      "loss": 0.9107,
+      "step": 182000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.524135262330098e-05,
+      "loss": 0.9218,
+      "step": 183000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.517070405476575e-05,
+      "loss": 0.9278,
+      "step": 184000
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 9.509956150664796e-05,
+      "loss": 0.9213,
+      "step": 185000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.502792575695112e-05,
+      "loss": 0.911,
+      "step": 186000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.49557975890723e-05,
+      "loss": 0.9217,
+      "step": 187000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.488317779179361e-05,
+      "loss": 0.9235,
+      "step": 188000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.481006715927351e-05,
+      "loss": 0.9318,
+      "step": 189000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.473646649103818e-05,
+      "loss": 0.9199,
+      "step": 190000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.46623765919727e-05,
+      "loss": 0.9251,
+      "step": 191000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.458779827231237e-05,
+      "loss": 0.9345,
+      "step": 192000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.451273234763371e-05,
+      "loss": 0.9227,
+      "step": 193000
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 9.443717963884569e-05,
+      "loss": 0.9042,
+      "step": 194000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.43611409721806e-05,
+      "loss": 0.9233,
+      "step": 195000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.428461717918511e-05,
+      "loss": 0.9167,
+      "step": 196000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.420760909671118e-05,
+      "loss": 0.9174,
+      "step": 197000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.413011756690685e-05,
+      "loss": 0.9274,
+      "step": 198000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.405214343720707e-05,
+      "loss": 0.915,
+      "step": 199000
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 9.397368756032445e-05,
+      "loss": 0.9106,
+      "step": 200000
+    },
+    {
+      "epoch": 0.2,
+      "eval_loss": 0.8557878732681274,
+      "eval_runtime": 22.93,
+      "eval_samples_per_second": 436.11,
+      "eval_steps_per_second": 1.744,
+      "step": 200000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 3.3697875099648e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3cdb5302e913b902c7056d65629709427b4b2a496357048964e3bd03228237e
 size 498046827

 version https://git-lfs.github.com/spec/v1
+oid sha256:b99e2a10bd476979b5e5acd98e23352e193709ba2af786c72d1511b539698808
 size 498046827

runs/Nov11_11-14-20_t1v-n-088af867-w-0/events.out.tfevents.1668165319.t1v-n-088af867-w-0.346597.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23881bbc2530987ddfcac79dfb969a161b128e175a7ce3355409252c562bc0e2
-size 28527

 version https://git-lfs.github.com/spec/v1
+oid sha256:428c1563898e046c157e5f0cc07d3b9c8862563202a919189836b0a1383d3e81
+size 36803