Training in progress, step 180000

Browse files

Files changed (6) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +131 -3
pytorch_model.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:57dee83a189d98be49bec5f74817fff8657797a917a6717ceea36d9c18ae6862
 size 995605445

 version https://git-lfs.github.com/spec/v1
+oid sha256:58db17469cdf65f4aec47bb1e6dd34e7ef4e2c19f61ee30f01ab8aabbe5433b3
 size 995605445

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f42dbd9b35415ba34033be719191148beaa9e62794b2440aac238f33a11f2b47
 size 510398013

 version https://git-lfs.github.com/spec/v1
+oid sha256:58842975ca799b06b4fa71b7c90228c8d715f5a818a53786f1086ad507f6d094
 size 510398013

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0560bfc1efbba55157929955ba0396617b61df4e817669f59453ff7efb93f22b
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:59392ffa3e40bbac5c000c9a093cf9e7ad91abc71b1747bf198e56aee121e33f
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:178dabfccbd230719cf675b65dfa8a438486e62518bee396fdb95743a820c1ad
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd44998ac74ad04897dc0df2a86a524cb79649de88a84a40636d9419486a8937
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.025002367648452,
-  "global_step": 170000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2188,11 +2188,139 @@
       "eval_samples_per_second": 166.449,
       "eval_steps_per_second": 20.811,
       "step": 170000
     }
   ],
   "max_steps": 633540,
   "num_train_epochs": 15,
-  "total_flos": 3.6054596397312e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 4.2617672128042425,
+  "global_step": 180000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 166.449,
       "eval_steps_per_second": 20.811,
       "step": 170000
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 1.760431859077564e-05,
+      "loss": 2.6119,
+      "step": 170500
+    },
+    {
+      "epoch": 4.05,
+      "learning_rate": 1.75411812987341e-05,
+      "loss": 2.6106,
+      "step": 171000
+    },
+    {
+      "epoch": 4.06,
+      "learning_rate": 1.7478044006692554e-05,
+      "loss": 2.6353,
+      "step": 171500
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 1.741490671465101e-05,
+      "loss": 2.6192,
+      "step": 172000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 1.7351769422609465e-05,
+      "loss": 2.6269,
+      "step": 172500
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 1.7288632130567923e-05,
+      "loss": 2.6145,
+      "step": 173000
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 1.7225494838526378e-05,
+      "loss": 2.6366,
+      "step": 173500
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 1.7162357546484833e-05,
+      "loss": 2.6273,
+      "step": 174000
+    },
+    {
+      "epoch": 4.13,
+      "learning_rate": 1.709922025444329e-05,
+      "loss": 2.6381,
+      "step": 174500
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 1.7036082962401744e-05,
+      "loss": 2.6218,
+      "step": 175000
+    },
+    {
+      "epoch": 4.16,
+      "learning_rate": 1.69729456703602e-05,
+      "loss": 2.6406,
+      "step": 175500
+    },
+    {
+      "epoch": 4.17,
+      "learning_rate": 1.6909808378318654e-05,
+      "loss": 2.6366,
+      "step": 176000
+    },
+    {
+      "epoch": 4.18,
+      "learning_rate": 1.6846671086277112e-05,
+      "loss": 2.6445,
+      "step": 176500
+    },
+    {
+      "epoch": 4.19,
+      "learning_rate": 1.6783533794235567e-05,
+      "loss": 2.6649,
+      "step": 177000
+    },
+    {
+      "epoch": 4.2,
+      "learning_rate": 1.6720396502194022e-05,
+      "loss": 2.6351,
+      "step": 177500
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 1.6657259210152478e-05,
+      "loss": 2.6261,
+      "step": 178000
+    },
+    {
+      "epoch": 4.23,
+      "learning_rate": 1.6594121918110933e-05,
+      "loss": 2.6413,
+      "step": 178500
+    },
+    {
+      "epoch": 4.24,
+      "learning_rate": 1.6530984626069388e-05,
+      "loss": 2.6418,
+      "step": 179000
+    },
+    {
+      "epoch": 4.25,
+      "learning_rate": 1.6467847334027843e-05,
+      "loss": 2.6263,
+      "step": 179500
+    },
+    {
+      "epoch": 4.26,
+      "learning_rate": 1.64047100419863e-05,
+      "loss": 2.6519,
+      "step": 180000
+    },
+    {
+      "epoch": 4.26,
+      "eval_loss": 3.13765549659729,
+      "eval_runtime": 112.7621,
+      "eval_samples_per_second": 166.474,
+      "eval_steps_per_second": 20.814,
+      "step": 180000
     }
   ],
   "max_steps": 633540,
   "num_train_epochs": 15,
+  "total_flos": 3.8174350461696e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f42dbd9b35415ba34033be719191148beaa9e62794b2440aac238f33a11f2b47
 size 510398013

 version https://git-lfs.github.com/spec/v1
+oid sha256:58842975ca799b06b4fa71b7c90228c8d715f5a818a53786f1086ad507f6d094
 size 510398013