Upload 11 files

Browse files

Files changed (6) hide show

config.json +14 -14
model.safetensors +1 -1
optimizer.pt +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +49 -5

config.json CHANGED Viewed

@@ -9,23 +9,23 @@
   "dropout": 0.1,
   "hidden_dim": 3072,
   "id2label": {
-    "0": "O",
-    "1": "B-PER",
-    "2": "I-PER",
-    "3": "B-ORG",
-    "4": "I-ORG",
-    "5": "B-LOC",
-    "6": "I-LOC"
   },
   "initializer_range": 0.02,
   "label2id": {
-    "O": 0,
-    "B-PER": 1,
-    "I-PER": 2,
-    "B-ORG": 3,
-    "I-ORG": 4,
-    "B-LOC": 5,
-    "I-LOC": 6
   },
   "max_position_embeddings": 512,
   "model_type": "distilbert",

   "dropout": 0.1,
   "hidden_dim": 3072,
   "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6"
   },
   "initializer_range": 0.02,
   "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6
   },
   "max_position_embeddings": 512,
   "model_type": "distilbert",

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84c0bb10949406cb6df26debebce6c9656292ed2b60159c6198cd5ac24eae851
 size 538970204

 version https://git-lfs.github.com/spec/v1
+oid sha256:509860f7ad84567c6d9040617392aa974a83fb1da93455294cc1f21b2d48a8f0
 size 538970204

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:26f85619284e424f80785941a7c41bf6472c0b35bd3ed0af33e104d8e7f80402
 size 1078001210

 version https://git-lfs.github.com/spec/v1
+oid sha256:9022e88e9a1bae01e087146db4cf5f8af01ed83b1965b118f318bdafae2ea8bf
 size 1078001210

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1c40320c990f6d4f4b1a7f099cce71625488a96db8ee382390e1c67b6493ad17
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c408c5710d33bb9d33ccc69e5c1543496734e0f2526dc35e266027b8355f109
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4b6bf7bee8311866377924a92ff23fd8566865c824dac56b32549b589e46b209
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:a28f3f3fa3e4d886eeb63b341619fde4a4c6b57fa0b7ccffb348786728134f4a
 size 1064

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 1.704444837967062,
   "eval_steps": 1000,
-  "global_step": 38500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -843,6 +843,50 @@
       "eval_samples_per_second": 215.069,
       "eval_steps_per_second": 1.683,
       "step": 38000
     }
   ],
   "logging_steps": 1000,
@@ -850,7 +894,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 7,
   "save_steps": 500,
-  "total_flos": 5313197707682040.0,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.26044607162475586,
+  "best_model_checkpoint": "./checkpoint-distilbert/checkpoint-40000",
+  "epoch": 1.7708517797060386,
   "eval_steps": 1000,
+  "global_step": 40000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 215.069,
       "eval_steps_per_second": 1.683,
       "step": 38000
+    },
+    {
+      "epoch": 1.73,
+      "grad_norm": 7.599725246429443,
+      "learning_rate": 1.5066912899390323e-05,
+      "loss": 0.2322,
+      "step": 39000
+    },
+    {
+      "epoch": 1.73,
+      "eval_LOC_f1": 0.8500763831144973,
+      "eval_ORG_f1": 0.7572957665354708,
+      "eval_PER_f1": 0.8590397422347182,
+      "eval_loss": 0.27235275506973267,
+      "eval_overall_accuracy": 0.9206611521030973,
+      "eval_overall_f1": 0.8259451471597206,
+      "eval_overall_precision": 0.8237684495694223,
+      "eval_overall_recall": 0.8281333784889792,
+      "eval_runtime": 580.4463,
+      "eval_samples_per_second": 113.189,
+      "eval_steps_per_second": 0.886,
+      "step": 39000
+    },
+    {
+      "epoch": 1.77,
+      "grad_norm": 2.075500249862671,
+      "learning_rate": 1.4940423486554176e-05,
+      "loss": 0.2213,
+      "step": 40000
+    },
+    {
+      "epoch": 1.77,
+      "eval_LOC_f1": 0.8435102589085544,
+      "eval_ORG_f1": 0.7572054303898555,
+      "eval_PER_f1": 0.8558481099725878,
+      "eval_loss": 0.26044607162475586,
+      "eval_overall_accuracy": 0.9183281820401503,
+      "eval_overall_f1": 0.8229231947635958,
+      "eval_overall_precision": 0.8123006708457055,
+      "eval_overall_recall": 0.833827223210002,
+      "eval_runtime": 503.8704,
+      "eval_samples_per_second": 130.391,
+      "eval_steps_per_second": 1.02,
+      "step": 40000
     }
   ],
   "logging_steps": 1000,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 7,
   "save_steps": 500,
+  "total_flos": 5523298719415224.0,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null