initial model files

Browse files

Files changed (11) hide show

config.json +72 -0
optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +1 -0
tokenizer.json +0 -0
tokenizer_config.json +1 -0
trainer_state.json +520 -0
training_args.bin +3 -0
vocab.txt +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,72 @@

+{
+  "_name_or_path": "models\\Pre-trained-BERT\\checkpoint-318766",
+  "architectures": [
+    "BertForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-MOD",
+    "2": "I-MOD",
+    "3": "L-MOD",
+    "4": "B-EFF",
+    "5": "I-EFF",
+    "6": "L-EFF",
+    "7": "B-CAU",
+    "8": "I-CAU",
+    "9": "L-CAU",
+    "10": "B-REC",
+    "11": "I-REC",
+    "12": "L-REC",
+    "13": "B-CON",
+    "14": "I-CON",
+    "15": "L-CON",
+    "16": "U-REC",
+    "17": "U-CAU",
+    "18": "U-EFF",
+    "19": "U-MOD",
+    "20": "U-CON"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "B-CAU": 7,
+    "B-CON": 13,
+    "B-EFF": 4,
+    "B-MOD": 1,
+    "B-REC": 10,
+    "I-CAU": 8,
+    "I-CON": 14,
+    "I-EFF": 5,
+    "I-MOD": 2,
+    "I-REC": 11,
+    "L-CAU": 9,
+    "L-CON": 15,
+    "L-EFF": 6,
+    "L-MOD": 3,
+    "L-REC": 12,
+    "O": 0,
+    "U-CAU": 17,
+    "U-CON": 20,
+    "U-EFF": 18,
+    "U-MOD": 19,
+    "U-REC": 16
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:652ae36e9735e0b7c7eaca4098b3bdd9ff12db19779261d59c1786f2558c9fd2
+size 871377765

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a479ad591a8a4c98585c1beff76767241e145986de980cfa923971984d675ee7
+size 435715505

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:886507d4fdf5c847b1cfc49d321e65d8ec601e2e0dea1d2479c1c0b6b034ec18
+size 14503

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ac3ad37a2313e3c608eb034eb4dd8bbc7e56902cf84cab813bb20674cdcb76b7
+size 623

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"do_lower_case": true, "unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "tokenize_chinese_chars": true, "strip_accents": null, "truncation": true, "padding": "max_length", "model_max_length": 512, "special_tokens_map_file": null, "name_or_path": "models\\Pre-trained-BERT\\checkpoint-318766", "tokenizer_class": "BertTokenizer"}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,520 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "global_step": 1424,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14,
+      "learning_rate": 1.9297752808988766e-05,
+      "loss": 2.3997,
+      "step": 50
+    },
+    {
+      "epoch": 0.14,
+      "eval_accuracy": 0.6560856864654333,
+      "eval_f1": 0.2732362821948488,
+      "eval_loss": 2.096482753753662,
+      "eval_precision": 0.5434298440979956,
+      "eval_recall": 0.1824981301421092,
+      "eval_runtime": 2.8754,
+      "eval_samples_per_second": 123.811,
+      "eval_steps_per_second": 30.953,
+      "step": 50
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 1.859550561797753e-05,
+      "loss": 1.9889,
+      "step": 100
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.6641674780915288,
+      "eval_f1": 0.23144399303321833,
+      "eval_loss": 1.841402530670166,
+      "eval_precision": 0.35626471686727634,
+      "eval_recall": 0.201949860724234,
+      "eval_runtime": 3.0688,
+      "eval_samples_per_second": 116.007,
+      "eval_steps_per_second": 29.002,
+      "step": 100
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 1.7893258426966292e-05,
+      "loss": 1.7798,
+      "step": 150
+    },
+    {
+      "epoch": 0.42,
+      "eval_accuracy": 0.678286270691334,
+      "eval_f1": 0.30889901953592575,
+      "eval_loss": 1.7000586986541748,
+      "eval_precision": 0.46442073397410666,
+      "eval_recall": 0.30013927576601673,
+      "eval_runtime": 3.0638,
+      "eval_samples_per_second": 116.196,
+      "eval_steps_per_second": 29.049,
+      "step": 150
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 1.7191011235955056e-05,
+      "loss": 1.6758,
+      "step": 200
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.6851022395326193,
+      "eval_f1": 0.4112622913384574,
+      "eval_loss": 1.5615102052688599,
+      "eval_precision": 0.5168803704334585,
+      "eval_recall": 0.46160794941282746,
+      "eval_runtime": 3.0543,
+      "eval_samples_per_second": 116.558,
+      "eval_steps_per_second": 29.139,
+      "step": 200
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 1.648876404494382e-05,
+      "loss": 1.5373,
+      "step": 250
+    },
+    {
+      "epoch": 0.7,
+      "eval_accuracy": 0.7037974683544304,
+      "eval_f1": 0.4145163524364727,
+      "eval_loss": 1.5320079326629639,
+      "eval_precision": 0.4973354384146672,
+      "eval_recall": 0.4218608852755194,
+      "eval_runtime": 3.106,
+      "eval_samples_per_second": 114.618,
+      "eval_steps_per_second": 28.654,
+      "step": 250
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 1.5786516853932585e-05,
+      "loss": 1.5237,
+      "step": 300
+    },
+    {
+      "epoch": 0.84,
+      "eval_accuracy": 0.6741966893865629,
+      "eval_f1": 0.4215682986210665,
+      "eval_loss": 1.436463713645935,
+      "eval_precision": 0.4890496360861274,
+      "eval_recall": 0.5289735099337748,
+      "eval_runtime": 3.3008,
+      "eval_samples_per_second": 107.852,
+      "eval_steps_per_second": 26.963,
+      "step": 300
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 1.508426966292135e-05,
+      "loss": 1.4836,
+      "step": 350
+    },
+    {
+      "epoch": 0.98,
+      "eval_accuracy": 0.7168451801363194,
+      "eval_f1": 0.4672566121066839,
+      "eval_loss": 1.3614311218261719,
+      "eval_precision": 0.48757191926720095,
+      "eval_recall": 0.49944812362030905,
+      "eval_runtime": 3.0542,
+      "eval_samples_per_second": 116.561,
+      "eval_steps_per_second": 29.14,
+      "step": 350
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 1.4382022471910113e-05,
+      "loss": 1.2214,
+      "step": 400
+    },
+    {
+      "epoch": 1.12,
+      "eval_accuracy": 0.6756572541382668,
+      "eval_f1": 0.46131327709157666,
+      "eval_loss": 1.359670877456665,
+      "eval_precision": 0.446314989587013,
+      "eval_recall": 0.5764348785871964,
+      "eval_runtime": 3.229,
+      "eval_samples_per_second": 110.251,
+      "eval_steps_per_second": 27.563,
+      "step": 400
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 1.3679775280898877e-05,
+      "loss": 1.1844,
+      "step": 450
+    },
+    {
+      "epoch": 1.26,
+      "eval_accuracy": 0.6653359298928919,
+      "eval_f1": 0.47653942777539116,
+      "eval_loss": 1.3439290523529053,
+      "eval_precision": 0.4441930828791319,
+      "eval_recall": 0.5929911699779249,
+      "eval_runtime": 3.2134,
+      "eval_samples_per_second": 110.785,
+      "eval_steps_per_second": 27.696,
+      "step": 450
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 1.2977528089887642e-05,
+      "loss": 1.2122,
+      "step": 500
+    },
+    {
+      "epoch": 1.4,
+      "eval_accuracy": 0.7283349561830574,
+      "eval_f1": 0.49999878403851467,
+      "eval_loss": 1.279309630393982,
+      "eval_precision": 0.5213615961013602,
+      "eval_recall": 0.5292494481236203,
+      "eval_runtime": 3.3746,
+      "eval_samples_per_second": 105.495,
+      "eval_steps_per_second": 26.374,
+      "step": 500
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 1.2275280898876405e-05,
+      "loss": 1.1619,
+      "step": 550
+    },
+    {
+      "epoch": 1.54,
+      "eval_accuracy": 0.7230769230769231,
+      "eval_f1": 0.4887836337789245,
+      "eval_loss": 1.3024553060531616,
+      "eval_precision": 0.5019528496497354,
+      "eval_recall": 0.5135209713024282,
+      "eval_runtime": 3.4149,
+      "eval_samples_per_second": 104.248,
+      "eval_steps_per_second": 26.062,
+      "step": 550
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 1.157303370786517e-05,
+      "loss": 1.0476,
+      "step": 600
+    },
+    {
+      "epoch": 1.69,
+      "eval_accuracy": 0.7195715676728335,
+      "eval_f1": 0.5047823749536667,
+      "eval_loss": 1.2519958019256592,
+      "eval_precision": 0.4975374148688318,
+      "eval_recall": 0.5524282560706402,
+      "eval_runtime": 3.0914,
+      "eval_samples_per_second": 115.16,
+      "eval_steps_per_second": 28.79,
+      "step": 600
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 1.0870786516853932e-05,
+      "loss": 1.1271,
+      "step": 650
+    },
+    {
+      "epoch": 1.83,
+      "eval_accuracy": 0.7352482960077896,
+      "eval_f1": 0.5283455171867876,
+      "eval_loss": 1.233576774597168,
+      "eval_precision": 0.5226202101961099,
+      "eval_recall": 0.5400110375275938,
+      "eval_runtime": 2.9844,
+      "eval_samples_per_second": 119.289,
+      "eval_steps_per_second": 29.822,
+      "step": 650
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 1.0168539325842697e-05,
+      "loss": 1.065,
+      "step": 700
+    },
+    {
+      "epoch": 1.97,
+      "eval_accuracy": 0.7147030185004869,
+      "eval_f1": 0.526531014037714,
+      "eval_loss": 1.2058743238449097,
+      "eval_precision": 0.4963744012861858,
+      "eval_recall": 0.5905077262693157,
+      "eval_runtime": 2.9747,
+      "eval_samples_per_second": 119.675,
+      "eval_steps_per_second": 29.919,
+      "step": 700
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 9.466292134831461e-06,
+      "loss": 0.9841,
+      "step": 750
+    },
+    {
+      "epoch": 2.11,
+      "eval_accuracy": 0.7189873417721518,
+      "eval_f1": 0.5335199131439152,
+      "eval_loss": 1.2104876041412354,
+      "eval_precision": 0.497289342239156,
+      "eval_recall": 0.6012693156732892,
+      "eval_runtime": 2.9664,
+      "eval_samples_per_second": 120.012,
+      "eval_steps_per_second": 30.003,
+      "step": 750
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 8.764044943820226e-06,
+      "loss": 0.8402,
+      "step": 800
+    },
+    {
+      "epoch": 2.25,
+      "eval_accuracy": 0.7241480038948394,
+      "eval_f1": 0.5318695086433913,
+      "eval_loss": 1.2313593626022339,
+      "eval_precision": 0.49658531359956104,
+      "eval_recall": 0.5869205298013245,
+      "eval_runtime": 3.0358,
+      "eval_samples_per_second": 117.269,
+      "eval_steps_per_second": 29.317,
+      "step": 800
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 8.06179775280899e-06,
+      "loss": 0.8774,
+      "step": 850
+    },
+    {
+      "epoch": 2.39,
+      "eval_accuracy": 0.7349561830574489,
+      "eval_f1": 0.5437299456127834,
+      "eval_loss": 1.232950210571289,
+      "eval_precision": 0.5219091313104574,
+      "eval_recall": 0.5800220750551877,
+      "eval_runtime": 2.9613,
+      "eval_samples_per_second": 120.219,
+      "eval_steps_per_second": 30.055,
+      "step": 850
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 7.359550561797754e-06,
+      "loss": 0.8705,
+      "step": 900
+    },
+    {
+      "epoch": 2.53,
+      "eval_accuracy": 0.736222005842259,
+      "eval_f1": 0.5357813426509713,
+      "eval_loss": 1.23160719871521,
+      "eval_precision": 0.5233646751377105,
+      "eval_recall": 0.5629139072847682,
+      "eval_runtime": 2.9653,
+      "eval_samples_per_second": 120.057,
+      "eval_steps_per_second": 30.014,
+      "step": 900
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 6.6573033707865175e-06,
+      "loss": 0.8113,
+      "step": 950
+    },
+    {
+      "epoch": 2.67,
+      "eval_accuracy": 0.7201557935735151,
+      "eval_f1": 0.537801212068117,
+      "eval_loss": 1.2007496356964111,
+      "eval_precision": 0.4931233755174561,
+      "eval_recall": 0.6128587196467992,
+      "eval_runtime": 2.9774,
+      "eval_samples_per_second": 119.567,
+      "eval_steps_per_second": 29.892,
+      "step": 950
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 5.955056179775281e-06,
+      "loss": 0.838,
+      "step": 1000
+    },
+    {
+      "epoch": 2.81,
+      "eval_accuracy": 0.7356377799415774,
+      "eval_f1": 0.5536859104767312,
+      "eval_loss": 1.2019802331924438,
+      "eval_precision": 0.5212984586666464,
+      "eval_recall": 0.6026490066225165,
+      "eval_runtime": 2.9737,
+      "eval_samples_per_second": 119.715,
+      "eval_steps_per_second": 29.929,
+      "step": 1000
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 5.252808988764046e-06,
+      "loss": 0.8193,
+      "step": 1050
+    },
+    {
+      "epoch": 2.95,
+      "eval_accuracy": 0.7207400194741966,
+      "eval_f1": 0.5384993944708429,
+      "eval_loss": 1.1946783065795898,
+      "eval_precision": 0.5114682731180041,
+      "eval_recall": 0.6004415011037527,
+      "eval_runtime": 2.9881,
+      "eval_samples_per_second": 119.139,
+      "eval_steps_per_second": 29.785,
+      "step": 1050
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 4.550561797752809e-06,
+      "loss": 0.7141,
+      "step": 1100
+    },
+    {
+      "epoch": 3.09,
+      "eval_accuracy": 0.7366114897760467,
+      "eval_f1": 0.5502255793929967,
+      "eval_loss": 1.2296370267868042,
+      "eval_precision": 0.5259775856114555,
+      "eval_recall": 0.5963024282560706,
+      "eval_runtime": 3.0151,
+      "eval_samples_per_second": 118.071,
+      "eval_steps_per_second": 29.518,
+      "step": 1100
+    },
+    {
+      "epoch": 3.23,
+      "learning_rate": 3.848314606741573e-06,
+      "loss": 0.6905,
+      "step": 1150
+    },
+    {
+      "epoch": 3.23,
+      "eval_accuracy": 0.7345666991236611,
+      "eval_f1": 0.5571197569439074,
+      "eval_loss": 1.2248950004577637,
+      "eval_precision": 0.5197886755754393,
+      "eval_recall": 0.6109271523178808,
+      "eval_runtime": 3.0012,
+      "eval_samples_per_second": 118.617,
+      "eval_steps_per_second": 29.654,
+      "step": 1150
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 3.146067415730337e-06,
+      "loss": 0.6951,
+      "step": 1200
+    },
+    {
+      "epoch": 3.37,
+      "eval_accuracy": 0.7339824732229796,
+      "eval_f1": 0.5589116173956266,
+      "eval_loss": 1.229973316192627,
+      "eval_precision": 0.5182250638435781,
+      "eval_recall": 0.6103752759381899,
+      "eval_runtime": 2.9574,
+      "eval_samples_per_second": 120.376,
+      "eval_steps_per_second": 30.094,
+      "step": 1200
+    },
+    {
+      "epoch": 3.51,
+      "learning_rate": 2.4438202247191012e-06,
+      "loss": 0.6387,
+      "step": 1250
+    },
+    {
+      "epoch": 3.51,
+      "eval_accuracy": 0.7345666991236611,
+      "eval_f1": 0.5571000509958351,
+      "eval_loss": 1.2234023809432983,
+      "eval_precision": 0.5270142770488044,
+      "eval_recall": 0.6084437086092715,
+      "eval_runtime": 2.9722,
+      "eval_samples_per_second": 119.776,
+      "eval_steps_per_second": 29.944,
+      "step": 1250
+    },
+    {
+      "epoch": 3.65,
+      "learning_rate": 1.7415730337078653e-06,
+      "loss": 0.6742,
+      "step": 1300
+    },
+    {
+      "epoch": 3.65,
+      "eval_accuracy": 0.7401168451801363,
+      "eval_f1": 0.5594133884864436,
+      "eval_loss": 1.2352250814437866,
+      "eval_precision": 0.5322645232058062,
+      "eval_recall": 0.5965783664459161,
+      "eval_runtime": 2.9614,
+      "eval_samples_per_second": 120.215,
+      "eval_steps_per_second": 30.054,
+      "step": 1300
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 1.0393258426966294e-06,
+      "loss": 0.6565,
+      "step": 1350
+    },
+    {
+      "epoch": 3.79,
+      "eval_accuracy": 0.7366114897760467,
+      "eval_f1": 0.5585737547750994,
+      "eval_loss": 1.2389932870864868,
+      "eval_precision": 0.5244359046194068,
+      "eval_recall": 0.6026490066225165,
+      "eval_runtime": 2.9582,
+      "eval_samples_per_second": 120.344,
+      "eval_steps_per_second": 30.086,
+      "step": 1350
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 3.3707865168539325e-07,
+      "loss": 0.675,
+      "step": 1400
+    },
+    {
+      "epoch": 3.93,
+      "eval_accuracy": 0.7382667964946446,
+      "eval_f1": 0.5614680191047273,
+      "eval_loss": 1.2423402070999146,
+      "eval_precision": 0.5289138247855666,
+      "eval_recall": 0.6056843267108167,
+      "eval_runtime": 2.9515,
+      "eval_samples_per_second": 120.618,
+      "eval_steps_per_second": 30.154,
+      "step": 1400
+    }
+  ],
+  "max_steps": 1424,
+  "num_train_epochs": 4,
+  "total_flos": 133980467748696.0,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:625d52990db3df9613eb5d9bea850c39676787219069782d02fe01d1d938aec2
+size 2991

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff