Version-1.2

Browse files

Files changed (10) hide show

config.json +39 -39
model_args.json +1 -1
optimizer.pt +3 -0
pytorch_model.bin +1 -1
scheduler.pt +1 -1
special_tokens_map.json +1 -1
tokenizer.json +0 -0
tokenizer_config.json +1 -1
trainer_state.json +0 -571
training_args.bin +2 -2

config.json CHANGED Viewed

@@ -11,48 +11,48 @@
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "id2label": {
-     "0": "O",
-     "1": "B-nationality",
-     "2": "B-event",
-     "3": "B-person",
-     "4": "B-artwork",
-     "5": "B-location",
-     "6": "B-product",
-     "7": "B-organization",
-     "8": "B-job",
-     "9": "B-time",
-     "10": "I-nationality",
-     "11": "I-event",
-     "12": "I-person",
-     "13": "I-artwork",
-     "14": "I-location",
-     "15": "I-product",
-     "16": "I-organization",
-     "17": "I-job",
-     "18": "I-time"
   },
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "label2id": {
-     "O": 0,
-     "B-nationality": 1,
-     "B-event": 2,
-     "B-person": 3,
-     "B-artwork": 4,
-     "B-location": 5,
-     "B-product": 6,
-     "B-organization": 7,
-     "B-job": 8,
-     "B-time": 9,
-     "I-nationality": 10,
-     "I-event": 11,
-     "I-person": 12,
-     "I-artwork": 13,
-     "I-location": 14,
-     "I-product": 15,
-     "I-organization": 16,
-     "I-job": 17,
-     "I-time": 18
   },
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
@@ -62,7 +62,7 @@
   "output_past": true,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
-  "transformers_version": "4.6.0",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 250002

   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18"
   },
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_2": 2,
+    "LABEL_3": 3,
+    "LABEL_4": 4,
+    "LABEL_5": 5,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
   },
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
   "output_past": true,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
+  "transformers_version": "4.6.1",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 250002

model_args.json CHANGED Viewed

@@ -1 +1 @@

- {"adam_epsilon": 1e-08, "best_model_dir": "outputs/best_model", "cache_dir": "cache_dir/", "config": {}, "cosine_schedule_num_cycles": 0.5, "custom_layer_parameters": [], "custom_parameter_groups": [], "dataloader_num_workers": 0, "do_lower_case": false, "dynamic_quantize": false, "early_stopping_consider_epochs": false, "early_stopping_delta": 0, "early_stopping_metric": "eval_loss", "early_stopping_metric_minimize": true, "early_stopping_patience": 3, "encoding": null, "adafactor_eps": [1e-30, 0.001], "adafactor_clip_threshold": 1.0, "adafactor_decay_rate": -0.8, "adafactor_beta1": null, "adafactor_scale_parameter": true, "adafactor_relative_step": true, "adafactor_warmup_init": true, "eval_batch_size": 8, "evaluate_during_training": false, "evaluate_during_training_silent": true, "evaluate_during_training_steps": 2000, "evaluate_during_training_verbose": false, "evaluate_each_epoch": true, "fp16": true, "gradient_accumulation_steps": 1, "learning_rate": 2e-05, "local_rank": -1, "logging_steps": 50, "manual_seed": null, "max_grad_norm": 1.0, "max_seq_length": 128, "model_name": "xlm-roberta-large", "model_type": "xlmroberta", "multiprocessing_chunksize": ~~500~~, "n_gpu": 1, "no_cache": false, "no_save": false, "not_saved_args": [], "num_train_epochs": 10, "optimizer": "AdamW", "output_dir": "outputs/", "overwrite_output_dir": true, "~~process_count": 1, "~~polynomial_decay_schedule_lr_end": 1e-07, "polynomial_decay_schedule_power": 1.0, "quantized_model": false, "reprocess_input_data": true, "save_best_model": true, "save_eval_checkpoints": true, "save_model_every_epoch": true, "save_optimizer_and_scheduler": true, "save_steps": 2000, "scheduler": "linear_schedule_with_warmup", "silent": false, "skip_special_tokens": true, "tensorboard_dir": null, "thread_count": null, "train_batch_size": 16, "train_custom_parameters_only": false, "use_cached_eval_features": false, "use_early_stopping": false, "use_multiprocessing": true, "wandb_kwargs": {}, "wandb_project": null, "warmup_ratio": 0.06, "warmup_steps": ~~563~~, "weight_decay": 0.001, "model_class": "NERModel", "classification_report": false, "labels_list": ["O", "B-job", "I-job", "B-nationality", "B-person", "I-person", "B-location", "B-time", "I-time", "B-event", "I-event", "B-organization", "I-organization", "I-location", "I-nationality", "B-product", "I-product", "B-artwork", "I-artwork"], "lazy_loading": false, "lazy_loading_start_line": 0, "onnx": false, "special_tokens_list": []}

+ {"adafactor_beta1": null, "adafactor_clip_threshold": 1.0, "adafactor_decay_rate": -0.8, "adafactor_eps": [1e-30, 0.001], "adafactor_relative_step": true, "adafactor_scale_parameter": true, "adafactor_warmup_init": true, "adam_epsilon": 1e-08, "best_model_dir": "outputs/best_model", "cache_dir": "cache_dir/", "config": {}, "cosine_schedule_num_cycles": 0.5, "custom_layer_parameters": [], "custom_parameter_groups": [], "dataloader_num_workers": 0, "do_lower_case": false, "dynamic_quantize": false, "early_stopping_consider_epochs": false, "early_stopping_delta": 0, "early_stopping_metric": "eval_loss", "early_stopping_metric_minimize": true, "early_stopping_patience": 3, "encoding": null, "eval_batch_size": 8, "evaluate_during_training": false, "evaluate_during_training_silent": true, "evaluate_during_training_steps": 2000, "evaluate_during_training_verbose": false, "evaluate_each_epoch": true, "fp16": true, "gradient_accumulation_steps": 1, "learning_rate": 2e-05, "local_rank": -1, "logging_steps": 50, "manual_seed": null, "max_grad_norm": 1.0, "max_seq_length": 128, "model_name": "xlm-roberta-large", "model_type": "xlmroberta", "multiprocessing_chunksize": -1, "n_gpu": 1, "no_cache": false, "no_save": false, "not_saved_args": [], "num_train_epochs": 10, "optimizer": "AdamW", "output_dir": "outputs/", "overwrite_output_dir": true, "polynomial_decay_schedule_lr_end": 1e-07, "polynomial_decay_schedule_power": 1.0, "process_count": 1, "quantized_model": false, "reprocess_input_data": true, "save_best_model": true, "save_eval_checkpoints": true, "save_model_every_epoch": true, "save_optimizer_and_scheduler": true, "save_steps": 2000, "scheduler": "linear_schedule_with_warmup", "silent": false, "skip_special_tokens": true, "tensorboard_dir": null, "thread_count": null, "tokenizer_name": null, "tokenizer_type": null, "train_batch_size": 8, "train_custom_parameters_only": false, "use_cached_eval_features": false, "use_early_stopping": false, "use_hf_datasets": false, "use_multiprocessing": true, "use_multiprocessing_for_evaluation": true, "wandb_kwargs": {}, "wandb_project": null, "warmup_ratio": 0.06, "warmup_steps": 1117, "weight_decay": 0.001, "model_class": "NERModel", "classification_report": false, "labels_list": ["O", "B-job", "I-job", "B-nationality", "B-person", "I-person", "B-location", "B-time", "I-time", "B-event", "I-event", "B-organization", "I-organization", "I-location", "I-nationality", "B-product", "I-product", "B-artwork", "I-artwork"], "lazy_loading": false, "lazy_loading_start_line": 0, "onnx": false, "special_tokens_list": []}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76682a554be0386f7d8aa099bb31a285431a884690cf6d1be262e999635ee640
+size 4471129517

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf4a4d17471d6908750beeb0998d2cb4a744dbe3ca4aaabcd352a28d231ae3b9
 size 2235613943

 version https://git-lfs.github.com/spec/v1
+oid sha256:a68116126f007df58b80d3d4241d94834e9f324cf42c64e18115b02b6704fb95
 size 2235613943

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c022ff4c770b8f48647cabb531eed6c0b6843207e90c408c88bfa0ee2fcb08dd
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:d867df0a42b652e7db484987d7db7a415b4fbf7a871dcba8ed42223e4d3da6f5
 size 623

special_tokens_map.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": ~~false~~}}


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true}}

tokenizer.json DELETED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"bos_token": "<s>", "eos_token": "</s>", "~~sep_token~~": "~~</s~~>", "~~cls_token~~": "<s>", "~~unk_token~~": "<~~unk~~>", "pad_token": "<pad>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "model_max_length": 512, "special_tokens_map_file": null, "name_or_path": "xlm-roberta-large"}

+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "cls_token": "<s>", "pad_token": "<pad>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "sp_model_kwargs": {}, "do_lower_case": false, "model_max_length": 512, "special_tokens_map_file": null, "tokenizer_file": "/root/.cache/huggingface/transformers/7766c86e10505ed9b39af34e456480399bf06e35b36b8f2b917460a2dbe94e59.a984cf52fc87644bd4a2165f1e07e0ac880272c1e82d648b4674907056912bd7", "name_or_path": "xlm-roberta-large"}

trainer_state.json DELETED Viewed

@@ -1,571 +0,0 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 3.704618424302297,
-  "global_step": 30000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.06,
-      "learning_rate": 1.9794187865316542e-05,
-      "loss": 0.7638,
-      "step": 500
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 1.958837573063308e-05,
-      "loss": 0.5165,
-      "step": 1000
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 1.938256359594962e-05,
-      "loss": 0.457,
-      "step": 1500
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 1.917675146126616e-05,
-      "loss": 0.4516,
-      "step": 2000
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 1.8970939326582696e-05,
-      "loss": 0.4095,
-      "step": 2500
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 1.8765127191899236e-05,
-      "loss": 0.4188,
-      "step": 3000
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 1.8559315057215776e-05,
-      "loss": 0.4028,
-      "step": 3500
-    },
-    {
-      "epoch": 0.49,
-      "learning_rate": 1.8353502922532313e-05,
-      "loss": 0.3846,
-      "step": 4000
-    },
-    {
-      "epoch": 0.56,
-      "learning_rate": 1.8147690787848853e-05,
-      "loss": 0.3813,
-      "step": 4500
-    },
-    {
-      "epoch": 0.62,
-      "learning_rate": 1.7941878653165393e-05,
-      "loss": 0.3842,
-      "step": 5000
-    },
-    {
-      "epoch": 0.68,
-      "learning_rate": 1.773606651848193e-05,
-      "loss": 0.3977,
-      "step": 5500
-    },
-    {
-      "epoch": 0.74,
-      "learning_rate": 1.753025438379847e-05,
-      "loss": 0.3749,
-      "step": 6000
-    },
-    {
-      "epoch": 0.8,
-      "learning_rate": 1.732444224911501e-05,
-      "loss": 0.3578,
-      "step": 6500
-    },
-    {
-      "epoch": 0.86,
-      "learning_rate": 1.711863011443155e-05,
-      "loss": 0.339,
-      "step": 7000
-    },
-    {
-      "epoch": 0.93,
-      "learning_rate": 1.6912817979748087e-05,
-      "loss": 0.3704,
-      "step": 7500
-    },
-    {
-      "epoch": 0.99,
-      "learning_rate": 1.6707005845064627e-05,
-      "loss": 0.3423,
-      "step": 8000
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 1.6501193710381164e-05,
-      "loss": 0.2788,
-      "step": 8500
-    },
-    {
-      "epoch": 1.11,
-      "learning_rate": 1.6295381575697704e-05,
-      "loss": 0.2832,
-      "step": 9000
-    },
-    {
-      "epoch": 1.17,
-      "learning_rate": 1.6089569441014244e-05,
-      "loss": 0.3032,
-      "step": 9500
-    },
-    {
-      "epoch": 1.23,
-      "learning_rate": 1.588375730633078e-05,
-      "loss": 0.2774,
-      "step": 10000
-    },
-    {
-      "epoch": 1.23,
-      "eval_artwork": {
-        "f1": 0.3447251114413076,
-        "number": 295,
-        "precision": 0.30687830687830686,
-        "recall": 0.39322033898305087
-      },
-      "eval_event": {
-        "f1": 0.43632567849686854,
-        "number": 519,
-        "precision": 0.4760820045558087,
-        "recall": 0.4026974951830443
-      },
-      "eval_job": {
-        "f1": 0.6786657067434606,
-        "number": 2257,
-        "precision": 0.7403141361256544,
-        "recall": 0.6264953478068233
-      },
-      "eval_location": {
-        "f1": 0.6351052692799815,
-        "number": 4375,
-        "precision": 0.6466129796305069,
-        "recall": 0.624
-      },
-      "eval_loss": 0.9446586966514587,
-      "eval_nationality": {
-        "f1": 0.6808716707021791,
-        "number": 2137,
-        "precision": 0.7054691419969895,
-        "recall": 0.6579316799251287
-      },
-      "eval_organization": {
-        "f1": 0.5520833333333333,
-        "number": 1982,
-        "precision": 0.6044417767106842,
-        "recall": 0.5080726538849647
-      },
-      "eval_overall_accuracy": 0.8332146471271692,
-      "eval_overall_f1": 0.6393731397679646,
-      "eval_overall_precision": 0.6567667061833157,
-      "eval_overall_recall": 0.6228770933191313,
-      "eval_person": {
-        "f1": 0.7589572006134114,
-        "number": 3322,
-        "precision": 0.7068293949623474,
-        "recall": 0.8193859121011439
-      },
-      "eval_product": {
-        "f1": 0.3201754385964912,
-        "number": 323,
-        "precision": 0.5488721804511278,
-        "recall": 0.2260061919504644
-      },
-      "eval_runtime": 43.8587,
-      "eval_samples_per_second": 35.911,
-      "eval_time": {
-        "f1": 0.5435339308578744,
-        "number": 1689,
-        "precision": 0.5916376306620209,
-        "recall": 0.5026642984014209
-      },
-      "step": 10000
-    },
-    {
-      "epoch": 1.3,
-      "learning_rate": 1.567794517164732e-05,
-      "loss": 0.2914,
-      "step": 10500
-    },
-    {
-      "epoch": 1.36,
-      "learning_rate": 1.547213303696386e-05,
-      "loss": 0.2878,
-      "step": 11000
-    },
-    {
-      "epoch": 1.42,
-      "learning_rate": 1.52663209022804e-05,
-      "loss": 0.2649,
-      "step": 11500
-    },
-    {
-      "epoch": 1.48,
-      "learning_rate": 1.506050876759694e-05,
-      "loss": 0.2794,
-      "step": 12000
-    },
-    {
-      "epoch": 1.54,
-      "learning_rate": 1.4854696632913477e-05,
-      "loss": 0.288,
-      "step": 12500
-    },
-    {
-      "epoch": 1.61,
-      "learning_rate": 1.4648884498230017e-05,
-      "loss": 0.2663,
-      "step": 13000
-    },
-    {
-      "epoch": 1.67,
-      "learning_rate": 1.4443072363546555e-05,
-      "loss": 0.2853,
-      "step": 13500
-    },
-    {
-      "epoch": 1.73,
-      "learning_rate": 1.4237260228863094e-05,
-      "loss": 0.2718,
-      "step": 14000
-    },
-    {
-      "epoch": 1.79,
-      "learning_rate": 1.4031448094179634e-05,
-      "loss": 0.2944,
-      "step": 14500
-    },
-    {
-      "epoch": 1.85,
-      "learning_rate": 1.3825635959496172e-05,
-      "loss": 0.2804,
-      "step": 15000
-    },
-    {
-      "epoch": 1.91,
-      "learning_rate": 1.3619823824812712e-05,
-      "loss": 0.2631,
-      "step": 15500
-    },
-    {
-      "epoch": 1.98,
-      "learning_rate": 1.3414011690129251e-05,
-      "loss": 0.2937,
-      "step": 16000
-    },
-    {
-      "epoch": 2.04,
-      "learning_rate": 1.3208199555445791e-05,
-      "loss": 0.2301,
-      "step": 16500
-    },
-    {
-      "epoch": 2.1,
-      "learning_rate": 1.300238742076233e-05,
-      "loss": 0.2136,
-      "step": 17000
-    },
-    {
-      "epoch": 2.16,
-      "learning_rate": 1.2796575286078868e-05,
-      "loss": 0.2054,
-      "step": 17500
-    },
-    {
-      "epoch": 2.22,
-      "learning_rate": 1.2590763151395406e-05,
-      "loss": 0.2215,
-      "step": 18000
-    },
-    {
-      "epoch": 2.28,
-      "learning_rate": 1.2384951016711945e-05,
-      "loss": 0.2237,
-      "step": 18500
-    },
-    {
-      "epoch": 2.35,
-      "learning_rate": 1.2179138882028485e-05,
-      "loss": 0.2124,
-      "step": 19000
-    },
-    {
-      "epoch": 2.41,
-      "learning_rate": 1.1973326747345024e-05,
-      "loss": 0.2042,
-      "step": 19500
-    },
-    {
-      "epoch": 2.47,
-      "learning_rate": 1.1767514612661564e-05,
-      "loss": 0.2253,
-      "step": 20000
-    },
-    {
-      "epoch": 2.47,
-      "eval_artwork": {
-        "f1": 0.30398069963811825,
-        "number": 295,
-        "precision": 0.23595505617977527,
-        "recall": 0.4271186440677966
-      },
-      "eval_event": {
-        "f1": 0.38726790450928383,
-        "number": 519,
-        "precision": 0.35784313725490197,
-        "recall": 0.42196531791907516
-      },
-      "eval_job": {
-        "f1": 0.6671604938271605,
-        "number": 2257,
-        "precision": 0.7534857780256553,
-        "recall": 0.5985821887461231
-      },
-      "eval_location": {
-        "f1": 0.6328576483075834,
-        "number": 4375,
-        "precision": 0.6537524366471735,
-        "recall": 0.6132571428571428
-      },
-      "eval_loss": 1.0017756223678589,
-      "eval_nationality": {
-        "f1": 0.6760161635369623,
-        "number": 2137,
-        "precision": 0.6869565217391305,
-        "recall": 0.6654188114178755
-      },
-      "eval_organization": {
-        "f1": 0.5447824850725049,
-        "number": 1982,
-        "precision": 0.6241042345276873,
-        "recall": 0.48335015136226034
-      },
-      "eval_overall_accuracy": 0.8219457041840011,
-      "eval_overall_f1": 0.6276163319784019,
-      "eval_overall_precision": 0.643866309827597,
-      "eval_overall_recall": 0.6121664003787206,
-      "eval_person": {
-        "f1": 0.7596614950634696,
-        "number": 3322,
-        "precision": 0.7147027600849257,
-        "recall": 0.8106562311860325
-      },
-      "eval_product": {
-        "f1": 0.3699421965317919,
-        "number": 323,
-        "precision": 0.4897959183673469,
-        "recall": 0.29721362229102166
-      },
-      "eval_runtime": 44.5273,
-      "eval_samples_per_second": 35.372,
-      "eval_time": {
-        "f1": 0.5069974554707379,
-        "number": 1689,
-        "precision": 0.547766323024055,
-        "recall": 0.4718768502072232
-      },
-      "step": 20000
-    },
-    {
-      "epoch": 2.53,
-      "learning_rate": 1.1561702477978102e-05,
-      "loss": 0.2197,
-      "step": 20500
-    },
-    {
-      "epoch": 2.59,
-      "learning_rate": 1.1355890343294642e-05,
-      "loss": 0.2239,
-      "step": 21000
-    },
-    {
-      "epoch": 2.65,
-      "learning_rate": 1.115007820861118e-05,
-      "loss": 0.2231,
-      "step": 21500
-    },
-    {
-      "epoch": 2.72,
-      "learning_rate": 1.0944266073927721e-05,
-      "loss": 0.2045,
-      "step": 22000
-    },
-    {
-      "epoch": 2.78,
-      "learning_rate": 1.0738453939244258e-05,
-      "loss": 0.1935,
-      "step": 22500
-    },
-    {
-      "epoch": 2.84,
-      "learning_rate": 1.0532641804560796e-05,
-      "loss": 0.2156,
-      "step": 23000
-    },
-    {
-      "epoch": 2.9,
-      "learning_rate": 1.0326829669877336e-05,
-      "loss": 0.2088,
-      "step": 23500
-    },
-    {
-      "epoch": 2.96,
-      "learning_rate": 1.0121017535193875e-05,
-      "loss": 0.2022,
-      "step": 24000
-    },
-    {
-      "epoch": 3.03,
-      "learning_rate": 9.915205400510415e-06,
-      "loss": 0.1918,
-      "step": 24500
-    },
-    {
-      "epoch": 3.09,
-      "learning_rate": 9.709393265826953e-06,
-      "loss": 0.1494,
-      "step": 25000
-    },
-    {
-      "epoch": 3.15,
-      "learning_rate": 9.503581131143494e-06,
-      "loss": 0.1502,
-      "step": 25500
-    },
-    {
-      "epoch": 3.21,
-      "learning_rate": 9.297768996460032e-06,
-      "loss": 0.1741,
-      "step": 26000
-    },
-    {
-      "epoch": 3.27,
-      "learning_rate": 9.09195686177657e-06,
-      "loss": 0.1609,
-      "step": 26500
-    },
-    {
-      "epoch": 3.33,
-      "learning_rate": 8.88614472709311e-06,
-      "loss": 0.1584,
-      "step": 27000
-    },
-    {
-      "epoch": 3.4,
-      "learning_rate": 8.680332592409649e-06,
-      "loss": 0.1524,
-      "step": 27500
-    },
-    {
-      "epoch": 3.46,
-      "learning_rate": 8.47452045772619e-06,
-      "loss": 0.1513,
-      "step": 28000
-    },
-    {
-      "epoch": 3.52,
-      "learning_rate": 8.268708323042726e-06,
-      "loss": 0.1595,
-      "step": 28500
-    },
-    {
-      "epoch": 3.58,
-      "learning_rate": 8.062896188359266e-06,
-      "loss": 0.1631,
-      "step": 29000
-    },
-    {
-      "epoch": 3.64,
-      "learning_rate": 7.857084053675805e-06,
-      "loss": 0.1795,
-      "step": 29500
-    },
-    {
-      "epoch": 3.7,
-      "learning_rate": 7.651271918992345e-06,
-      "loss": 0.1602,
-      "step": 30000
-    },
-    {
-      "epoch": 3.7,
-      "eval_artwork": {
-        "f1": 0.32594936708860756,
-        "number": 295,
-        "precision": 0.3056379821958457,
-        "recall": 0.34915254237288135
-      },
-      "eval_event": {
-        "f1": 0.42843232716650437,
-        "number": 519,
-        "precision": 0.4330708661417323,
-        "recall": 0.4238921001926782
-      },
-      "eval_job": {
-        "f1": 0.6932195353247985,
-        "number": 2257,
-        "precision": 0.7455379908210097,
-        "recall": 0.6477625166149756
-      },
-      "eval_location": {
-        "f1": 0.6270144927536232,
-        "number": 4375,
-        "precision": 0.636235294117647,
-        "recall": 0.6180571428571429
-      },
-      "eval_loss": 1.0499603748321533,
-      "eval_nationality": {
-        "f1": 0.6754837129561596,
-        "number": 2137,
-        "precision": 0.7086330935251799,
-        "recall": 0.6452971455311184
-      },
-      "eval_organization": {
-        "f1": 0.5687919463087249,
-        "number": 1982,
-        "precision": 0.6380175658720201,
-        "recall": 0.5131180625630676
-      },
-      "eval_overall_accuracy": 0.8283547593168672,
-      "eval_overall_f1": 0.6409662071489569,
-      "eval_overall_precision": 0.6613380326011706,
-      "eval_overall_recall": 0.6218119415350021,
-      "eval_person": {
-        "f1": 0.7734217353704237,
-        "number": 3322,
-        "precision": 0.7419800884955752,
-        "recall": 0.8076459963877183
-      },
-      "eval_product": {
-        "f1": 0.4022556390977444,
-        "number": 323,
-        "precision": 0.5119617224880383,
-        "recall": 0.33126934984520123
-      },
-      "eval_runtime": 43.8719,
-      "eval_samples_per_second": 35.9,
-      "eval_time": {
-        "f1": 0.5277161862527716,
-        "number": 1689,
-        "precision": 0.5674386920980926,
-        "recall": 0.4931912374185909
-      },
-      "step": 30000
-    }
-  ],
-  "max_steps": 48588,
-  "num_train_epochs": 6,
-  "total_flos": 3961931727576942.0,
-  "trial_name": null,
-  "trial_params": null
-}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e527ceb877458f834cb18192456e4ff3a0e2f3d9c8ae07805f23f677c165715f
-size 2479

 version https://git-lfs.github.com/spec/v1
+oid sha256:38da682fc8f5b1a45d948e5165d753debd1ee21627415b23d05208ce7115c6d8
+size 3183