Training in progress, step 500

Files changed (11) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+generated_predictions.json filter=lfs diff=lfs merge=lfs -text

all_results.json CHANGED Viewed

@@ -1,12 +1,15 @@
 {
-    "predict_gen_len": 28.834,
-    "predict_loss": 1.8422898054122925,
-    "predict_rouge1": 0.4278,
-    "predict_rouge2": 0.1789,
-    "predict_rougeL": 0.3407,
-    "predict_rougeLsum": 0.3407,
-    "predict_runtime": 2061.934,
     "predict_samples": 11334,
-    "predict_samples_per_second": 5.497,
-    "predict_steps_per_second": 0.172
 }

 {
+    "predict_f1": 0.906,
+    "predict_gen_len": 30.77916004940886,
+    "predict_loss": 1.6894419193267822,
+    "predict_precision": 0.9008,
+    "predict_recall": 0.9115,
+    "predict_rouge1": 0.4408,
+    "predict_rouge2": 0.1888,
+    "predict_rougeL": 0.3528,
+    "predict_rougeLsum": 0.3528,
+    "predict_runtime": 3437.6578,
     "predict_samples": 11334,
+    "predict_samples_per_second": 3.297,
+    "predict_steps_per_second": 0.412
 }

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "Models/LLM_Teached_Pegasus_Large",
   "activation_dropout": 0.1,
   "activation_function": "relu",
   "add_bias_logits": false,

 {
+  "_name_or_path": "google/pegasus-large",
   "activation_dropout": 0.1,
   "activation_function": "relu",
   "add_bias_logits": false,

generated_predictions.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ecfb91cde9f4511dac83b80773fe9ee62662db70716fef5053335fca4b6b7417
+size 27483141

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab52b4b7f1b050bd880fa12529d3c148fdd68fce219a518cfcb8e630a158c091
 size 2283652852

 version https://git-lfs.github.com/spec/v1
+oid sha256:9dcd871daccefb604319e20da7a0b9417139e5708de62c77da9decf2ca46f79f
 size 2283652852

predict_results.json CHANGED Viewed

@@ -1,12 +1,15 @@
 {
-    "predict_gen_len": 28.834,
-    "predict_loss": 1.8422898054122925,
-    "predict_rouge1": 0.4278,
-    "predict_rouge2": 0.1789,
-    "predict_rougeL": 0.3407,
-    "predict_rougeLsum": 0.3407,
-    "predict_runtime": 2061.934,
     "predict_samples": 11334,
-    "predict_samples_per_second": 5.497,
-    "predict_steps_per_second": 0.172
 }

 {
+    "predict_f1": 0.906,
+    "predict_gen_len": 30.77916004940886,
+    "predict_loss": 1.6894419193267822,
+    "predict_precision": 0.9008,
+    "predict_recall": 0.9115,
+    "predict_rouge1": 0.4408,
+    "predict_rouge2": 0.1888,
+    "predict_rougeL": 0.3528,
+    "predict_rougeLsum": 0.3528,
+    "predict_runtime": 3437.6578,
     "predict_samples": 11334,
+    "predict_samples_per_second": 3.297,
+    "predict_steps_per_second": 0.412
 }

runs/Dec28_18-55-30_n4bcoectr1703727001286-fmclw/events.out.tfevents.1703760935.n4bcoectr1703727001286-fmclw.222322.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6250ade1582b24a7e41a8e898a74a51ff41cc6f08621135abe92d27f3acfe73c
+size 7114

special_tokens_map.json CHANGED Viewed

@@ -103,32 +103,8 @@
     "<unk_101>",
     "<unk_102>"
   ],
-  "eos_token": {
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "mask_token": {
-    "content": "<mask_2>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "<pad>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "unk_token": {
-    "content": "<unk>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  }
 }

     "<unk_101>",
     "<unk_102>"
   ],
+  "eos_token": "</s>",
+  "mask_token": "<mask_2>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
 }

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -958,14 +958,10 @@
   "full_tokenizer_file": null,
   "mask_token": "<mask_2>",
   "mask_token_sent": "<mask_1>",
-  "max_length": 64,
   "model_max_length": 1024,
   "offset": 103,
   "pad_token": "<pad>",
   "sp_model_kwargs": {},
-  "stride": 0,
   "tokenizer_class": "PegasusTokenizer",
-  "truncation_side": "right",
-  "truncation_strategy": "longest_first",
   "unk_token": "<unk>"
 }

   "full_tokenizer_file": null,
   "mask_token": "<mask_2>",
   "mask_token_sent": "<mask_1>",
   "model_max_length": 1024,
   "offset": 103,
   "pad_token": "<pad>",
   "sp_model_kwargs": {},
   "tokenizer_class": "PegasusTokenizer",
   "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8c42f961a10319a18532a4b16bc9ea097d53e9ca0abae8d756ba4eb4b19798f
 size 4475

 version https://git-lfs.github.com/spec/v1
+oid sha256:a26d5b9dfa3bfcfd0497091597f4c9fea4cbd5ce2b580f26831e93dbcb596500
 size 4475