End of training

Browse files

Files changed (7) hide show

README.md +18 -15
config.json +1 -1
generation_config.json +1 -1
logs/events.out.tfevents.1712422001.c95cc94d97f3.2364.0 +3 -0
logs/events.out.tfevents.1712431267.c95cc94d97f3.2364.1 +3 -0
model.safetensors +1 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.6515
-- Rouge1: 33.8635
-- Rouge2: 27.4791
-- Rougel: 33.8476
-- Rougelsum: 33.8364
-- Gen Len: 6.7861
 ## Model description
@@ -42,27 +42,30 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| 1.2344        | 1.0   | 3028  | 1.7377          | 35.027  | 28.4749 | 35.0561 | 34.9832   | 6.975   |
-| 1.0665        | 2.0   | 6056  | 1.6887          | 33.9581 | 27.5342 | 33.9114 | 33.8885   | 6.5995  |
-| 1.0313        | 3.0   | 9084  | 1.6515          | 33.8635 | 27.4791 | 33.8476 | 33.8364   | 6.7861  |
-| 0.9957        | 4.0   | 12112 | 1.6793          | 34.3439 | 27.7857 | 34.3413 | 34.3188   | 6.7572  |
-| 0.9688        | 5.0   | 15140 | 1.6570          | 34.2704 | 27.6975 | 34.2984 | 34.2296   | 6.7659  |
 ### Framework versions
-- Transformers 4.39.1
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.6665
+- Rouge1: 34.5395
+- Rouge2: 28.1355
+- Rougel: 34.511
+- Rougelsum: 34.5702
+- Gen Len: 6.4385
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 4
+- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 8
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
+| 1.1889        | 1.0   | 6056  | 1.7462          | 35.0128 | 28.2062 | 34.9183 | 34.9898   | 7.2062  |
+| 1.0076        | 2.0   | 12112 | 1.7262          | 34.4492 | 27.6944 | 34.3991 | 34.4121   | 6.8452  |
+| 0.9798        | 3.0   | 18168 | 1.6861          | 34.5767 | 28.1063 | 34.5199 | 34.5759   | 6.6332  |
+| 0.9324        | 4.0   | 24224 | 1.7051          | 34.2272 | 27.9947 | 34.2424 | 34.2402   | 6.8740  |
+| 0.8892        | 5.0   | 30280 | 1.6665          | 34.5395 | 28.1355 | 34.511  | 34.5702   | 6.4385  |
+| 0.809         | 6.0   | 36336 | 1.7787          | 34.0894 | 27.6763 | 34.0998 | 34.1103   | 6.6721  |
+| 0.7897        | 7.0   | 42392 | 1.7404          | 33.8737 | 27.6484 | 33.8941 | 33.9224   | 6.5274  |
+| 0.7302        | 8.0   | 48448 | 1.7334          | 33.7942 | 27.6188 | 33.8028 | 33.8252   | 6.4447  |
 ### Framework versions
+- Transformers 4.39.3
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -55,7 +55,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.39.1",
   "use_cache": true,
   "vocab_size": 32128
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
   "use_cache": true,
   "vocab_size": 32128
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.39.1"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.39.3"
 }

logs/events.out.tfevents.1712422001.c95cc94d97f3.2364.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:596bb6533363111af91443975e0809e9eb1cc87c4878a28f80f707583a6102e6
+size 30715

logs/events.out.tfevents.1712431267.c95cc94d97f3.2364.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3038893d7a70724065152b15c5b39a1626b684f2e3490e5cd15aa1c81cb2ebda
+size 623

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e661afc5e1691502bf8943cab23dc9e94886c970c4387a7f65c37b07534f952
 size 242041896

 version https://git-lfs.github.com/spec/v1
+oid sha256:a431fc7b98a0baf5ce805a3d1abb0390f69498527ca59dd4cf2fee09751720e8
 size 242041896

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c90fa406f22e7f6a58ab5fcf237ec4e19f58d67fa43599ac762a31900cc1de81
-size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0299ef4492e00b979c74ad2c539fbb74eb5fe027bb5ad312cfc15e38c84e12d
+size 5112