Training complete

Browse files

Files changed (5) hide show

README.md +71 -0
generation_config.json +6 -0
model.safetensors +1 -1
runs/Jun09_22-50-23_cbe34cfbb050/events.out.tfevents.1717973469.cbe34cfbb050.161.0 +2 -2
runs/Jun09_22-50-23_cbe34cfbb050/events.out.tfevents.1717977800.cbe34cfbb050.161.1 +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,71 @@

+---
+license: apache-2.0
+base_model: google/mt5-small
+tags:
+- summarization
+- generated_from_trainer
+metrics:
+- rouge
+model-index:
+- name: mt5-small-finetuned-news-summary-kaggle
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# mt5-small-finetuned-news-summary-kaggle
+This model is a fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.5691
+- Rouge1: 29.8633
+- Rouge2: 11.698
+- Rougel: 26.8739
+- Rougelsum: 26.8536
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5.6e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 8
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|
+| 8.1234        | 1.0   | 440  | 3.3123          | 18.1738 | 5.9811  | 16.7457 | 16.7126   |
+| 4.2107        | 2.0   | 880  | 2.8404          | 23.009  | 8.3824  | 20.9074 | 20.8962   |
+| 3.738         | 3.0   | 1320 | 2.7354          | 26.5696 | 10.1059 | 23.9321 | 24.0214   |
+| 3.4864        | 4.0   | 1760 | 2.6756          | 27.193  | 10.1971 | 24.4763 | 24.4933   |
+| 3.3642        | 5.0   | 2200 | 2.6224          | 28.7842 | 11.5323 | 26.317  | 26.3211   |
+| 3.269         | 6.0   | 2640 | 2.5883          | 29.6579 | 11.8043 | 26.8824 | 26.8692   |
+| 3.212         | 7.0   | 3080 | 2.5677          | 29.7513 | 11.6639 | 26.6042 | 26.64     |
+| 3.186         | 8.0   | 3520 | 2.5691          | 29.8633 | 11.698  | 26.8739 | 26.8536   |
+### Framework versions
+- Transformers 4.41.2
+- Pytorch 2.3.0+cu121
+- Datasets 2.19.2
+- Tokenizers 0.19.1

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "decoder_start_token_id": 0,
+  "eos_token_id": 1,
+  "pad_token_id": 0,
+  "transformers_version": "4.41.2"
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:479ce86521f75c3566400c11ce807b89bf097fc7a093793837325073898d83be
 size 1200729512

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a1c524335d2a2ab2ba424c43409c7c92be5d39590628041f06e52b61e2af869
 size 1200729512

runs/Jun09_22-50-23_cbe34cfbb050/events.out.tfevents.1717973469.cbe34cfbb050.161.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2114c1c2be9c225f07fe1dbe843bbb2af841eda020b2c1a2e963707acefe38d2
-size 10166

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0a6f958e89dffad4d411107d4b44f954de84f3f48a96d3a7d94e7e2be8580b0
+size 10994

runs/Jun09_22-50-23_cbe34cfbb050/events.out.tfevents.1717977800.cbe34cfbb050.161.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3399b9c11b2fb01d459c7e6122612e2c214ef918e2524cce72732a7cb831ef20
+size 562