robingeibel
/

reformer-finetuned-big_patent-wikipedia-arxiv-16384

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

robingeibel commited on Jul 19, 2022

Commit

90d8cdd

•

1 Parent(s): 3c7bae8

update model card README.md

Files changed (1) hide show

README.md +9 -9

README.md CHANGED Viewed

@@ -2,7 +2,7 @@
 tags:
 - generated_from_trainer
 datasets:
-- scientific_papers
 model-index:
 - name: reformer-finetuned-big_patent-wikipedia-arxiv-16384
   results: []
@@ -13,9 +13,9 @@ should probably proofread and complete it, then remove this comment. -->
 # reformer-finetuned-big_patent-wikipedia-arxiv-16384
-This model is a fine-tuned version of [robingeibel/reformer-finetuned-big_patent-wikipedia-arxiv-16384](https://huggingface.co/robingeibel/reformer-finetuned-big_patent-wikipedia-arxiv-16384) on the scientific_papers dataset.
 It achieves the following results on the evaluation set:
-- Loss: 6.4374
 ## Model description
@@ -34,7 +34,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
@@ -45,11 +45,11 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step   | Validation Loss |
-|:-------------:|:-----:|:------:|:---------------:|
-| 6.2765        | 1.0   | 104873 | 6.2908          |
-| 6.2281        | 2.0   | 209746 | 6.3285          |
-| 6.2325        | 3.0   | 314619 | 6.4374          |
 ### Framework versions

 tags:
 - generated_from_trainer
 datasets:
+- wikipedia
 model-index:
 - name: reformer-finetuned-big_patent-wikipedia-arxiv-16384
   results: []
 # reformer-finetuned-big_patent-wikipedia-arxiv-16384
+This model is a fine-tuned version of [robingeibel/reformer-finetuned-big_patent-wikipedia-arxiv-16384](https://huggingface.co/robingeibel/reformer-finetuned-big_patent-wikipedia-arxiv-16384) on the wikipedia dataset.
 It achieves the following results on the evaluation set:
+- Loss: 6.5256
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2.5e-06
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss |
+|:-------------:|:-----:|:-----:|:---------------:|
+| 8.0368        | 1.0   | 3785  | 6.7392          |
+| 6.7992        | 2.0   | 7570  | 6.5576          |
+| 6.6926        | 3.0   | 11355 | 6.5256          |
 ### Framework versions