Graphcore
/

gpt2-medium-wikitext-103

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

internetoftim commited on May 25, 2022

Commit

31d8e00

•

1 Parent(s): 3d2a3c3

Update README.md

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -23,13 +23,16 @@ GPT2 is a large transformer-based language model. It is built using transformer
 Paper link : [Language Models are Unsupervised Multitask Learners](https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf)
-## Training and evaluation data
 This model is a fine-tuned version of [gpt2-medium](https://huggingface.co/gpt2-medium) on the [wikitext-103-raw-v1](https://huggingface.co/datasets/wikitext) dataset.
 It achieves the following results on the evaluation set:
 - Loss: 2.6973
-[wikitext-103-raw-v1](https://huggingface.co/datasets/wikitext) dataset
 ## Training procedure

 Paper link : [Language Models are Unsupervised Multitask Learners](https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf)
+## Intended uses & limitations
 This model is a fine-tuned version of [gpt2-medium](https://huggingface.co/gpt2-medium) on the [wikitext-103-raw-v1](https://huggingface.co/datasets/wikitext) dataset.
 It achieves the following results on the evaluation set:
 - Loss: 2.6973
+## Training and evaluation data
+Trained on wikipedia dataset:
+- [HuggingFace/wikitext-103-raw-v1](https://huggingface.co/datasets/wikitext) dataset
 ## Training procedure