microsoft
/

DialoGPT-large

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Add `eos_token` to the tokenizer config.

#17

by Wauplin HF staff - opened Feb 28

base: refs/heads/main

←

from: refs/pr/17

Discussion Files changed

Files changed (1) hide show

tokenizer_config.json +21 -2

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,23 @@
 {
   "model_max_length": 1024,
-  "chat_template": "{% for message in messages %}{{ message.content }}{{ eos_token }}{% endfor %}"
-}

 {
+  "add_bos_token": false,
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "50256": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<|endoftext|>",
+  "chat_template": "{% for message in messages %}{{ message.content }}{{ eos_token }}{% endfor %}",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|endoftext|>",
+  "errors": "replace",
   "model_max_length": 1024,
+  "pad_token": null,
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "<|endoftext|>"
+}