Update tokenizer_config.json

Need to add bos_token, eos_token and unk_token explicitly. Otherwise, it causes maximum recursion depth error. See https://github.com/EleutherAI/lm-evaluation-harness/issues/442

Files changed (1) hide show

tokenizer_config.json +3 -3

tokenizer_config.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "bos_token": "",
-  "eos_token": "",
   "model_max_length": 512,
   "padding_side": "right",
   "special_tokens_map_file": "/root/.cache/huggingface/hub/models--decapoda-research--llama-13b-hf/snapshots/438770a656712a5072229b62256521845d4de5ce/special_tokens_map.json",
   "tokenizer_class": "LlamaTokenizer",
-  "unk_token": ""
 }

 {
+  "bos_token": "<s>",
+  "eos_token": "</s>",
   "model_max_length": 512,
   "padding_side": "right",
   "special_tokens_map_file": "/root/.cache/huggingface/hub/models--decapoda-research--llama-13b-hf/snapshots/438770a656712a5072229b62256521845d4de5ce/special_tokens_map.json",
   "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>"
 }