llava-1.5-7b-hf-ft-mix-vsft / tokenizer_config.json

Training in progress, step 100

4b0a7a5 verified about 1 month ago

1.73 kB

	{
	"add_bos_token": true,
	"add_eos_token": false,
	"add_prefix_space": null,
	"added_tokens_decoder": {
	"0": {
	"content": "<unk>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"1": {
	"content": "<s>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"2": {
	"content": "</s>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"32000": {
	"content": "<image>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"32001": {
	"content": "<pad>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	}
	},
	"bos_token": "<s>",
	"chat_template": "\nA chat between a curious user and an artificial intelligence assistant.\nThe assistant gives helpful, detailed, and polite answers to the user's questions.\n{% for message in messages %}\n{% if message['from'] == 'USER' %}USER: {{ message['value'] }}\n{% else %}ASSISTANT: {{ message['value'] }}{{ eos_token }}\n{% endif %}\n{% endfor %}\n",
	"clean_up_tokenization_spaces": false,
	"eos_token": "</s>",
	"legacy": false,
	"model_max_length": 1000000000000000019884624838656,
	"pad_token": "<pad>",
	"padding_side": "left",
	"processor_class": "LlavaProcessor",
	"sp_model_kwargs": {},
	"tokenizer_class": "LlamaTokenizer",
	"trust_remote_code": false,
	"unk_token": "<unk>",
	"use_default_system_prompt": false
	}