Training in progress, epoch 0

Files changed (6) hide show

adapter_config.json CHANGED Viewed

@@ -6,10 +6,14 @@
   "fan_in_fan_out": false,
   "inference_mode": true,
   "init_lora_weights": true,
   "layers_pattern": null,
   "layers_to_transform": null,
   "lora_alpha": 16,
   "lora_dropout": 0.05,
   "modules_to_save": null,
   "peft_type": "LORA",
   "r": 16,
@@ -19,5 +23,7 @@
     "q_proj",
     "v_proj"
   ],
-  "task_type": "CAUSAL_LM"
 }

   "fan_in_fan_out": false,
   "inference_mode": true,
   "init_lora_weights": true,
+  "layer_replication": null,
   "layers_pattern": null,
   "layers_to_transform": null,
+  "loftq_config": {},
   "lora_alpha": 16,
   "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
   "modules_to_save": null,
   "peft_type": "LORA",
   "r": 16,
     "q_proj",
     "v_proj"
   ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": false
 }

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25a2710e0d4284fad1ce9dbe15095b84a272ff38140547a82daadb6c8ac9097f
 size 9022864

 version https://git-lfs.github.com/spec/v1
+oid sha256:b9f9f7e31c10d2d7241d416134746fbf94b145be4982024c7b5e56dcfc3061e5
 size 9022864

runs/May26_14-45-21_17380bee5ce8/events.out.tfevents.1716734721.17380bee5ce8.172.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6de925ff722eceb0ab7b2d973bb979706e53b374c223a786050a53e4491dee28
+size 6128

tokenizer.json CHANGED Viewed

@@ -139,6 +139,7 @@
     "end_of_word_suffix": null,
     "fuse_unk": true,
     "byte_fallback": true,
     "vocab": {
       "<unk>": 0,
       "<s>": 1,

     "end_of_word_suffix": null,
     "fuse_unk": true,
     "byte_fallback": true,
+    "ignore_merges": false,
     "vocab": {
       "<unk>": 0,
       "<s>": 1,

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,6 @@
 {
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",
@@ -29,7 +31,6 @@
   "chat_template": "{% for message in messages %}\n{% if message['role'] == 'user' %}\n{{ '<|user|>\n' + message['content'] + eos_token }}\n{% elif message['role'] == 'system' %}\n{{ '<|system|>\n' + message['content'] + eos_token }}\n{% elif message['role'] == 'assistant' %}\n{{ '<|assistant|>\n'  + message['content'] + eos_token }}\n{% endif %}\n{% if loop.last and add_generation_prompt %}\n{{ '<|assistant|>' }}\n{% endif %}\n{% endfor %}",
   "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
-  "legacy": false,
   "model_max_length": 2048,
   "pad_token": "</s>",
   "padding_side": "right",

 {
+  "add_bos_token": true,
+  "add_eos_token": false,
   "added_tokens_decoder": {
     "0": {
       "content": "<unk>",
   "chat_template": "{% for message in messages %}\n{% if message['role'] == 'user' %}\n{{ '<|user|>\n' + message['content'] + eos_token }}\n{% elif message['role'] == 'system' %}\n{{ '<|system|>\n' + message['content'] + eos_token }}\n{% elif message['role'] == 'assistant' %}\n{{ '<|assistant|>\n'  + message['content'] + eos_token }}\n{% endif %}\n{% if loop.last and add_generation_prompt %}\n{{ '<|assistant|>' }}\n{% endif %}\n{% endfor %}",
   "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
   "model_max_length": 2048,
   "pad_token": "</s>",
   "padding_side": "right",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0b2d6d7a74acb20027b4245ba06849210082b9a1965ffec1a8c7af3d1ca78aa
-size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:cf4124db35b17ef8b61b26eee09905d55ca312b41c0cba78df81b2ce578c37a5
+size 5112