Training in progress, step 20

Files changed (7) hide show

adapter_config.json CHANGED Viewed

@@ -20,9 +20,9 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "qkv_proj",
     "gate_up_proj",
     "down_proj",
     "o_proj"
   ],
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_up_proj",
     "down_proj",
+    "qkv_proj",
     "o_proj"
   ],
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ceab4d46a606e222e8aad66faf1cec9196b2fa49f5e99fe94f5c1dde13cdbeb
 size 100697728

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b41dbfc268f977616f68bd00d472a1f8c2b902b8c4574dfa66d0de3e9157063
 size 100697728

runs/Aug21_13-52-07_B650E/events.out.tfevents.1724262738.B650E.11078.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cddef292310720c37fe2f6a7b61b80d7423ae62487dd1294a266e794608d8384
+size 8958

runs/Aug21_13-57-05_B650E/events.out.tfevents.1724263031.B650E.11724.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d82b9b85d78987139db7506c035525b4237d764313f04ef2b2cea6145cbb6936
+size 9993

runs/Aug21_14-12-58_B650E/events.out.tfevents.1724264208.B650E.14325.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:335d3039a558cb69db12c23c610a86870670cc49c2260e6dbb1857cf92b5ccc2
+size 13009

train_args.json ADDED Viewed

+{
+    "BASE_MODEL": "microsoft/Phi-3.5-mini-instruct",
+    "SEQ_LENGTH": 512,
+    "MAX_STEPS": 250,
+    "BATCH_SIZE": 4,
+    "GR_ACC_STEPS": 4,
+    "LR": 0.0002,
+    "LR_SCHEDULER_TYPE": "cosine",
+    "OPTIMIZER": "adamw_torch",
+    "WEIGHT_DECAY": 0.001,
+    "WARMUP_RATIO": 0.05,
+    "EVAL_FREQ": 10,
+    "SAVE_FREQ": 20,
+    "SAVE_LIMIT": 2,
+    "LOG_FREQ": 1,
+    "BF16": true,
+    "FP16": false,
+    "FIM_RATE": 0.5,
+    "FIM_SPM_RAT": 0.5,
+    "LORA_R": 16,
+    "LORA_ALPHA": 48,
+    "LORA_DROPOUT": 0.0,
+    "LORA_TARGET_MODULES": "all-linear",
+    "USE_NESTED_QUANT": true,
+    "BNB_4BIT_COMPUTE_DTYPE": "bfloat16",
+    "load_in_8bit": true,
+    "SEED": 0,
+    "EARLY_STOP_PATIENCE": 3,
+    "EARLY_STOP_THRESHOLD": 0.01
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec44a5f4553a62c475aa10ccd5d67ebc7d6a90b4ebf0d53848e1b2a467c6b898
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:1024b1fced171dbdcc548744e15886402d1da3c41af9576db19aeedd489e34c7
 size 5240