Upload 8 files

Files changed (4) hide show

adapter_config.json CHANGED Viewed

@@ -20,10 +20,10 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "k_proj",
     "v_proj",
-    "q_proj",
-    "o_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "o_proj",
     "k_proj",
     "v_proj",
+    "q_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91758a67c2d36dbe7b908bdb1ff9fa5b8d840bedcaefaf23349f1c612cbf68de
 size 109086416

 version https://git-lfs.github.com/spec/v1
+oid sha256:68aa2b1c7c2e51a56f45109f3e6b536bc5583635b1c919a7b6fed5f01f8ba2ca
 size 109086416

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2dfd5128ec3327bedd3f04ce7709fcb8344e84908fb24337165220dfc0c42934
 size 54937428

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c86c41d5d224348b3694d7c40a2b212ccc4d94532a1609f88a532b7574e3edb
 size 54937428

trainer_state.json CHANGED Viewed

@@ -10,32 +10,32 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "grad_norm": 0.566752016544342,
       "learning_rate": 0.00020029985007496252,
-      "loss": 0.7277,
       "step": 334
     },
     {
       "epoch": 1.0,
-      "eval_loss": 0.6203442811965942,
-      "eval_runtime": 18.8339,
-      "eval_samples_per_second": 7.911,
-      "eval_steps_per_second": 1.009,
       "step": 334
     },
     {
       "epoch": 2.0,
-      "grad_norm": 1.7554653882980347,
       "learning_rate": 0.0,
-      "loss": 0.5489,
       "step": 668
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.5755637884140015,
-      "eval_runtime": 18.8718,
-      "eval_samples_per_second": 7.895,
-      "eval_steps_per_second": 1.007,
       "step": 668
     }
   ],

   "log_history": [
     {
       "epoch": 1.0,
+      "grad_norm": 0.5824499130249023,
       "learning_rate": 0.00020029985007496252,
+      "loss": 0.7207,
       "step": 334
     },
     {
       "epoch": 1.0,
+      "eval_loss": 0.6183570027351379,
+      "eval_runtime": 19.1158,
+      "eval_samples_per_second": 7.795,
+      "eval_steps_per_second": 0.994,
       "step": 334
     },
     {
       "epoch": 2.0,
+      "grad_norm": 1.8464447259902954,
       "learning_rate": 0.0,
+      "loss": 0.5474,
       "step": 668
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.5748867392539978,
+      "eval_runtime": 19.0049,
+      "eval_samples_per_second": 7.84,
+      "eval_steps_per_second": 1.0,
       "step": 668
     }
   ],