Training in progress, step 1000

Browse files

Files changed (4) hide show

adapter_config.json +37 -37
adapter_model.safetensors +1 -1
runs/Jul13_14-11-46_dc5a3487e29b/events.out.tfevents.1720879919.dc5a3487e29b.34.0 +3 -0
training_args.bin +1 -1

adapter_config.json CHANGED Viewed

@@ -23,54 +23,54 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "model.decoder.layers.6.self_attn.q_proj",
     "model.decoder.layers.1.self_attn.q_proj",
-    "model.decoder.layers.4.encoder_attn.v_proj",
-    "model.decoder.layers.7.self_attn.v_proj",
-    "model.decoder.layers.1.encoder_attn.v_proj",
-    "model.decoder.layers.9.encoder_attn.v_proj",
-    "model.decoder.layers.7.encoder_attn.v_proj",
     "model.decoder.layers.10.self_attn.v_proj",
-    "model.decoder.layers.3.self_attn.v_proj",
-    "model.decoder.layers.0.self_attn.v_proj",
-    "model.decoder.layers.5.self_attn.v_proj",
-    "model.decoder.layers.6.self_attn.v_proj",
-    "model.decoder.layers.6.encoder_attn.q_proj",
-    "model.decoder.layers.2.encoder_attn.v_proj",
     "model.decoder.layers.8.self_attn.q_proj",
-    "model.decoder.layers.9.self_attn.q_proj",
     "model.decoder.layers.3.self_attn.q_proj",
     "model.decoder.layers.11.self_attn.v_proj",
-    "model.decoder.layers.1.self_attn.v_proj",
     "model.decoder.layers.2.encoder_attn.q_proj",
-    "model.decoder.layers.11.self_attn.q_proj",
-    "model.decoder.layers.6.encoder_attn.v_proj",
-    "model.decoder.layers.2.self_attn.q_proj",
-    "model.decoder.layers.9.encoder_attn.q_proj",
-    "model.decoder.layers.10.encoder_attn.v_proj",
-    "model.decoder.layers.8.self_attn.v_proj",
-    "model.decoder.layers.11.encoder_attn.q_proj",
     "model.decoder.layers.7.encoder_attn.q_proj",
-    "model.decoder.layers.5.self_attn.q_proj",
     "model.decoder.layers.8.encoder_attn.q_proj",
     "model.decoder.layers.3.encoder_attn.q_proj",
-    "model.decoder.layers.8.encoder_attn.v_proj",
-    "model.decoder.layers.9.self_attn.v_proj",
     "model.decoder.layers.2.self_attn.v_proj",
-    "model.decoder.layers.0.encoder_attn.q_proj",
-    "model.decoder.layers.5.encoder_attn.q_proj",
-    "model.decoder.layers.0.self_attn.q_proj",
-    "model.decoder.layers.10.self_attn.q_proj",
-    "model.decoder.layers.11.encoder_attn.v_proj",
-    "model.decoder.layers.10.encoder_attn.q_proj",
-    "model.decoder.layers.7.self_attn.q_proj",
-    "model.decoder.layers.3.encoder_attn.v_proj",
-    "model.decoder.layers.1.encoder_attn.q_proj",
-    "model.decoder.layers.4.self_attn.v_proj",
-    "model.decoder.layers.4.encoder_attn.q_proj",
     "model.decoder.layers.5.encoder_attn.v_proj",
-    "model.decoder.layers.4.self_attn.q_proj",
-    "model.decoder.layers.0.encoder_attn.v_proj"
   ],
   "task_type": null,
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "model.decoder.layers.10.self_attn.q_proj",
+    "model.decoder.layers.1.encoder_attn.q_proj",
     "model.decoder.layers.1.self_attn.q_proj",
+    "model.decoder.layers.4.self_attn.v_proj",
+    "model.decoder.layers.3.encoder_attn.v_proj",
     "model.decoder.layers.10.self_attn.v_proj",
+    "model.decoder.layers.10.encoder_attn.v_proj",
+    "model.decoder.layers.0.self_attn.q_proj",
     "model.decoder.layers.8.self_attn.q_proj",
+    "model.decoder.layers.9.encoder_attn.v_proj",
+    "model.decoder.layers.8.encoder_attn.v_proj",
+    "model.decoder.layers.9.self_attn.v_proj",
     "model.decoder.layers.3.self_attn.q_proj",
+    "model.decoder.layers.9.encoder_attn.q_proj",
+    "model.decoder.layers.0.encoder_attn.q_proj",
+    "model.decoder.layers.11.self_attn.q_proj",
+    "model.decoder.layers.4.self_attn.q_proj",
+    "model.decoder.layers.7.self_attn.v_proj",
+    "model.decoder.layers.0.self_attn.v_proj",
+    "model.decoder.layers.2.encoder_attn.v_proj",
+    "model.decoder.layers.6.encoder_attn.q_proj",
+    "model.decoder.layers.11.encoder_attn.v_proj",
+    "model.decoder.layers.10.encoder_attn.q_proj",
+    "model.decoder.layers.5.encoder_attn.q_proj",
     "model.decoder.layers.11.self_attn.v_proj",
     "model.decoder.layers.2.encoder_attn.q_proj",
     "model.decoder.layers.7.encoder_attn.q_proj",
+    "model.decoder.layers.5.self_attn.v_proj",
+    "model.decoder.layers.6.self_attn.q_proj",
+    "model.decoder.layers.6.self_attn.v_proj",
     "model.decoder.layers.8.encoder_attn.q_proj",
+    "model.decoder.layers.11.encoder_attn.q_proj",
+    "model.decoder.layers.7.self_attn.q_proj",
+    "model.decoder.layers.4.encoder_attn.v_proj",
+    "model.decoder.layers.0.encoder_attn.v_proj",
+    "model.decoder.layers.1.self_attn.v_proj",
     "model.decoder.layers.3.encoder_attn.q_proj",
+    "model.decoder.layers.2.self_attn.q_proj",
+    "model.decoder.layers.5.self_attn.q_proj",
+    "model.decoder.layers.7.encoder_attn.v_proj",
+    "model.decoder.layers.8.self_attn.v_proj",
+    "model.decoder.layers.9.self_attn.q_proj",
+    "model.decoder.layers.6.encoder_attn.v_proj",
     "model.decoder.layers.2.self_attn.v_proj",
+    "model.decoder.layers.1.encoder_attn.v_proj",
     "model.decoder.layers.5.encoder_attn.v_proj",
+    "model.decoder.layers.4.encoder_attn.q_proj",
+    "model.decoder.layers.3.self_attn.v_proj"
   ],
   "task_type": null,
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8864076ddb87e4f237a8990e2e1a1c5a87fb34ab1bcb6374ea7395890a2acf01
 size 2372656

 version https://git-lfs.github.com/spec/v1
+oid sha256:685233a349ad7a6cf1730a6653b290be929c8ffe220770019a1bbf4f4e9b2319
 size 2372656

runs/Jul13_14-11-46_dc5a3487e29b/events.out.tfevents.1720879919.dc5a3487e29b.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f6652d6eaa1a27dd954324fb9caf5e9c7499aff4ae3331700264dfa8f18141d
+size 15800

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0f4dd564d69cef94818a390f9cabb60739858f6aaf3c1989caa4dafdc95e873
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:00b31526909fdcfa15f7feb9ab54e77748affe3723a4a1735cf9546f96668f00
 size 5240