Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

README.md +3 -2
adapter_config.json +4 -4
adapter_model.bin +1 -1
optimizer.pt +1 -1
trainer_state.json +16 -16
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -18,6 +18,7 @@ base_model: Qwen/Qwen-14B
 - **Developed by:** [More Information Needed]
 - **Shared by [optional]:** [More Information Needed]
 - **Model type:** [More Information Needed]
 - **Language(s) (NLP):** [More Information Needed]
@@ -76,7 +77,7 @@ Use the code below to get started with the model.
 ### Training Data
-<!-- This should link to a Data Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
 [More Information Needed]
@@ -107,7 +108,7 @@ Use the code below to get started with the model.
 #### Testing Data
-<!-- This should link to a Data Card if possible. -->
 [More Information Needed]

 - **Developed by:** [More Information Needed]
+- **Funded by [optional]:** [More Information Needed]
 - **Shared by [optional]:** [More Information Needed]
 - **Model type:** [More Information Needed]
 - **Language(s) (NLP):** [More Information Needed]
 ### Training Data
+<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
 [More Information Needed]
 #### Testing Data
+<!-- This should link to a Dataset Card if possible. -->
 [More Information Needed]

adapter_config.json CHANGED Viewed

@@ -16,14 +16,14 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "k_proj",
     "v_proj",
     "q_proj",
-    "lm_head",
-    "o_proj",
     "down_proj",
     "up_proj",
-    "gate_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "v_proj",
     "q_proj",
     "down_proj",
+    "o_proj",
+    "lm_head",
     "up_proj",
+    "gate_proj",
+    "k_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b6bac0fe4393fb334aa3f0c9d417e30a9a3d89300be07d4634893d07f4327a25
 size 5031484

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba8207e6ad6bb7847a4549593b5f444cee0c1ffb6757548360c16050433e4be0
 size 5031484

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d8d12cc31694a253150fb4b864dd9db0fd34d6085684fd2b497291115cd92e47
 size 2525844

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc3bd2d24b27e0c5e5ecd76d11c058563be58130d9ad347aa2e3e1ec6f663181
 size 2525844

trainer_state.json CHANGED Viewed

@@ -17,7 +17,7 @@
     {
       "epoch": 0.1,
       "learning_rate": 1.8426966292134835e-05,
-      "loss": 1.9283,
       "step": 40
     },
     {
@@ -41,91 +41,91 @@
     {
       "epoch": 0.29,
       "learning_rate": 1.4831460674157305e-05,
-      "loss": 1.8233,
       "step": 120
     },
     {
       "epoch": 0.34,
       "learning_rate": 1.3932584269662923e-05,
-      "loss": 1.9046,
       "step": 140
     },
     {
       "epoch": 0.39,
       "learning_rate": 1.303370786516854e-05,
-      "loss": 1.8505,
       "step": 160
     },
     {
       "epoch": 0.43,
       "learning_rate": 1.213483146067416e-05,
-      "loss": 1.8608,
       "step": 180
     },
     {
       "epoch": 0.48,
       "learning_rate": 1.1235955056179778e-05,
-      "loss": 1.7992,
       "step": 200
     },
     {
       "epoch": 0.53,
       "learning_rate": 1.0337078651685396e-05,
-      "loss": 1.8869,
       "step": 220
     },
     {
       "epoch": 0.58,
       "learning_rate": 9.438202247191012e-06,
-      "loss": 1.839,
       "step": 240
     },
     {
       "epoch": 0.63,
       "learning_rate": 8.53932584269663e-06,
-      "loss": 1.8787,
       "step": 260
     },
     {
       "epoch": 0.68,
       "learning_rate": 7.640449438202247e-06,
-      "loss": 1.8828,
       "step": 280
     },
     {
       "epoch": 0.72,
       "learning_rate": 6.741573033707865e-06,
-      "loss": 1.8479,
       "step": 300
     },
     {
       "epoch": 0.77,
       "learning_rate": 5.842696629213483e-06,
-      "loss": 1.9063,
       "step": 320
     },
     {
       "epoch": 0.82,
       "learning_rate": 4.943820224719101e-06,
-      "loss": 1.8693,
       "step": 340
     },
     {
       "epoch": 0.87,
       "learning_rate": 4.04494382022472e-06,
-      "loss": 1.827,
       "step": 360
     },
     {
       "epoch": 0.92,
       "learning_rate": 3.146067415730337e-06,
-      "loss": 1.8259,
       "step": 380
     },
     {
       "epoch": 0.97,
       "learning_rate": 2.2471910112359554e-06,
-      "loss": 1.8419,
       "step": 400
     }
   ],

     {
       "epoch": 0.1,
       "learning_rate": 1.8426966292134835e-05,
+      "loss": 1.9281,
       "step": 40
     },
     {
     {
       "epoch": 0.29,
       "learning_rate": 1.4831460674157305e-05,
+      "loss": 1.8235,
       "step": 120
     },
     {
       "epoch": 0.34,
       "learning_rate": 1.3932584269662923e-05,
+      "loss": 1.9047,
       "step": 140
     },
     {
       "epoch": 0.39,
       "learning_rate": 1.303370786516854e-05,
+      "loss": 1.8508,
       "step": 160
     },
     {
       "epoch": 0.43,
       "learning_rate": 1.213483146067416e-05,
+      "loss": 1.8613,
       "step": 180
     },
     {
       "epoch": 0.48,
       "learning_rate": 1.1235955056179778e-05,
+      "loss": 1.7997,
       "step": 200
     },
     {
       "epoch": 0.53,
       "learning_rate": 1.0337078651685396e-05,
+      "loss": 1.8873,
       "step": 220
     },
     {
       "epoch": 0.58,
       "learning_rate": 9.438202247191012e-06,
+      "loss": 1.8394,
       "step": 240
     },
     {
       "epoch": 0.63,
       "learning_rate": 8.53932584269663e-06,
+      "loss": 1.8793,
       "step": 260
     },
     {
       "epoch": 0.68,
       "learning_rate": 7.640449438202247e-06,
+      "loss": 1.883,
       "step": 280
     },
     {
       "epoch": 0.72,
       "learning_rate": 6.741573033707865e-06,
+      "loss": 1.8483,
       "step": 300
     },
     {
       "epoch": 0.77,
       "learning_rate": 5.842696629213483e-06,
+      "loss": 1.9065,
       "step": 320
     },
     {
       "epoch": 0.82,
       "learning_rate": 4.943820224719101e-06,
+      "loss": 1.8699,
       "step": 340
     },
     {
       "epoch": 0.87,
       "learning_rate": 4.04494382022472e-06,
+      "loss": 1.8274,
       "step": 360
     },
     {
       "epoch": 0.92,
       "learning_rate": 3.146067415730337e-06,
+      "loss": 1.8264,
       "step": 380
     },
     {
       "epoch": 0.97,
       "learning_rate": 2.2471910112359554e-06,
+      "loss": 1.8423,
       "step": 400
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:050755ce01080bd5005c27dae5043cd1a94e5e57b091a9a27315291e7463c9fb
 size 4472

 version https://git-lfs.github.com/spec/v1
+oid sha256:e57641cf92861a0f39416c240625455232fda32e4298c91afe2b2d5e77c9e9b1
 size 4472