dyang415
/

empower-functions-more-tools-parallel

Generated from Trainer

4-bit precision

Model card Files Files and versions Community

dyang415 commited on Mar 20

Commit

a9bde90

•

1 Parent(s): 14d3dd5

End of training

Files changed (2) hide show

README.md +30 -1
adapter_model.bin +2 -2

README.md CHANGED Viewed

@@ -2,6 +2,7 @@
 license: apache-2.0
 library_name: peft
 tags:
 - generated_from_trainer
 base_model: mistralai/Mixtral-8x7B-Instruct-v0.1
 model-index:
@@ -107,7 +108,9 @@ fsdp_config:
 # empower-functions-more-tools-parallel
-This model is a fine-tuned version of [mistralai/Mixtral-8x7B-Instruct-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1) on an unknown dataset.
 ## Model description
@@ -153,6 +156,32 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_steps: 10
 - num_epochs: 4
 ### Framework versions
 - PEFT 0.7.0

 license: apache-2.0
 library_name: peft
 tags:
+- axolotl
 - generated_from_trainer
 base_model: mistralai/Mixtral-8x7B-Instruct-v0.1
 model-index:
 # empower-functions-more-tools-parallel
+This model is a fine-tuned version of [mistralai/Mixtral-8x7B-Instruct-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0865
 ## Model description
 - lr_scheduler_warmup_steps: 10
 - num_epochs: 4
+### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 2.0913        | 0.0   | 1    | 2.0864          |
+| 0.0992        | 0.2   | 178  | 0.1038          |
+| 0.0923        | 0.4   | 356  | 0.0957          |
+| 0.0847        | 0.6   | 534  | 0.0938          |
+| 0.1034        | 0.8   | 712  | 0.0925          |
+| 0.1062        | 1.0   | 890  | 0.0901          |
+| 0.1006        | 1.19  | 1068 | 0.0894          |
+| 0.084         | 1.39  | 1246 | 0.0882          |
+| 0.0798        | 1.59  | 1424 | 0.0875          |
+| 0.0752        | 1.79  | 1602 | 0.0849          |
+| 0.0772        | 1.99  | 1780 | 0.0846          |
+| 0.0824        | 2.17  | 1958 | 0.0849          |
+| 0.0792        | 2.37  | 2136 | 0.0843          |
+| 0.0627        | 2.57  | 2314 | 0.0837          |
+| 0.0777        | 2.77  | 2492 | 0.0831          |
+| 0.0636        | 2.98  | 2670 | 0.0827          |
+| 0.0624        | 3.16  | 2848 | 0.0855          |
+| 0.0612        | 3.36  | 3026 | 0.0861          |
+| 0.0649        | 3.56  | 3204 | 0.0861          |
+| 0.0641        | 3.76  | 3382 | 0.0865          |
 ### Framework versions
 - PEFT 0.7.0

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90065af8a683cb070236c1627c992088c760967715d6165bb778ac22aef8fe2c
-size 62582080

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9691054ab35227e3b587fd4817e2c3d6f6699334538d689a4f94ad5fe6a8202
+size 109144269