trungvo
/

Mixtral-8x7B-Instruct-v0.1-finetuned-PubMedQA

Generated from Trainer

Model card Files Files and versions Community

trungvo commited on Jul 19

Commit

a99879f

•

1 Parent(s): b1cd957

End of training

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -1,11 +1,11 @@
 ---
-license: apache-2.0
 library_name: peft
 tags:
 - trl
 - sft
 - generated_from_trainer
-base_model: mistralai/Mixtral-8x7B-Instruct-v0.1
 model-index:
 - name: Mixtral-8x7B-Instruct-v0.1-finetuned-PubMedQA
   results: []
@@ -41,7 +41,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- training_steps: 5000
 - mixed_precision_training: Native AMP
 ### Training results
@@ -51,7 +51,7 @@ The following hyperparameters were used during training:
 ### Framework versions
 - PEFT 0.11.1
-- Transformers 4.41.1
 - Pytorch 2.3.0+cu121
 - Datasets 2.19.1
 - Tokenizers 0.19.1

 ---
+base_model: mistralai/Mixtral-8x7B-Instruct-v0.1
 library_name: peft
+license: apache-2.0
 tags:
 - trl
 - sft
 - generated_from_trainer
 model-index:
 - name: Mixtral-8x7B-Instruct-v0.1-finetuned-PubMedQA
   results: []
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
+- num_epochs: 8
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
 - PEFT 0.11.1
+- Transformers 4.42.3
 - Pytorch 2.3.0+cu121
 - Datasets 2.19.1
 - Tokenizers 0.19.1