princeton-nlp
/

gemma-2-9b-it-SimPO

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

princeton-nlp commited on Jul 16

Commit

c580d90

•

1 Parent(s): ebdb01f

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -49,11 +49,11 @@ print(outputs[0]['generated_text'])
 ### Training Data
-We use
 #### Training Hyperparameters
-- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
 #### Speeds, Sizes, Times

 ### Training Data
+We use [princeton-nlp/gemma2-ultrafeedback-armorm](https://huggingface.co/datasets/princeton-nlp/gemma2-ultrafeedback-armorm) as the preference optimization dataset.
 #### Training Hyperparameters
+[TO BE FILLED LATER]
 #### Speeds, Sizes, Times