Minbyul
/

selfbiorag-7b-wo-kqa_golden-iter-dpo-step4-filtered

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

selfbiorag-7b-wo-kqa_golden-iter-dpo-step4-filtered

Commit History

End of training

9c1d1a2
verified

Minbyul commited on May 18

Model save

9bcd11b
verified

Minbyul commited on May 18

initial commit

9d57e1e
verified

Minbyul commited on May 18