wxzhang
/

dpo-selective-alpaca

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

dpo-selective-alpaca / README.md

Commit History

End of training

83248f0
verified

wxzhang commited on Apr 23

Model save

fb2ade4
verified

wxzhang commited on Apr 23