tanliboy
/

llama-3.2-3b-dpo

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llama-3.2-3b-dpo

Commit History

End of training

107b694
verified

tanliboy commited on Sep 30

Model save

f0b2c3a
verified

tanliboy commited on Sep 30

Training in progress, step 633

32994ad
verified

tanliboy commited on Sep 30

Training in progress, step 500

08ee5fb
verified

tanliboy commited on Sep 30

End of training

fd50a56
verified

tanliboy commited on Sep 29

Model save

aacf5ea
verified

tanliboy commited on Sep 29

initial commit

75ddb7b
verified

tanliboy commited on Sep 28