yakazimir
/

llama3_orpo_best_entropy

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3_orpo_best_entropy

Commit History

End of training

81aa225
verified

yakazimir commited on 3 days ago

Model save

42a6f26
verified

yakazimir commited on 3 days ago

Training in progress, step 457

83a7abc
verified

yakazimir commited on 3 days ago

initial commit

56c7f24
verified

yakazimir commited on 3 days ago