lole25
/

phi-2-gpo-ultrachat-lora-2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-ultrachat-lora-2 / README.md

Commit History

End of training

1120162
verified

lole25 commited on Feb 29

Model save

ec33c3e
verified

lole25 commited on Feb 29

End of training

61e7afa
verified

lole25 commited on Feb 29

Model save

51b1f39
verified

lole25 commited on Feb 29