lole25
/

phi-2-gpo-ultrachat-lora-2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-ultrachat-lora-2 / runs /Feb29_17-39-53_gpu4-119-4

Commit History

Model save

51b1f39
verified

lole25 commited on Feb 29

Training in progress, step 100

fc85ef9
verified

lole25 commited on Feb 29