lole25
/

phi-2-gpo-lora-ultrafeedback-test

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-lora-ultrafeedback-test

1 contributor

History: 1 commit

lole25's picture

initial commit

a2363bb verified 8 months ago

.gitattributes

1.52 kB

initial commit 8 months ago