AY2324S2-CS4248-Team-47
/

StableLM-DPO-Ultrafeedback

Model card Files Files and versions Community

StableLM-DPO-Ultrafeedback / optimizer.pt

Commit History

Fix: upload best checkpoint

b744dd9

JayanthB commited on Apr 17

Init DPO on Ultrafeedback dataset

3be625b

JayanthB commited on Apr 17