YYYYYYibo
/

nash_dpo_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

nash_dpo_iter_2

1 contributor

History: 3 commits

YYYYYYibo's picture

DPO-7b-beta0.01

4cc0c18 7 months ago