shirwu
/

content

Generated from Trainer

Model card Files Files and versions Community

content / .config

1 contributor

History: 1 commit

shirwu's picture

shirwu/dpo-personal-preference-llama3.2-1b-trainer

e0257e3 verified 13 days ago