shirwu
/

content

Generated from Trainer

Model card Files Files and versions Community

content / preference_data.csv

Commit History

shirwu/dpo-personal-preference-llama3.2-1b-trainer

e0257e3
verified

shirwu commited on 13 days ago