QinLiuNLP
/

llama3-sudo-dpo-5epochs-forget10mix400-1sft-2fullpara-1e-5

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

llama3-sudo-dpo-5epochs-forget10mix400-1sft-2fullpara-1e-5 / model-00002-of-00004.safetensors

Commit History

Training in progress, step 125

5e904b9
verified

QinLiuNLP commited on Oct 8