GeorgiaTech
/

0.0_llama_nodpo_3iters_bs128_531lr_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0_llama_nodpo_3iters_bs128_531lr_iter_1

Commit History

End of training

7916af6
verified

ZhangShenao commited on May 12

Model save

dcd212e
verified

ZhangShenao commited on May 12

Training in progress, step 100

3014e13
verified

ZhangShenao commited on May 12

initial commit

78d41d6
verified

ZhangShenao commited on May 12