RLHFlow
/

LLaMA3-iterative-DPO-final

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LLaMA3-iterative-DPO-final

Commit History

Update README.md

c20c9f0
verified

Haoxiang-Wang commited on May 24

Update README.md

f3f938b
verified

weqweasdas commited on May 17

Update README.md

875c75b
verified

weqweasdas commited on May 17

Upload tokenizer

3678e58
verified

weqweasdas commited on May 17

Upload LlamaForCausalLM

ae5cd93
verified

weqweasdas commited on May 17

initial commit

17a4cdf
verified

weqweasdas commited on May 17