RLHFlow
/

LLaMA3-iterative-DPO-final

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LLaMA3-iterative-DPO-final

2 contributors

History: 6 commits

Haoxiang-Wang's picture

Update README.md

c20c9f0 verified 6 months ago