RLHFlow
/

LLaMA3-iterative-DPO-final

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LLaMA3-iterative-DPO-final

2 contributors

History: 9 commits

Haoxiang-Wang's picture

Update README.md

8c929ad verified 23 days ago