THUDM
/

LongReward-llama3.1-8b-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LongReward-llama3.1-8b-DPO / README.md

Commit History

Update README.md

7311e4c
verified

NeoZ123 commited on 4 days ago

Update README.md

d89db22
verified

NeoZ123 commited on 4 days ago

add readme

db7b354

davidlvxin commited on 10 days ago