PKU-Alignment
/

beaver-7b-v1.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions

beaver-7b-v1.0 / model.safetensors.index.json

Commit History

Convert model checkpoint to safetensors

c077f71

XuehaiPan commited on Apr 19