line-corporation
/

sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

sacpo / model-00002-of-00003.safetensors

Commit History

Upload LlamaForCausalLM

06ea01f
verified

reisato80 commited on Jun 19