yuansui
/

TinyLLama-v0-PPO-tuned

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

TinyLLama-v0-PPO-tuned

Commit History

Push model using huggingface_hub.

62bbcda
verified

yuansui commited on Sep 6

initial commit

2efe6ef
verified

yuansui commited on Sep 6