Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

1,972

Full-text search

Active filters: ppo

sun-s/ppo-CartPole-v1

Reinforcement Learning • Updated 10 days ago

tensorblock/Moxoff-Phi3Mini-PPO-GGUF

Updated 6 days ago • 202

SD403/ppo-LunarLander-v2-Pytorch

Reinforcement Learning • Updated 9 days ago

pixeldoggo/ppo-LunarLander-v2-2

Reinforcement Learning • Updated 4 days ago

averydd/ppo-LunarLander-v2-unit812

Reinforcement Learning • Updated 4 days ago

nteku1/firstppomodel

Reinforcement Learning • Updated 2 days ago • 6

nteku1/final_ppomodel

Reinforcement Learning • Updated 2 days ago • 6

Vagnus/ppo-CartPole-v1

Reinforcement Learning • Updated 2 days ago

Setpember/Jon_GPT2L_PPO_epi_point1

Reinforcement Learning • Updated 2 days ago • 4

Setpember/Jon_GPT2L_PPO_epi_point5

Reinforcement Learning • Updated 2 days ago • 2

Setpember/Jon_GPT2L_PPO_epi_1

Reinforcement Learning • Updated 2 days ago • 4

Setpember/Jon_GPT2L_PPO_epi_2

Reinforcement Learning • Updated 2 days ago • 4

Setpember/Jon_ppo_stage1_epi_2

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage2_epi_2

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage1_epi_1

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage2_epi_1

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage1_epi_point5

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage2_epi_point5

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage1_epi_point1

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage2_epi_point1

Reinforcement Learning • Updated 2 days ago • 2

TPK-MAKG/ppo-ReImagined-LunarLander-v2

Reinforcement Learning • Updated about 3 hours ago

TPK-MAKG/ppo-ReImagined-LunarLander-v2-pt2

Reinforcement Learning • Updated about 3 hours ago