CarlosGranados
/

ppo-LunarLander-v2

Reinforcement Learning

stable-baselines3

LunarLander-v2

deep-reinforcement-learning

Eval Results

Model card Files Files and versions Community

ppo-LunarLander-v2 / results.json

CarlosGranados

new_model: PPO model trained for 5 and 2000000 steps

2c231d9 verified 5 months ago

raw

history blame

164 Bytes

{"mean_reward": 273.5037729839372, "std_reward": 13.180901370880411, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2024-07-03T11:36:03.687695"}