imflash217
/

proximal_policy_optimization_lunar_lander_v2

Reinforcement Learning

stable-baselines3

LunarLander-v2

deep-reinforcement-learning

Eval Results

Model card Files Files and versions Community

proximal_policy_optimization_lunar_lander_v2 / results.json

imflash217

add a trained RL agent in LunarLander-v2 environment (trained using PPO algorithm).

ddbf590 almost 2 years ago

raw

history blame

163 Bytes

{"mean_reward": 259.250761749301, "std_reward": 10.873408423007765, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2023-01-13T11:21:29.412466"}