alexbalandi
/

ppo-LunarLander-v2-4milsteps-200-envs

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

ppo-LunarLander-v2-4milsteps-200-envs / replay.mp4

Commit History

Upload PPO LunarLander-v2 trained agent, used 1 mil more steps with more loose variance hyperparameter.

3120398

alexbalandi commited on Mar 13, 2023

Upload PPO LunarLander-v2 trained agent, first step

818b66b

alexbalandi commited on Mar 12, 2023