alexbalandi
/

ppo-LunarLander-v2-4milsteps-200-envs

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

ppo-LunarLander-v2-4milsteps-200-envs / FinetunedPPO_5mil_steps_total /_stable_baselines3_version

alexbalandi's picture

Upload PPO LunarLander-v2 trained agent, used 1 mil more steps with more loose variance hyperparameter.

3120398 almost 2 years ago

5 Bytes

1.7.0