{"experiment_name": "Reinforce_CartPole-v1", "device": "gpu", "policy": {"_target_": "lib.reinforce.Policy", "h_size": 32}, "optimizer": {"_target_": "torch.optim.Adam", "lr": 0.001}, "train_hparams": {"n_training_episodes": 5000, "max_steps": 1000, "gamma": 1.0, "print_every": 100}, "eval_hparams": {"n_eval_episodes": 1000, "max_steps": 1000}, "model_path": "model.pt", "hparams_path": "hyperparameters.json", "video_path": "replay.mp4", "video_fps": 30, "train_env": {"_target_": "gym.make", "id": "CartPole-v1", "render_mode": "rgb_array"}, "eval_env": {"_target_": "gym.make", "id": "CartPole-v1", "render_mode": "rgb_array"}}