zjowowen commited on
Commit
61f40f3
1 Parent(s): b60c203

Upload policy_config.py with huggingface_hub

Browse files
Files changed (1) hide show
  1. policy_config.py +6 -10
policy_config.py CHANGED
@@ -11,16 +11,11 @@ exp_config = {
11
  'cfg_type': 'BaseEnvManagerDict'
12
  },
13
  'stop_value': 12000,
 
14
  'env_id': 'HalfCheetah-v3',
15
- 'norm_obs': {
16
- 'use_norm': False
17
- },
18
- 'norm_reward': {
19
- 'use_norm': False
20
- },
21
  'collector_env_num': 1,
22
  'evaluator_env_num': 8,
23
- 'n_evaluator_episode': 8
24
  },
25
  'policy': {
26
  'model': {
@@ -74,9 +69,10 @@ exp_config = {
74
  'render_freq': -1,
75
  'mode': 'train_iter'
76
  },
 
77
  'cfg_type': 'InteractionSerialEvaluatorDict',
78
- 'n_episode': 8,
79
- 'stop_value': 12000
80
  }
81
  },
82
  'other': {
@@ -85,7 +81,7 @@ exp_config = {
85
  }
86
  },
87
  'on_policy': False,
88
- 'cuda': False,
89
  'multi_gpu': False,
90
  'bp_update_sync': True,
91
  'traj_len_inf': False,
 
11
  'cfg_type': 'BaseEnvManagerDict'
12
  },
13
  'stop_value': 12000,
14
+ 'n_evaluator_episode': 8,
15
  'env_id': 'HalfCheetah-v3',
 
 
 
 
 
 
16
  'collector_env_num': 1,
17
  'evaluator_env_num': 8,
18
+ 'env_wrapper': 'mujoco_default'
19
  },
20
  'policy': {
21
  'model': {
 
69
  'render_freq': -1,
70
  'mode': 'train_iter'
71
  },
72
+ 'figure_path': None,
73
  'cfg_type': 'InteractionSerialEvaluatorDict',
74
+ 'stop_value': 12000,
75
+ 'n_episode': 8
76
  }
77
  },
78
  'other': {
 
81
  }
82
  },
83
  'on_policy': False,
84
+ 'cuda': True,
85
  'multi_gpu': False,
86
  'bp_update_sync': True,
87
  'traj_len_inf': False,