TRI-ML
/

DCLM-1B-IT

Update config.json

by sedrickkeh - opened Jul 22

←

Files changed (1) hide show

config.json CHANGED Viewed

@@ -4,7 +4,6 @@
   ],
   "model_type": "openlm",
   "params": null,
-  "params_args_dict": {
     "apply_qk_norm": true,
     "attn_activation": null,
     "attn_name": "auto",
@@ -13,7 +12,7 @@
     "dim": 2048,
     "ffn_type": "swiglu_torch",
     "model": "open_lm_1b_swiglutorch",
-    "model_norm": "gain_only_lp_layer_norm",
     "moe_capacity_factor": 1.25,
     "moe_expert_model_parallelism": false,
     "moe_freq": 0,
@@ -29,8 +28,7 @@
     "qk_norm": true,
     "seq_len": 2048,
     "vocab_size": 50432,
-    "weight_tying": false
-  },
   "torch_dtype": "float32",
   "transformers_version": "4.40.2"
 }

   ],
   "model_type": "openlm",
   "params": null,
     "apply_qk_norm": true,
     "attn_activation": null,
     "attn_name": "auto",
     "dim": 2048,
     "ffn_type": "swiglu_torch",
     "model": "open_lm_1b_swiglutorch",
+    "norm_type": "gain_only_lp_layer_norm",
     "moe_capacity_factor": 1.25,
     "moe_expert_model_parallelism": false,
     "moe_freq": 0,
     "qk_norm": true,
     "seq_len": 2048,
     "vocab_size": 50432,
+    "weight_tying": false,
   "torch_dtype": "float32",
   "transformers_version": "4.40.2"
 }