Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions Community

Crystalcareai commited on Mar 27

Commit

a642d4e

•

1 Parent(s): ffa6a6c

Upload config.json

Files changed (1) hide show

config.json +9 -4

config.json CHANGED Viewed

@@ -1,9 +1,14 @@
 {
-  "_name_or_path": "cache/qstar/1710326256/checkpoint-100",
   "architectures": [
-    "MistralForCausalLM"
   ],
   "attention_dropout": 0.0,
   "bos_token_id": 1,
   "eos_token_id": 2,
   "hidden_act": "silu",
@@ -15,7 +20,7 @@
   "merged_lm_and_talk_heads": false,
   "merged_lm_and_think_heads": true,
   "merged_talk_heads": true,
-  "model_type": "mistral",
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
@@ -33,4 +38,4 @@
   "use_shallow_think": true,
   "use_weighted_talk_head": true,
   "vocab_size": 32002
-}

 {
+  "_name_or_path": "Crystalcareai/Quiet-Star-Custom",
   "architectures": [
+    "QuietForCausalLM"
   ],
   "attention_dropout": 0.0,
+  "auto_map": {
+    "AutoConfig": "configuration_quiet.QuietConfig",
+    "AutoModel": "modeling_quiet.QuietModel",
+    "AutoModelForCausalLM": "modeling_quiet.QuietForCausalLM"
+  },
   "bos_token_id": 1,
   "eos_token_id": 2,
   "hidden_act": "silu",
   "merged_lm_and_talk_heads": false,
   "merged_lm_and_think_heads": true,
   "merged_talk_heads": true,
+  "model_type": "quiet",
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
   "use_shallow_think": true,
   "use_weighted_talk_head": true,
   "vocab_size": 32002
+}