Init cpm-bee-2b

Files changed (3) hide show

config.json ADDED Viewed

+{
+    "vocab_size": 86583,
+    "dim_model": 4096,
+    "dim_ff" : 5120,
+    "num_layers" : 48,
+    "num_heads": 32,
+    "dim_head" : 64,
+    "dropout_p" : 0.0,
+    "position_bias_num_buckets" : 256,
+    "position_bias_num_segment_buckets": 256,
+    "position_bias_max_distance" : 2048,
+    "eps" : 1e-6,
+    "half" : true,
+    "mask_modules": [[false, false], [true, false], [false, false], [true, false], [true, true], [true, false], [true, true], [true, true], [false, false], [false, false], [true, true], [true, false], [true, false], [true, true], [false, false], [true, true], [false, false], [false, true], [true, false], [true, true], [false, false], [false, true], [true, true], [true, true], [false, false], [true, true], [false, false], [true, true], [true, true], [false, false], [true, true], [false, false], [true, true], [false, false], [true, true], [true, false], [true, true], [true, true], [true, true], [false, false], [true, true], [false, false], [true, true], [true, true], [false, false], [true, true], [false, false], [false, false]]
+}

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab0b0cea131a39d5b5832a022ad992bdd709bce9898a4c2dad984e0f97622a07
+size 5004738461

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff