gpt-j-base-v1-lr6e-4-batch8-rev1

Files changed (7) hide show

.gitattributes CHANGED Viewed

@@ -32,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+flax_model.msgpack filter=lfs diff=lfs merge=lfs -text

config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "activation_function": "gelu_new",
   "architectures": [
     "GPTJForCausalLM"
@@ -7,8 +8,6 @@
   "bos_token_id": 1,
   "embd_pdrop": 0.0,
   "eos_token_id": 2,
-  "pad_token_id": 0,
-  "unk_token_id": 5,
   "gradient_checkpointing": false,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-05,
@@ -18,6 +17,7 @@
   "n_inner": null,
   "n_layer": 12,
   "n_positions": 1024,
   "resid_pdrop": 0.0,
   "rotary_dim": 16,
   "scale_attn_weights": true,
@@ -28,7 +28,8 @@
   "summary_use_proj": true,
   "tie_word_embeddings": false,
   "tokenizer_class": "GPT2Tokenizer",
-  "transformers_version": "4.24.0",
   "use_cache": true,
   "vocab_size": 51200
-}

 {
+  "_name_or_path": "heegyu/kogpt-j-base",
   "activation_function": "gelu_new",
   "architectures": [
     "GPTJForCausalLM"
   "bos_token_id": 1,
   "embd_pdrop": 0.0,
   "eos_token_id": 2,
   "gradient_checkpointing": false,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-05,
   "n_inner": null,
   "n_layer": 12,
   "n_positions": 1024,
+  "pad_token_id": 0,
   "resid_pdrop": 0.0,
   "rotary_dim": 16,
   "scale_attn_weights": true,
   "summary_use_proj": true,
   "tie_word_embeddings": false,
   "tokenizer_class": "GPT2Tokenizer",
+  "transformers_version": "4.25.1",
+  "unk_token_id": 5,
   "use_cache": true,
   "vocab_size": 51200
+}

flax_model.msgpack ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c8b46abacb8ace04f4c0bdecff4272906163325784aaf8ae1de9be293949080
+size 654785094

merges.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-#version: 0.2
 Ġ ì
 Ġ ë
 ì Ŀ

+#version: 0.2 - Trained by `huggingface/tokenizers`
 Ġ ì
 Ġ ë
 ì Ŀ

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -18,7 +18,8 @@
     "single_word": false
   },
   "errors": "replace",
-  "name_or_path": "models/tokenizer-51k",
   "pad_token": null,
   "special_tokens_map_file": null,
   "tokenizer_class": "GPT2Tokenizer",

     "single_word": false
   },
   "errors": "replace",
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "heegyu/kogpt-j-base",
   "pad_token": null,
   "special_tokens_map_file": null,
   "tokenizer_class": "GPT2Tokenizer",

vocab.json CHANGED Viewed

The diff for this file is too large to render. See raw diff