added model checkpoint

Files changed (6) hide show

config.json ADDED Viewed

+{
+  "architectures": [
+    "T5ForConditionalGeneration"
+  ],
+  "bos_token_id": 2,
+  "d_ff": 2048,
+  "d_kv": 64,
+  "d_model": 768,
+  "decoder_start_token_id": 0,
+  "dropout_rate": 0.1,
+  "eos_token_id": 3,
+  "feed_forward_proj": "gated-gelu",
+  "initializer_factor": 1.0,
+  "is_encoder_decoder": true,
+  "layer_norm_epsilon": 1e-06,
+  "model_type": "t5",
+  "n_positions": 512,
+  "num_decoder_layers": 6,
+  "num_heads": 12,
+  "num_layers": 6,
+  "output_past": false,
+  "pad_token_id": 0,
+  "relative_attention_num_buckets": 32,
+  "tokenizer": "default",
+  "transformers_version": "4.5.1",
+  "use_cache": true,
+  "vocab_size": 16000
+}

events.out.tfevents.1619091856.abddc95b08b9.345.0 ADDED Viewed

Binary file (2.31 MB). View file

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6bcf8c2aa97559ef467959a50d29da0e8158acb6d75a9909a27202c6a98822e8
+size 445683254

spm-default-16k.model ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5682bb73fbe4efee67a087751ce4d2bc801e0fec4f0753bc5a871a4ef725bb25
+size 10521992

spm-default-16k.vocab ADDED Viewed

The diff for this file is too large to render. See raw diff

training.logs ADDED Viewed

The diff for this file is too large to render. See raw diff