Training in progress, step 500

Files changed (12) hide show

config.json CHANGED Viewed

@@ -4,14 +4,14 @@
   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
   "eos_token_id": 2,
-  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 256,
   "initializer_range": 0.02,
   "intermediate_size": 1024,
-  "layer_norm_eps": 1e-05,
   "max_position_embeddings": 128,
   "model_type": "roberta",
   "num_attention_heads": 4,
@@ -19,8 +19,8 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.10.0.dev0",
-  "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265
-}

   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
+  "classifier_dropout": null,
   "eos_token_id": 2,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 256,
   "initializer_range": 0.02,
   "intermediate_size": 1024,
+  "layer_norm_eps": 1e-12,
   "max_position_embeddings": 128,
   "model_type": "roberta",
   "num_attention_heads": 4,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.42.4",
+  "type_vocab_size": 2,
   "use_cache": true,
   "vocab_size": 50265
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0105db47ed9fbfe3d7774d06dd0ad9e117ed2e52d03375119524fe3fb3c9ee3
+size 90005100

runs/Jul18_01-09-48_fe084eaf0329/events.out.tfevents.1721265051.fe084eaf0329.29414.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b64baa320ae27a38fc004f3cca96cd4ccd5100d5522dae688c742313a1b66a1c
+size 4749

runs/Jul18_01-11-52_fe084eaf0329/events.out.tfevents.1721265118.fe084eaf0329.30009.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c2ed0b3e3806c536951000129098b906d99c55d8bd7a8cbe4f5d55b7aed0ab8b
+size 4749

runs/Jul18_01-12-59_fe084eaf0329/events.out.tfevents.1721265209.fe084eaf0329.30334.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0073f25837c52cca762f41a15e73e44f0f63aa4ad63bc2aea4f94b2e944e1405
+size 4749

runs/Jul18_01-14-07_fe084eaf0329/events.out.tfevents.1721265254.fe084eaf0329.30664.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:31d619da90785cef674456c8b71ffad124ed38a61f40f0464a9d132bbef1caf9
+size 4961

special_tokens_map.json ADDED Viewed

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json CHANGED Viewed

@@ -43,7 +43,7 @@
       "id": 4,
       "content": "<mask>",
       "single_word": false,
-      "lstrip": false,
       "rstrip": false,
       "normalized": false,
       "special": true
@@ -59,7 +59,7 @@
   "post_processor": {
     "type": "ByteLevel",
     "add_prefix_space": true,
-    "trim_offsets": false,
     "use_regex": true
   },
   "decoder": {

       "id": 4,
       "content": "<mask>",
       "single_word": false,
+      "lstrip": true,
       "rstrip": false,
       "normalized": false,
       "special": true
   "post_processor": {
     "type": "ByteLevel",
     "add_prefix_space": true,
+    "trim_offsets": true,
     "use_regex": true
   },
   "decoder": {

tokenizer_config.json ADDED Viewed

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1f2196f8bb1c72cdb770a21b2a58f1a7bc6df8a2f5bd8f8664030d8d677a88c
+size 5176

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff