Training in progress, step 200

Files changed (8) hide show

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f031e6ea0a3153d1473861de685d172bf756b8c737c62fa92b3355739a4260a
 size 1117294952

 version https://git-lfs.github.com/spec/v1
+oid sha256:a465f2880a6e4a0914b1ee08c54b98d8366a3f99139a0557e3982cb679c7c3e7
 size 1117294952

runs/Aug15_13-11-33_39f7c6efe4df/events.out.tfevents.1723727494.39f7c6efe4df.1056.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0baa7e3850e01cf4b1cec657df1ec01cff3da9d6e154ffe20152dcd5d602cff9
+size 6247

special_tokens_map.json CHANGED Viewed

@@ -2,49 +2,49 @@
   "bos_token": {
     "content": "<s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "cls_token": {
     "content": "<s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
     "content": "</s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "mask_token": {
     "content": "<mask>",
     "lstrip": true,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "pad_token": {
     "content": "<pad>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "sep_token": {
     "content": "</s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   }

   "bos_token": {
     "content": "<s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "cls_token": {
     "content": "<s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
     "content": "</s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "mask_token": {
     "content": "<mask>",
     "lstrip": true,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "pad_token": {
     "content": "<pad>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "sep_token": {
     "content": "</s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   }

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ffb37461c391f096759f4a9bbbc329da0f36952f88bab061fcf84940c022e98
-size 17082999

 version https://git-lfs.github.com/spec/v1
+oid sha256:b642560e24dade6e668205a829def6a058668c45d63a12752160fd2b539d0417
+size 2108905

tokenizer_config.json CHANGED Viewed

@@ -1,9 +1,10 @@
 {
   "added_tokens_decoder": {
     "0": {
       "content": "<s>",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
@@ -11,7 +12,7 @@
     "1": {
       "content": "<pad>",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
@@ -19,7 +20,7 @@
     "2": {
       "content": "</s>",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
@@ -27,15 +28,15 @@
     "3": {
       "content": "<unk>",
       "lstrip": false,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "250001": {
       "content": "<mask>",
       "lstrip": true,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
@@ -51,8 +52,10 @@
     0
   ],
   "eos_token": "</s>",
   "mask_token": "<mask>",
-  "model_max_length": 1000000000000000019884624838656,
   "only_label_first_subword": true,
   "pad_token": "<pad>",
   "pad_token_box": [
@@ -64,11 +67,12 @@
   "pad_token_label": -100,
   "sep_token": "</s>",
   "sep_token_box": [
-    1000,
-    1000,
-    1000,
-    1000
   ],
-  "tokenizer_class": "LayoutXLMTokenizer",
   "unk_token": "<unk>"
 }

 {
+  "add_prefix_space": true,
   "added_tokens_decoder": {
     "0": {
       "content": "<s>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     "1": {
       "content": "<pad>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     "2": {
       "content": "</s>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     "3": {
       "content": "<unk>",
       "lstrip": false,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "50264": {
       "content": "<mask>",
       "lstrip": true,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
     0
   ],
   "eos_token": "</s>",
+  "errors": "replace",
   "mask_token": "<mask>",
+  "max_len": 512,
+  "model_max_length": 512,
   "only_label_first_subword": true,
   "pad_token": "<pad>",
   "pad_token_box": [
   "pad_token_label": -100,
   "sep_token": "</s>",
   "sep_token_box": [
+    0,
+    0,
+    0,
+    0
   ],
+  "tokenizer_class": "LayoutLMv3Tokenizer",
+  "trim_offsets": true,
   "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:64f2e4af66b35ba9983c138c4d55cda64b052231af0f29bdf6a124d67d675730
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:96bbf34d013627c580d9c3e8d1443007aacbac9c0d0585eefcf4c824c39fc68e
 size 5112

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff