livinNector
/

IndicBERTv2-MLM-Sam-TLM-NER

Token Classification

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

livinNector commited on May 18, 2023

Commit

1d08d6b

•

1 Parent(s): 2bd4ec8

Upload tokenizer

Files changed (4) hide show

.gitattributes +1 -0
tokenizer.json +2 -2
tokenizer_config.json +10 -2
vocab.txt +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text

 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text
+vocab.txt filter=lfs diff=lfs merge=lfs -text

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6af22a5c4bc890322c365fcb77dd77c06cbb9b088ffa50db1892d5220313c495
-size 7749482

 version https://git-lfs.github.com/spec/v1
+oid sha256:25857a4e12214c69418001835c3661376f03811a2739abd29a1488bd1574bf8a
+size 7749568

tokenizer_config.json CHANGED Viewed

@@ -1,5 +1,13 @@
 {
   "clean_up_tokenization_spaces": true,
-  "model_max_length": 1000000000000000019884624838656,
-  "tokenizer_class": "PreTrainedTokenizerFast"
 }

 {
   "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
 }

vocab.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24f7ce20f8093552a0a750b322a1cf99c65558f81c57ff0d58e8253c39ca7ceb
+size 3603559