yasiny
/

wav2vec2-large-xlsr-53-demo-colab

Model card Files Files and versions Community

yasiny commited on Nov 13, 2022

Commit

6039b57

•

1 Parent(s): aecf276

Upload tokenizer

Files changed (4) hide show

added_tokens.json +4 -1
special_tokens_map.json +22 -1
tokenizer_config.json +11 -1
vocab.json +1 -1

added_tokens.json CHANGED Viewed

	@@ -1 +1,4 @@
1	- {~~"<s>": 40, "</s>": 41}~~

+{
+  "</s>": 41,
+  "<s>": 40
+}

special_tokens_map.json CHANGED Viewed

	@@ -1 +1,22 @@
1	- {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}]}

+{
+  "additional_special_tokens": [
+    {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false
+    }
+  ],
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

tokenizer_config.json CHANGED Viewed

	@@ -1 +1,11 @@
1	- {"unk_token": "[UNK]", "bos_token": "<s>", "eos_token": "</s>", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "\|", "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "./", "tokenizer_class": "Wav2Vec2CTCTokenizer"}

+{
+  "bos_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "name_or_path": "./",
+  "pad_token": "[PAD]",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

vocab.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"c": 0, "ç": 1, "v": 2, "y": 3, "j": 4, "s": 5, "k": 6, "h": 7, "l": 8, "i": 9, "ı": 10, "o": 11, "ğ": 12, "'": 13, "q": 14, "n": 15, "z": 16, "p": 17, "m": 18, "f": 19, "â": 21, "g": 22, "ü": 23, "ö": 24, "t": 25, "b": 26, "a": 27, "w": 28, "ë": 29, "ş": 30, "x": ~~31, "d":~~ 32, "u": 33, "î": 34, "̇": 35, "e": 36, "r": 37, "\|": 20, "[UNK]": 38, "[PAD]": 39}


1	+ {"ğ": 0, "y": 1, "h": 2, "l": 3, "a": 4, "̇": 5, "r": 6, "ë": 7, "w": 8, "i": 9, "n": 10, "â": 11, "'": 12, "e": 13, "ü": 14, "ö": 15, "d": 16, "g": 17, "î": 18, "b": 19, "m": 20, "s": 21, "f": 22, "x": 23, "c": 24, "j": 25, "u": 26, "v": 27, "o": 28, "z": 29, "q": 30, "t": 32, "ç": 33, "ş": 34, "p": 35, "ı": 36, "k": 37, "\|": 31, "[UNK]": 38, "[PAD]": 39}