Upload tokenizer

Files changed (3) hide show

special_tokens_map.json ADDED Viewed

+{
+  "pad_token": "|",
+  "unk_token": "<unk>"
+}

tokenizer_config.json ADDED Viewed

+{
+  "add_blank": true,
+  "clean_up_tokenization_spaces": true,
+  "is_uroman": false,
+  "language": "crk-script_syllabics",
+  "model_max_length": 1000000000000000019884624838656,
+  "normalize": true,
+  "pad_token": "|",
+  "phonemize": false,
+  "tokenizer_class": "VitsTokenizer",
+  "unk_token": "<unk>"
+}

vocab.json ADDED Viewed

+{
+  " ": 78,
+  "7": 77,
+  "9": 76,
+  "h": 63,
+  "t": 75,
+  "|": 0,
+  "ᐁ": 5,
+  "ᐃ": 3,
+  "ᐄ": 74,
+  "ᐅ": 19,
+  "ᐆ": 60,
+  "ᐊ": 4,
+  "ᐋ": 24,
+  "ᐟ": 26,
+  "ᐠ": 14,
+  "ᐢ": 11,
+  "ᐣ": 25,
+  "ᐤ": 23,
+  "ᐦ": 9,
+  "ᐧ": 1,
+  "ᐨ": 44,
+  "ᐩ": 56,
+  "ᐯ": 36,
+  "ᐱ": 30,
+  "ᐳ": 48,
+  "ᐴ": 72,
+  "ᐸ": 35,
+  "ᐹ": 55,
+  "ᑊ": 57,
+  "ᑌ": 32,
+  "ᑎ": 28,
+  "ᑐ": 33,
+  "ᑑ": 67,
+  "ᑕ": 8,
+  "ᑖ": 31,
+  "ᑦ": 49,
+  "ᑫ": 27,
+  "ᑭ": 2,
+  "ᑮ": 62,
+  "ᑯ": 17,
+  "ᑰ": 61,
+  "ᑲ": 7,
+  "ᑳ": 16,
+  "ᒉ": 52,
+  "ᒋ": 12,
+  "ᒌ": 73,
+  "ᒍ": 58,
+  "ᒐ": 59,
+  "ᒑ": 54,
+  "ᒣ": 43,
+  "ᒥ": 13,
+  "ᒦ": 71,
+  "ᒧ": 39,
+  "ᒨ": 65,
+  "ᒪ": 22,
+  "ᒫ": 20,
+  "ᒼ": 64,
+  "ᓀ": 45,
+  "ᓂ": 10,
+  "ᓃ": 68,
+  "ᓄ": 46,
+  "ᓅ": 69,
+  "ᓇ": 15,
+  "ᓈ": 37,
+  "ᓬ": 51,
+  "ᓭ": 42,
+  "ᓯ": 6,
+  "ᓰ": 70,
+  "ᓱ": 40,
+  "ᓲ": 66,
+  "ᓴ": 38,
+  "ᓵ": 50,
+  "ᔦ": 41,
+  "ᔨ": 18,
+  "ᔪ": 53,
+  "ᔭ": 21,
+  "ᔮ": 34,
+  "ᕒ": 47,
+  "ᕽ": 29
+}