{
"01-ai/Yi-34B @ cc100/ar": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1795801,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/de": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 698366,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/en": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 270400,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/es": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 577018,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/fa": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1337264,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/fr": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 533106,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/ja": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 740791,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/ko": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 1203134,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-34B @ cc100/zh-Hans": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 588729,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/ar": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1795801,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/de": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 698366,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/en": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 270400,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/es": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 577018,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/fa": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1337264,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/fr": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 533106,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/ja": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 740791,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/ko": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 1203134,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-6B @ cc100/zh-Hans": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 588729,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/ar": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1803957,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/de": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 697065,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/en": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 269738,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/es": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 576794,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/fa": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1346819,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/fr": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 532288,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/ja": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 749927,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/ko": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 1210021,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-VL-34B @ cc100/zh-Hans": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 596166,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ClassCat/gpt2-base-french @ cc100/ar": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2813283,
"_n_tokens": 1362808,
"_n_chars": 1560987,
"_n_oov_chars": 1895,
"oov_ratio": 0.001213975516772401,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"Х\", \"H\", \"U\", \"G\", \"ﷺ\", \"R\", \"Y\", \"Q\", \"I\", \"V\", \"J\", \"K\", \"B\", \"E\", \"Z\", \"C\", \"ﻹ\", \"T\", \"O\", \"X\", \"½\", \"M\", \"F\", \"S\", \"W\", \"D\", \"ﻻ\", \"L\", \"ﻷ\", \"″\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/de": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1814876,
"_n_tokens": 598773,
"_n_chars": 1784021,
"_n_oov_chars": 90245,
"oov_ratio": 0.050585166878641,
"_oov_charset": "[\"A\", \"…\", \"Ä\", \"N\", \"P\", \"™\", \"H\", \"G\", \"U\", \"Ã\", \" \", \"R\", \"Y\", \"Ü\", \"Q\", \"¹\", \"É\", \"I\", \"Á\", \"V\", \"J\", \"K\", \"Ö\", \"B\", \"E\", \"Ÿ\", \"Z\", \"C\", \"´\", \"²\", \"T\", \"O\", \"X\", \"½\", \"M\", \"F\", \"S\", \"W\", \"D\", \"İ\", \"L\", \"Ø\", \"¼\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/en": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1124813,
"_n_tokens": 319127,
"_n_chars": 1121360,
"_n_oov_chars": 31089,
"oov_ratio": 0.02772437040736249,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"③\", \"H\", \"U\", \"G\", \"‑\", \"R\", \"Y\", \"Q\", \"I\", \"V\", \"J\", \"⑦\", \"K\", \"B\", \"E\", \"Z\", \"C\", \"⑩\", \"´\", \"T\", \"O\", \"X\", \"⑤\", \"M\", \"F\", \"S\", \"⑧\", \"W\", \"D\", \"L\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/es": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1664455,
"_n_tokens": 529060,
"_n_chars": 1630297,
"_n_oov_chars": 40703,
"oov_ratio": 0.02496661651220606,
"_oov_charset": "[\"A\", \"…\", \"Ú\", \"N\", \"P\", \"Ñ\", \"М\", \"H\", \"U\", \"G\", \"R\", \"Y\", \"º\", \"Ó\", \"Q\", \"É\", \"I\", \"ª\", \"Á\", \"V\", \"J\", \"K\", \"B\", \"E\", \"²\", \"´\", \"C\", \"Z\", \"T\", \"O\", \"X\", \"M\", \"F\", \"S\", \"W\", \"D\", \"L\", \"Í\", \"″\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/fa": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2054052,
"_n_tokens": 1093333,
"_n_chars": 1145876,
"_n_oov_chars": 1472,
"oov_ratio": 0.001284606711371911,
"_oov_charset": "[\"…\", \"A\", \"N\", \"P\", \"H\", \"G\", \"U\", \"R\", \"Y\", \"Q\", \"I\", \"V\", \"J\", \"K\", \"B\", \"E\", \"Z\", \"C\", \"T\", \"O\", \"X\", \"M\", \"F\", \"ﮧ\", \"S\", \"W\", \"D\", \"L\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/fr": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1540504,
"_n_tokens": 341687,
"_n_chars": 1484970,
"_n_oov_chars": 28762,
"oov_ratio": 0.01936874145605635,
"_oov_charset": "[\"A\", \"…\", \"Ê\", \"N\", \"P\", \"Ç\", \"™\", \"H\", \"U\", \"G\", \"Â\", \"È\", \"R\", \"Y\", \"Q\", \"É\", \"I\", \"℃\", \"V\", \"J\", \"K\", \"Î\", \"B\", \"E\", \"²\", \"Z\", \"C\", \"´\", \"T\", \"O\", \"X\", \"M\", \"Ô\", \"F\", \"S\", \"µ\", \"W\", \"À\", \"D\", \"L\", \"″\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/ja": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1774770,
"_n_tokens": 1149553,
"_n_chars": 603065,
"_n_oov_chars": 9978,
"oov_ratio": 0.01654548017212075,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"R\", \"]\", \"V\", \"J\", \"7\", \"ィ\", \"8\", \"F\", \"-\", \"②\", \"C\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"W\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"U\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"@\", \"s\", \"Д\", \"M\", \"I\", \"「\", \"¥\", \"\\u001b\", \"B\", \"E\", \"Z\", \"´\", \"‼\", \"T\", \"1\", \"P\", \"<\", \"+\", \"9\", \"M\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"L\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"P\", \"0\", \" ̄\", \"w\", \"l\", \"d\", \"H\", \";\", \")\", \"[\", \"Ⅱ\", \"Y\", \"W\", \"y\", \"b\", \"℃\", \"ヨ\", \"」\", \"K\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"X\", \"テ\", \"F\", \"゚\", \"J\", \"*\", \"S\", \"D\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \"A\", \".\", \"N\", \"C\", \"ウ\", \"2\", \"G\", \"‥\", \"ア\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"Q\", \"t\", \"!\", \"m\", \"リ\", \"?\", \"L\", \"O\", \"ー\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"⑧\", \"A\", \"&\", \"~\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/ko": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1524839,
"_n_tokens": 1411369,
"_n_chars": 655190,
"_n_oov_chars": 10124,
"oov_ratio": 0.015452006288252263,
"_oov_charset": "[\"%\", \"⑥\", \"Ⅳ\", \"㉣\", \"立\", \"|\", \"R\", \"樂\", \"ㅈ\", \"ㅟ\", \"ㅋ\", \"ㅍ\", \"㎡\", \"ㅎ\", \"V\", \"J\", \"ㆍ\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"C\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \":\", \"①\", \"W\", \"ㅜ\", \"ㄹ\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"U\", \"v\", \"識\", \"ㅆ\", \"s\", \"@\", \"I\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"B\", \"E\", \"Z\", \"Ⅰ\", \"ㅅ\", \"T\", \"⑤\", \"ㄱ\", \"累\", \"M\", \"樂\", \"L\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"ㅕ\", \"P\", \"ㅛ\", \"ㅏ\", \"H\", \"龍\", \"㉰\", \"Ⅱ\", \"Y\", \"ㅓ\", \"⑨\", \"℃\", \"」\", \"K\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"X\", \"ㅐ\", \"⑵\", \"ㅔ\", \"良\", \"F\", \"ㅚ\", \"S\", \"*\", \"㎍\", \"D\", \"理\", \"梁\", \"A\", \"N\", \"Ⅲ\", \"陸\", \"G\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"Q\", \"¹\", \"ㅝ\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"ㅖ\", \"⑦\", \"?\", \"O\", \"金\", \"ⅱ\", \"Ⅹ\", \"⑧\", \"ㅊ\", \"女\", \"Ⅵ\", \"ㅢ\"]",
"lossless": false
},
"ClassCat/gpt2-base-french @ cc100/zh-Hans": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2633047,
"_n_tokens": 1921438,
"_n_chars": 927311,
"_n_oov_chars": 74022,
"oov_ratio": 0.07982435234780996,
"_oov_charset": "[\"%\", \"⑥\", \"⒋\", \"\\b\", \"R\", \"]\", \"\", \"V\", \"J\", \"7\", \"\\u0000\", \"\", \"8\", \"-\", \"②\", \"C\", \"⑴\", \",\", \":\", \"①\", \"W\", \"…\", \""\", \"_\", \"③\", \"p\", \"・\", \"⑶\", \"n\", \"6\", \"U\", \"\", \"T\", \"⒁\", \"3\", \"/\", \"\", \"s\", \"I\", \"B\", \"E\", \"Z\", \"T\", \"1\", \"⑤\", \"+\", \"\", \"9\", \"M\", \"⒃\", \"5\", \"⒂\", \"a\", \"h\", \"L\", \"r\", \"Ø\", \"④\", \"⑸\", \"P\", \"0\", \"d\", \"H\", \" \", \";\", \")\", \"[\", \"Y\", \"⑨\", \"℃\", \"K\", \" \", \"o\", \"⑩\", \"X\", \"F\", \"⒀\", \"S\", \"D\", \"D\", \"⑿\", \"(\", \"N\", \"A\", \".\", \"N\", \"⑷\", \"C\", \"2\", \"G\", \"Q\", \"t\", \"\\u0006\", \"!\", \"\", \"\\u0005\", \"⑦\", \"\\u0007\", \"?\", \"O\", \"V\", \"⒌\", \"e\", \"4\", \"⑧\", \"A\", \"&\", \"~\", \"i\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/ar": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2813283,
"_n_tokens": 1414504,
"_n_chars": 1560987,
"_n_oov_chars": 1895,
"oov_ratio": 0.001213975516772401,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"Х\", \"H\", \"U\", \"G\", \"ﷺ\", \"R\", \"Y\", \"Q\", \"I\", \"V\", \"J\", \"K\", \"B\", \"E\", \"Z\", \"C\", \"ﻹ\", \"T\", \"O\", \"X\", \"½\", \"M\", \"F\", \"S\", \"W\", \"D\", \"ﻻ\", \"L\", \"ﻷ\", \"″\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/de": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1814876,
"_n_tokens": 623279,
"_n_chars": 1784021,
"_n_oov_chars": 90245,
"oov_ratio": 0.050585166878641,
"_oov_charset": "[\"A\", \"…\", \"Ä\", \"N\", \"P\", \"™\", \"H\", \"G\", \"U\", \"Ã\", \" \", \"R\", \"Y\", \"Ü\", \"Q\", \"¹\", \"É\", \"I\", \"Á\", \"V\", \"J\", \"K\", \"Ö\", \"B\", \"E\", \"Ÿ\", \"Z\", \"C\", \"´\", \"²\", \"T\", \"O\", \"X\", \"½\", \"M\", \"F\", \"S\", \"W\", \"D\", \"İ\", \"L\", \"Ø\", \"¼\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/en": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1124813,
"_n_tokens": 322348,
"_n_chars": 1121360,
"_n_oov_chars": 31089,
"oov_ratio": 0.02772437040736249,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"③\", \"H\", \"U\", \"G\", \"‑\", \"R\", \"Y\", \"Q\", \"I\", \"V\", \"J\", \"⑦\", \"K\", \"B\", \"E\", \"Z\", \"C\", \"⑩\", \"´\", \"T\", \"O\", \"X\", \"⑤\", \"M\", \"F\", \"S\", \"⑧\", \"W\", \"D\", \"L\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/es": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1664455,
"_n_tokens": 340022,
"_n_chars": 1630297,
"_n_oov_chars": 40703,
"oov_ratio": 0.02496661651220606,
"_oov_charset": "[\"A\", \"…\", \"Ú\", \"N\", \"P\", \"Ñ\", \"М\", \"H\", \"U\", \"G\", \"R\", \"Y\", \"º\", \"Ó\", \"Q\", \"É\", \"I\", \"ª\", \"Á\", \"V\", \"J\", \"K\", \"B\", \"E\", \"²\", \"´\", \"C\", \"Z\", \"T\", \"O\", \"X\", \"M\", \"F\", \"S\", \"W\", \"D\", \"L\", \"Í\", \"″\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/fa": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2054052,
"_n_tokens": 1119673,
"_n_chars": 1145876,
"_n_oov_chars": 1472,
"oov_ratio": 0.001284606711371911,
"_oov_charset": "[\"…\", \"A\", \"N\", \"P\", \"H\", \"G\", \"U\", \"R\", \"Y\", \"Q\", \"I\", \"V\", \"J\", \"K\", \"B\", \"E\", \"Z\", \"C\", \"T\", \"O\", \"X\", \"M\", \"F\", \"ﮧ\", \"S\", \"W\", \"D\", \"L\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/fr": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1540504,
"_n_tokens": 500750,
"_n_chars": 1484970,
"_n_oov_chars": 28762,
"oov_ratio": 0.01936874145605635,
"_oov_charset": "[\"A\", \"…\", \"Ê\", \"N\", \"P\", \"Ç\", \"™\", \"H\", \"U\", \"G\", \"Â\", \"È\", \"R\", \"Y\", \"Q\", \"É\", \"I\", \"℃\", \"V\", \"J\", \"K\", \"Î\", \"B\", \"E\", \"²\", \"Z\", \"C\", \"´\", \"T\", \"O\", \"X\", \"M\", \"Ô\", \"F\", \"S\", \"µ\", \"W\", \"À\", \"D\", \"L\", \"″\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/ja": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1774770,
"_n_tokens": 1191203,
"_n_chars": 603065,
"_n_oov_chars": 9978,
"oov_ratio": 0.01654548017212075,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"R\", \"]\", \"V\", \"J\", \"7\", \"ィ\", \"8\", \"F\", \"-\", \"②\", \"C\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"W\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"U\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"@\", \"s\", \"Д\", \"M\", \"I\", \"「\", \"¥\", \"\\u001b\", \"B\", \"E\", \"Z\", \"´\", \"‼\", \"T\", \"1\", \"P\", \"<\", \"+\", \"9\", \"M\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"L\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"P\", \"0\", \" ̄\", \"w\", \"l\", \"d\", \"H\", \";\", \")\", \"[\", \"Ⅱ\", \"Y\", \"W\", \"y\", \"b\", \"℃\", \"ヨ\", \"」\", \"K\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"X\", \"テ\", \"F\", \"゚\", \"J\", \"*\", \"S\", \"D\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \"A\", \".\", \"N\", \"C\", \"ウ\", \"2\", \"G\", \"‥\", \"ア\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"Q\", \"t\", \"!\", \"m\", \"リ\", \"?\", \"L\", \"O\", \"ー\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"⑧\", \"A\", \"&\", \"~\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/ko": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1524839,
"_n_tokens": 1377796,
"_n_chars": 655190,
"_n_oov_chars": 10124,
"oov_ratio": 0.015452006288252263,
"_oov_charset": "[\"%\", \"⑥\", \"Ⅳ\", \"㉣\", \"立\", \"|\", \"R\", \"樂\", \"ㅈ\", \"ㅟ\", \"ㅋ\", \"ㅍ\", \"㎡\", \"ㅎ\", \"V\", \"J\", \"ㆍ\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"C\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \":\", \"①\", \"W\", \"ㅜ\", \"ㄹ\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"U\", \"v\", \"識\", \"ㅆ\", \"s\", \"@\", \"I\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"B\", \"E\", \"Z\", \"Ⅰ\", \"ㅅ\", \"T\", \"⑤\", \"ㄱ\", \"累\", \"M\", \"樂\", \"L\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"ㅕ\", \"P\", \"ㅛ\", \"ㅏ\", \"H\", \"龍\", \"㉰\", \"Ⅱ\", \"Y\", \"ㅓ\", \"⑨\", \"℃\", \"」\", \"K\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"X\", \"ㅐ\", \"⑵\", \"ㅔ\", \"良\", \"F\", \"ㅚ\", \"S\", \"*\", \"㎍\", \"D\", \"理\", \"梁\", \"A\", \"N\", \"Ⅲ\", \"陸\", \"G\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"Q\", \"¹\", \"ㅝ\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"ㅖ\", \"⑦\", \"?\", \"O\", \"金\", \"ⅱ\", \"Ⅹ\", \"⑧\", \"ㅊ\", \"女\", \"Ⅵ\", \"ㅢ\"]",
"lossless": false
},
"ClassCat/gpt2-base-spanish @ cc100/zh-Hans": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2633047,
"_n_tokens": 1978056,
"_n_chars": 927311,
"_n_oov_chars": 74022,
"oov_ratio": 0.07982435234780996,
"_oov_charset": "[\"%\", \"⑥\", \"⒋\", \"\\b\", \"R\", \"]\", \"\", \"V\", \"J\", \"7\", \"\\u0000\", \"\", \"8\", \"-\", \"②\", \"C\", \"⑴\", \",\", \":\", \"①\", \"W\", \"…\", \""\", \"_\", \"③\", \"p\", \"・\", \"⑶\", \"n\", \"6\", \"U\", \"\", \"T\", \"⒁\", \"3\", \"/\", \"\", \"s\", \"I\", \"B\", \"E\", \"Z\", \"T\", \"1\", \"⑤\", \"+\", \"\", \"9\", \"M\", \"⒃\", \"5\", \"⒂\", \"a\", \"h\", \"L\", \"r\", \"Ø\", \"④\", \"⑸\", \"P\", \"0\", \"d\", \"H\", \" \", \";\", \")\", \"[\", \"Y\", \"⑨\", \"℃\", \"K\", \" \", \"o\", \"⑩\", \"X\", \"F\", \"⒀\", \"S\", \"D\", \"D\", \"⑿\", \"(\", \"N\", \"A\", \".\", \"N\", \"⑷\", \"C\", \"2\", \"G\", \"Q\", \"t\", \"\\u0006\", \"!\", \"\", \"\\u0005\", \"⑦\", \"\\u0007\", \"?\", \"O\", \"V\", \"⒌\", \"e\", \"4\", \"⑧\", \"A\", \"&\", \"~\", \"i\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/ar": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2813283,
"_n_tokens": 996313,
"_n_chars": 1560987,
"_n_oov_chars": 928499,
"oov_ratio": 0.5948153315818774,
"_oov_charset": "[\"﴾\", \"😀\", \"ة\", \"ِ\", \"إ\", \"«\", \"ن\", \"ـ\", \"�\", \"\", \"ھ\", \"چ\", \"©\", \"█\", \"\", \"٩\", \"ُ\", \"\", \"ک\", \"ت\", \"؛\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ﻻ\", \"ﻷ\", \"ج\", \"″\", \"…\", \"
\", \"ف\", \"ص\", \"ﷺ\", \"ۚ\", \"â\", \"ع\", \"٪\", \"😊\", \"ٱ\", \"،\", \"٣\", \"۸\", \"س\", \"ۗ\", \"ی\", \"½\", \"ذ\", \"ه\", \"ح\", \"۲\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"﴿\", \"ئ\", \"ْ\", \"Х\", \"ί\", \"ٌ\", \"▪\", \"۰\", \"خ\", \"٠\", \"ۖ\", \"ؤ\", \"١\", \"ض\", \"أ\", \"َ\", \"κ\", \"¡\", \"٨\", \"؟\", \"ي\", \"ۤ\", \"ﻹ\", \"آ\", \"ظ\", \"🙂\", \"⤴\", \"ء\", \"ب\", \"۷\", \"ή\", \"ٹ\", \"›\", \"ٰ\", \"ى\", \"ر\", \"غ\", \"‹\", \"٢\", \"٦\", \"\", \"ط\", \"م\", \"پ\", \"ً\", \"χ\", \"ٍ\", \"▫\", \"ّ\", \"♥\", \"و\", \"٧\", \"↩\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/de": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1814876,
"_n_tokens": 960463,
"_n_chars": 1784021,
"_n_oov_chars": 5169,
"oov_ratio": 0.0028973874186458567,
"_oov_charset": "[\"…\", \"›\", \"Ä\", \"😀\", \"😢\", \"😉\", \"❤\", \"û\", \"å\", \"ί\", \"œ\", \"\", \"™\", \"¤\", \"č\", \"Ã\", \"ư\", \" \", \"‹\", \"«\", \"Ü\", \"☺\", \"😆\", \"¹\", \"â\", \"ô\", \"ė\", \"�\", \"ï\", \"ς\", \"¶\", \"Á\", \"🙁\", \"\", \"😃\", \"ø\", \"♦\", \"Ö\", \"‽\", \"€\", \"\", \"➔\", \"©\", \"😦\", \"Ÿ\", \"²\", \"´\", \"😈\", \"ι\", \"😂\", \"¿\", \"🙂\", \"‐\", \"ń\", \"\", \"🙄\", \"„\", \"½\", \"ć\", \"ß\", \"§\", \"š\", \"\", \"‚\", \"♥\", \"¬\", \"♡\", \"\", \"İ\", \"ớ\", \"↩\", \"Ø\", \"̈\", \"£\", \"¼\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/en": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1124813,
"_n_tokens": 526033,
"_n_chars": 1121360,
"_n_oov_chars": 141,
"oov_ratio": 0.00012574017264749946,
"_oov_charset": "[\"…\", \"😉\", \"③\", \"\", \"¦\", \"‑\", \"«\", \"😥\", \"�\", \"¡\", \"ï\", \"ñ\", \"\", \"\", \"⑦\", \"\", \"´\", \"⑩\", \"🙂\", \"⑤\", \"⑧\", \"\", \"£\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/es": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1664455,
"_n_tokens": 879530,
"_n_chars": 1630297,
"_n_oov_chars": 3885,
"oov_ratio": 0.002383001379503244,
"_oov_charset": "[\"…\", \"😀\", \"▷\", \"✪\", \"Ú\", \"😉\", \"❤\", \"Ñ\", \"\", \"👏\", \"º\", \"«\", \"Ó\", \"¡\", \"ñ\", \"ª\", \"️\", \"Á\", \"✖\", \"🙁\", \"ø\", \"✓\", \"€\", \"©\", \"😦\", \"²\", \"✔\", \"´\", \"¿\", \"🙂\", \"ý\", \"👍\", \"\", \"\", \"Í\", \"\", \"ô\", \"″\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/fa": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2054052,
"_n_tokens": 730377,
"_n_chars": 1145876,
"_n_oov_chars": 744234,
"oov_ratio": 0.6494891244776921,
"_oov_charset": "[\"۹\", \"ة\", \"ۆ\", \"ِ\", \"إ\", \"«\", \"ن\", \"ـ\", \"�\", \"\", \"ھ\", \"چ\", \"©\", \"ב\", \"٩\", \"ُ\", \"\", \"ک\", \"ت\", \"؛\", \"۶\", \"۴\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ج\", \"ט\", \"…\", \"ف\", \"۔\", \"ژ\", \"\", \"ص\", \"ۀ\", \"ے\", \"ڪ\", \"ع\", \"٪\", \"۳\", \"️\", \"،\", \"٣\", \"۸\", \"س\", \"ی\", \"ذ\", \"ه\", \"ح\", \"۲\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"٫\", \"ئ\", \"ْ\", \"ٌ\", \"۰\", \"خ\", \"٠\", \"ٴ\", \"ؤ\", \"١\", \"ض\", \"أ\", \"َ\", \"٨\", \"؟\", \"ي\", \"ٔ\", \"آ\", \"ظ\", \"▐\", \"ء\", \"ب\", \"۷\", \"›\", \"ى\", \"❤\", \"ر\", \"۵\", \"غ\", \"۱\", \"٢\", \"◄\", \"گ\", \"\", \"ּ\", \" \", \"ط\", \"م\", \"پ\", \"ً\", \"✿\", \"ﮧ\", \"ٍ\", \"ّ\", \"♥\", \"و\", \"٧\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/fr": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1540504,
"_n_tokens": 812012,
"_n_chars": 1484970,
"_n_oov_chars": 5476,
"oov_ratio": 0.003687616584846832,
"_oov_charset": "[\"…\", \"😀\", \"Ê\", \"̧\", \"😉\", \"❤\", \"û\", \"♕\", \"
\", \"̂\", \"œ\", \"Ç\", \"ğ\", \"™\", \"♠\", \"🤔\", \"Â\", \"È\", \"«\", \"î\", \"â\", \"�\", \"ï\", \"ê\", \"℃\", \"ë\", \"Î\", \"€\", \"²\", \"´\", \"ã\", \"🙂\", \"‐\", \"§\", \"Ô\", \"µ\", \"À\", \"\", \"ô\", \"″\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/ja": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1774770,
"_n_tokens": 565505,
"_n_chars": 603065,
"_n_oov_chars": 26633,
"oov_ratio": 0.044162735360201634,
"_oov_charset": "[\"%\", \"臨\", \"徴\", \"償\", \"営\", \"馳\", \"揶\", \"ぬ\", \"懸\", \"緒\", \"鐘\", \"樺\", \"\\b\", \"摂\", \"姦\", \"|\", \"◯\", \"納\", \"嶽\", \"噛\", \"脳\", \"監\", \"熱\", \"塵\", \"幣\", \"閑\", \"倫\", \"麗\", \"豊\", \"雑\", \"7\", \"嘆\", \"\", \"ィ\", \"塊\", \"8\", \"価\", \"聴\", \"喫\", \"F\", \"-\", \"閉\", \"⇔\", \"締\", \"紋\", \"詩\", \"S\", \"‐\", \"貴\", \"諏\", \"餃\", \"糞\", \"測\", \"斉\", \"貨\", \"貢\", \"輝\", \"①\", \"陣\", \"獣\", \"〝\", \"漬\", \"財\", \"釣\", \"窮\", \"諦\", \"診\", \"腎\", \"…\", \"レ\", \"▷\", \"詳\", \"ゎ\", \"ぱ\", \"ぽ\", \"頬\", \"桟\", \"託\", \"偽\", \"n\", \"凪\", \"T\", \"X\", \"奪\", \"課\", \"仏\", \"g\", \"遅\", \"/\", \"姉\", \"靄\", \"髭\", \"輿\", \"M\", \"😊\", \"飽\", \"濫\", \"換\", \"ぁ\", \"猟\", \"済\", \"¥\", \"繋\", \"\\u001b\", \"駆\", \"´\", \"‼\", \"✨\", \"P\", \"儲\", \"<\", \"訳\", \"腸\", \"灘\", \"憲\", \"園\", \"斬\", \"遡\", \"H\", \"賃\", \"嬢\", \"載\", \"恥\", \"減\", \"競\", \"I\", \"呟\", \"凱\", \"コ\", \"郵\", \"拶\", \"穂\", \"f\", \"陥\", \"軌\", \"墾\", \"浄\", \"複\", \"図\", \"喚\", \"曇\", \"練\", \"隣\", \"Ⅱ\", \"捩\", \"職\", \"彌\", \"麹\", \"y\", \"倉\", \"銀\", \"b\", \"痺\", \"廃\", \"⻑\", \"蠍\", \"興\", \"臓\", \"薬\", \"掴\", \"紛\", \"敗\", \"艶\", \"鞄\", \"遜\", \"⑩\", \"Ⅶ\", \"戻\", \"齢\", \"絡\", \"訟\", \"テ\", \"霧\", \"賭\", \"紡\", \"猶\", \"綱\", \"須\", \".\", \"彫\", \"乗\", \"貫\", \"燭\", \"謀\", \"❤\", \"◡\", \"誌\", \"誤\", \"揚\", \"児\", \"円\", \"爾\", \"⇒\", \"塚\", \"飴\", \"ア\", \"篤\", \"。\", \"訓\", \"ゾ\", \"Y\", \"亀\", \"腫\", \"隠\", \"勧\", \"醸\", \"t\", \"誠\", \"駕\", \"ぉ\", \"産\", \"m\", \"圧\", \"妬\", \"楓\", \"執\", \"責\", \"鑑\", \"?\", \"繰\", \"譚\", \"掛\", \"丿\", \"貸\", \"L\", \"ー\", \"塗\", \"損\", \"蛍\", \"轄\", \"拡\", \"ぇ\", \"傾\", \"嘩\", \"臥\", \"A\", \"韓\", \"純\", \"舗\", \"籠\", \"終\", \"巣\", \"蓋\", \"鯖\", \"カ\", \"💦\", \"縄\", \"i\", \"駄\", \"厳\", \"頓\", \"欽\", \"週\", \"悪\", \"僅\", \"滲\", \"剤\", \"悶\", \"艦\", \"聖\", \"淵\", \"縛\", \"織\", \"闘\", \"欝\", \"彙\", \"復\", \"膿\", \"�\", \"呂\", \"紀\", \"綺\", \"騙\", \"尋\", \"闊\", \"両\", \"訃\", \"鉄\", \"遺\", \"繍\", \"鍋\", \"唄\", \"険\", \"Q\", \"訂\", \"庁\", \"渦\", \"曽\", \"鍵\", \"獄\", \"\", \"蒔\", \"纏\", \"頃\", \"編\", \"団\", \"ゼ\", \"贅\", \"″\", \"鮮\", \"゙\", \"飛\", \"馴\", \"薩\", \"餌\", \"薦\", \"・\", \"鴻\", \"呑\", \"捗\", \"氾\", \"慶\", \"湧\", \"賞\", \"喪\", \"3\", \"衝\", \"`\", \"頒\", \"讃\", \"墳\", \"粋\", \"@\", \"謳\", \"磯\", \"緻\", \"紗\", \"「\", \"輩\", \"歩\", \"誕\", \"餓\", \"闖\", \"鳥\", \"飯\", \"輪\", \"貿\", \"駐\", \"鍛\", \"採\", \"貶\", \"縁\", \"謂\", \"+\", \"洩\", \"⌒\", \"躾\", \"棄\", \"辿\", \"謬\", \"癒\", \"橋\", \"稲\", \"✧\", \"襲\", \"覧\", \"㎞\", \"脈\", \"憶\", \"階\", \"筆\", \"E\", \"喰\", \"庫\", \"枠\", \"韮\", \"d\", \"鉛\", \"ぜ\", \"厭\", \"騰\", \"飾\", \"飲\", \"」\", \"渇\", \"慣\", \"ぴ\", \"賀\", \"冨\", \"剰\", \"談\", \"遼\", \"頼\", \"メ\", \"異\", \"贔\", \"粧\", \"屓\", \"揺\", \"帯\", \"゚\", \"検\", \"J\", \"*\", \"黙\", \"絵\", \"養\", \"髪\", \"違\", \"抜\", \"輸\", \"晩\", \"顔\", \"棟\", \"N\", \"銃\", \"帳\", \"贋\", \"ノ\", \"諾\", \"艸\", \"丼\", \"寧\", \"紐\", \"鳴\", \"釈\", \"脅\", \"滝\", \"欄\", \"2\", \"恵\", \"曖\", \"環\", \"婦\", \"孫\", \"証\", \"‥\", \"ヲ\", \"鎮\", \"陰\", \"K\", \"=\", \"潰\", \"ヘ\", \"!\", \"潔\", \"讐\", \"梱\", \"篠\", \"鉢\", \"銘\", \"囲\", \"礎\", \"穫\", \"謄\", \"訣\", \"満\", \"贈\", \"渉\", \" \", \"軟\", \"誹\", \"汚\", \"膚\", \"^\", \"澤\", \"k\", \"筈\", \"牽\", \"饉\", \"鉱\", \"澪\", \"و\", \"債\", \"貝\", \"畳\", \"憤\", \"範\", \"貼\", \"焼\", \"棲\", \"審\", \"戯\", \"譜\", \"鋭\", \"適\", \"捲\", \"協\", \"夢\", \"俵\", \"荘\", \"聞\", \"«\", \"顧\", \"択\", \"遙\", \"瘍\", \"錠\", \"]\", \"綜\", \"謙\", \"謗\", \"喩\", \"傷\", \"増\", \"惣\", \"額\", \"涼\", \"暦\", \"誘\", \"②\", \"麺\", \"継\", \"凍\", \"痩\", \"鶏\", \":\", \"維\", \"R\", \"ゝ\", \"針\", \"擬\", \"〟\", \"趨\", \"罠\", \"砕\", \"預\", \"縦\", \"ㅂ\", \"絆\", \"ゥ\", \"③\", \"湯\", \"勢\", \"滅\", \"顎\", \"6\", \"貯\", \"慮\", \"唸\", \"総\", \"箋\", \"\", \"専\", \"購\", \"緩\", \"涙\", \"噴\", \"醤\", \"揃\", \"煩\", \"剣\", \"羨\", \"売\", \"亜\", \"誇\", \"9\", \"飢\", \"桜\", \"貧\", \"輔\", \"餅\", \"宮\", \"汎\", \"釘\", \"a\", \"懐\", \"h\", \"壊\", \"ヨ\", \"r\", \"鈴\", \"築\", \"掃\", \"壌\", \"羅\", \"賠\", \"0\", \"嗚\", \"w\", \"弾\", \"ぷ\", \"l\", \"掻\", \"療\", \"︎\", \"駿\", \"郷\", \"鎌\", \"ゞ\", \"災\", \"軽\", \"飼\", \"漑\", \"嚥\", \"啓\", \"島\", \"℃\", \"軸\", \"濃\", \"覗\", \"ヘ\", \"侶\", \" \", \"擁\", \"o\", \"閲\", \"♪\", \"糧\", \"噂\", \"僕\", \"隕\", \"幹\", \"ぅ\", \"賊\", \"墜\", \"﨑\", \"歓\", \"貞\", \"紙\", \"綻\", \"Z\", \"(\", \"😢\", \"槍\", \"訴\", \"娯\", \"傑\", \"諸\", \"C\", \"潤\", \"寛\", \"驚\", \"挙\", \"B\", \"鏡\", \"冊\", \"併\", \"頂\", \"🌙\", \"獲\", \"緊\", \"傘\", \"頑\", \"リ\", \"億\", \"観\", \"奨\", \"跡\", \"瀬\", \"氷\", \"験\", \"陽\", \"賑\", \"疇\", \"緑\", \"詈\", \"処\", \"綾\", \"簗\", \"憑\", \"嘗\", \"嵐\", \"Ⅹ\", \"詮\", \"従\", \"⑧\", \"憂\", \"&\", \"頻\", \"♡\", \"罵\", \"縫\", \"ヾ\", \"護\", \"歯\", \"O\", \"漁\", \"側\", \"謎\", \"辺\", \"毎\", \"G\", \"領\", \"繊\", \"壇\", \"⑪\", \"訪\", \"偉\", \"込\", \"ハ\", \"😭\", \"騒\", \"錬\", \"覇\", \"頷\", \"๑\", \"勲\", \"穀\", \"犠\", \"轢\", \"詰\", \"駅\", \"©\", \"鱈\", \"緯\", \",\", \"賢\", \"霊\", \"😌\", \"$\", \"絶\", \"囁\", \">\", \"農\", \"蔵\", \"撲\", \"ぃ\", \"逡\", \"龍\", \"̈\", \"躊\", \"仮\", \"_\", \"悩\", \"〆\", \"醜\", \"値\", \"雰\", \"販\", \"U\", \"脇\", \"ぞ\", \"聾\", \"積\", \"殺\", \"扱\", \"、\", \"費\", \"渋\", \"訊\", \"撫\", \"儀\", \"s\", \"Д\", \"縞\", \"雲\", \"権\", \"ヶ\", \"捨\", \"順\", \"1\", \"績\", \"拝\", \"項\", \"勝\", \"摯\", \"殻\", \"蝋\", \"纒\", \"広\", \"紹\", \"5\", \"閣\", \"備\", \"軒\", \"渕\", \"拠\", \"鎖\", \"徹\", \"穢\", \"罰\", \"貪\", \"④\", \"歴\", \"匂\", \"駒\", \" ̄\", \"∇\", \"鵜\", \"暢\", \"顕\", \"樹\", \"殲\", \"袴\", \"斂\", \";\", \")\", \"[\", \"礫\", \"暁\", \"゚\", \"説\", \"W\", \"渓\", \"衆\", \"峠\", \"梶\", \"̀\", \"栄\", \"舎\", \"ヨ\", \"詐\", \"瘻\", \"暫\", \"負\", \"彿\", \"帰\", \"鬱\", \"挿\", \"穏\", \"捜\", \"ヵ\", \"慄\", \"敵\", \"ぼ\", \"諺\", \"煙\", \"兎\", \"窪\", \"謡\", \"層\", \"ヌ\", \"斎\", \"懇\", \"蓮\", \"∀\", \"効\", \"陳\", \"堅\", \"払\", \"ロ\", \"閃\", \"D\", \"綴\", \"沖\", \"銭\", \"懲\", \"軋\", \"鶴\", \"譲\", \"糾\", \"酔\", \"魚\", \"訝\", \"鋲\", \"虜\", \"鈍\", \"転\", \"ウ\", \"縮\", \"窓\", \"岡\", \"賛\", \"詠\", \"綬\", \"絞\", \"絨\", \"覚\", \"佇\", \"揮\", \"劉\", \"塩\", \"♫\", \"躍\", \"彡\", \"ゥ\", \"貰\", \"゙\", \"詫\", \"楊\", \"栃\", \"フ\", \"V\", \"舘\", \"廻\", \"働\", \"e\", \"4\", \"\\", \"圏\", \"奮\", \"労\", \"偵\", \"衛\", \"館\", \"掲\", \"構\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/ko": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1524839,
"_n_tokens": 344411,
"_n_chars": 655190,
"_n_oov_chars": 430264,
"oov_ratio": 0.656701109601795,
"_oov_charset": "[\"%\", \"먼\", \"ᴇ\", \"셔\", \"버\", \"증\", \"량\", \"禮\", \"鐘\", \"웅\", \"樺\", \"석\", \"옆\", \"깽\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"²\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"댈\", \"녀\", \"남\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"챙\", \"필\", \"呪\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"v\", \"콘\", \"홈\", \"험\", \"분\", \"직\", \"廟\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"콥\", \"≪\", \"쬐\", \"듬\", \"쫓\", \"봄\", \"ㅣ\", \"교\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"육\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"▒\", \"♧\", \"점\", \"똑\", \"것\", \"새\", \"곰\", \"룹\", \"🚨\", \"🗺\", \"㎍\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"⇒\", \"틀\", \"藝\", \"봉\", \"왠\", \"섦\", \"겁\", \"낀\", \"혁\", \"판\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"吳\", \"롱\", \"얏\", \"팍\", \"힉\", \"댔\", \"眞\", \"쌍\", \"높\", \"쾅\", \"굽\", \"더\", \"줏\", \"보\", \"淨\", \"긍\", \"쌈\", \"폿\", \"紀\", \"닳\", \"닷\", \"젝\", \"겨\", \"€\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"츠\", \"텔\", \"💣\", \"🔹\", \"↔\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"챗\", \"\", \"궜\", \"榮\", \"낳\", \"꺽\", \"맥\", \"「\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"융\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"贖\", \"飾\", \"웍\", \"퀸\", \"뀔\", \"면\", \"諒\", \"끄\", \"할\", \"홋\", \"뗀\", \"툼\", \"흐\", \"룩\", \"ㅇ\", \"문\", \"슷\", \"不\", \"陰\", \"왓\", \"믹\", \"탐\", \"엎\", \"계\", \"퀘\", \"라\", \"◐\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"맵\", \"킹\", \"광\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"틋\", \"헛\", \"머\", \"②\", \"염\", \"겔\", \"째\", \"밌\", \":\", \"콩\", \"♤\", \"쉬\", \"놨\", \"궈\", \"濁\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"滅\", \"\", \"월\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"귤\", \"쏠\", \"릭\", \"헌\", \"🙋\", \"앗\", \"코\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"외\", \"노\", \"쥐\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"℃\", \"삣\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"훼\", \"척\", \"쵸\", \"🍟\", \"驚\", \"ㅙ\", \"재\", \"충\", \"왔\", \"떳\", \"떻\", \"채\", \"삘\", \"얽\", \"웬\", \"찌\", \"➍\", \"주\", \"푸\", \"맺\", \"🏫\", \"찮\", \"템\", \"立\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"◀\", \"펼\", \"◈\", \"휠\", \"류\", \"냐\", \"©\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"잇\", \"뇌\", \"獻\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"▣\", \"칼\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"ㄱ\", \"닮\", \"俠\", \"싼\", \"동\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"춰\", \"뇨\", \"훔\", \"차\", \"ⅳ\", \"꾀\", \"갇\", \"챨\", \"돼\", \"네\", \"헤\", \"陳\", \"껑\", \"샹\", \"퀵\", \"푹\", \"魚\", \"튀\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"ⓒ\", \"렇\", \"ㅝ\", \"테\", \"핍\", \"헨\", \"창\", \"🍔\", \"곳\", \"포\", \"걱\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"烏\", \"譯\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"|\", \"궐\", \"릉\", \"힜\", \"퓰\", \"쳤\", \"꿈\", \"ã\", \"술\", \"꼭\", \"⑴\", \"향\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"⑶\", \"뻤\", \"땐\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"투\", \"ᴍ\", \"Ⅰ\", \"載\", \"응\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"깨\", \"잘\", \"롤\", \"堯\", \"화\", \"넵\", \"銀\", \"賣\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"캘\", \"폰\", \"곤\", \"❤\", \"🥁\", \"개\", \"윗\", \"壽\", \"ʏ\", \"축\", \"듀\", \"봅\", \"◦\", \"밟\", \"?\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"협\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"💦\", \"올\", \"취\", \"켰\", \"틱\", \"흰\", \"민\", \"�\", \"쌀\", \"흗\", \"예\", \"濟\", \"밍\", \"캉\", \"넛\", \"돗\", \"숏\", \"ⓔ\", \"걀\", \"득\", \"🌵\", \"밭\", \"팠\", \"쁜\", \"륜\", \"@\", \"균\", \"💕\", \"덜\", \"쪄\", \"️\", \"🤗\", \"긋\", \"력\", \"ㅅ\", \"駐\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"⑸\", \"🍰\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"헬\", \"졸\", \"엣\", \"칠\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"*\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"넥\", \"냥\", \"‥\", \"젠\", \"뻑\", \"닙\", \"탱\", \"뜩\", \"씩\", \"있\", \"믐\", \"들\", \"켄\", \"았\", \"뮐\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"♥\", \"잔\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"適\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"㎡\", \"ㅎ\", \"빅\", \"쿨\", \"뒷\", \"ⅰ\", \"쨍\", \"🙆\", \"쾨\", \"침\", \"🚿\", \"요\", \"蟄\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"ㄴ\", \"윤\", \"짧\", \"년\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"얍\", \"🏻\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"듣\", \"찔\", \"켓\", \"열\", \"즌\", \"태\", \"宮\", \"樂\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"습\", \"럭\", \"랙\", \"길\", \"탬\", \"잤\", \" \", \"줌\", \"♪\", \"딱\", \"장\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"과\", \"꿕\", \"였\", \"위\", \"숙\", \"ⅲ\", \"횡\", \"쎄\", \"둡\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"陽\", \"雙\", \"넘\", \"氷\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"관\", \"뜻\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"촌\", \"뮌\", \"빌\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"ㄹ\", \"꼬\", \"龍\", \"핏\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"쒀\", \"공\", \"🙇\", \"토\", \"죄\", \"골\", \"쁘\", \"빔\", \"뾱\", \"준\", \"슴\", \"罰\", \"쩍\", \"얄\", \"퓨\", \"④\", \"뚝\", \"峴\", \"킥\", \"벽\", \"➋\", \"데\", \"璿\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"짱\", \"펙\", \"댁\", \"슬\", \"쁨\", \"曆\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"靑\", \"내\", \"陸\", \"줍\", \"詔\", \"톱\", \"온\", \"▶\", \"킁\", \"을\", \"😂\", \"ⅱ\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"끔\", \"뀐\", \"덟\", \"합\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"韜\", \"🍭\", \"펠\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"紋\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"덧\", \"띈\", \"혈\", \"썅\", \"①\", \"훠\", \"탄\", \"窮\", \"두\", \"꽂\", \"…\", \"쏘\", \"궁\", \"팽\", \"톡\", \"🦄\", \"緞\", \"져\", \"칫\", \"돈\", \"換\", \"탕\", \"삶\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"쓴\", \"벳\", \"틈\", \"빕\", \"옷\", \"👍\", \"턴\", \"❍\", \"폼\", \"∙\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"멋\", \"삿\", \"틔\", \"✈\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"誡\", \"썹\", \"➏\", \"놈\", \"燭\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"敎\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"좌\", \"쿠\", \"떠\", \"└\", \"낮\", \"臥\", \"굉\", \"터\", \"🤟\", \"닥\", \"략\", \"딸\", \"ɪ\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"歲\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"鮮\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"劍\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"貿\", \"툴\", \"램\", \"앎\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"찢\", \"뺀\", \"瀧\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"에\", \"좋\", \"벤\", \"뚜\", \"택\", \"운\", \"뛸\", \"얼\", \"벙\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"協\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"고\", \"했\", \"퍽\", \"뮬\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"켜\", \"꽝\", \"😱\", \"왜\", \"③\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"깡\", \"숍\", \"컵\", \"얻\", \"닐\", \"🤕\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"옮\", \"펩\", \"맑\", \"혀\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"캣\", \"鎭\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"紙\", \"쯔\", \"壞\", \"결\", \"엇\", \"›\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"黃\", \"표\", \"몹\", \"\", \"담\", \"뽑\", \"✔\", \"희\", \"픽\", \"랫\", \"생\", \"확\", \"번\", \"Ⅹ\", \"며\", \"힌\", \"⑧\", \"♡\", \"텝\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"킬\", \"씽\", \"😭\", \"맬\", \"기\", \"팡\", \"핥\", \"穀\", \"ㆍ\", \"및\", \"맨\", \"큰\", \"륨\", \"훈\", \"렛\", \"펑\", \"§\", \"효\", \"農\", \"∮\", \"볕\", \"흙\", \"각\", \"체\", \"링\", \"벼\", \"륵\", \"殺\", \"콰\", \"槪\", \"꿰\", \"탑\", \"觸\", \"빤\", \"타\", \"국\", \"많\", \"卽\", \"낸\", \"☀\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"齋\", \"샴\", \"쫑\", \"읽\", \"앞\", \"늬\", \"츈\", \"픈\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"ᴛ\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"히\", \"씌\", \"욜\", \"풀\", \"詠\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"衛\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"魯\", \"샬\", \"덤\", \"멍\", \"튄\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"⑹\", \"곁\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"멘\", \"👏\", \"감\", \"課\", \"識\", \"텨\", \"😊\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"모\", \"빴\", \"켈\", \"릿\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"럿\", \"엽\", \"숟\", \"브\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"쿵\", \"\", \"췄\", \"藥\", \"질\", \"햇\", \"춘\", \"쿼\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"貸\", \"홍\", \"시\", \"韓\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"⋅\", \"껴\", \"곱\", \"聖\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"료\", \"형\", \"뮤\", \"랐\", \"족\", \"울\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"닌\", \"累\", \"후\", \"늑\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"웨\", \"휙\", \"당\", \"」\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"푼\", \"워\", \"💰\", \"싯\", \"먹\", \"🍞\", \"굴\", \"뭔\", \"핑\", \"받\", \"찍\", \"숲\", \"피\", \"듐\", \"¹\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"☎\", \"가\", \" \", \"널\", \"콤\", \"≫\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"⑥\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"😣\", \"정\", \"꼴\", \"쭙\", \"떴\", \"☞\", \"규\", \"군\", \"줬\", \"樂\", \"앱\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"루\", \"ㅞ\", \"뻐\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"勢\", \"밤\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"❏\", \"잼\", \"쭈\", \"컸\", \"쫄\", \"몸\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"란\", \"⑨\", \"몽\", \"넓\", \"혐\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"寛\", \"💅\", \"됬\", \"멀\", \"든\", \"⑦\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"유\", \"서\", \"누\", \"삐\", \"쿰\", \"된\", \"처\", \"♣\", \"💥\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"휩\", \"훑\", \"황\", \"역\", \"s\", \"웠\", \"셰\", \"렬\", \"雲\", \"눕\", \"⑤\", \"씻\", \"익\", \"軒\", \"찼\", \"얇\", \"팀\", \"£\", \"펄\", \"뷔\", \"진\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"樹\", \"룸\", \"뉴\", \"跏\", \"괌\", \"팔\", \"샐\", \"독\", \"꿍\", \"춥\", \"㉿\", \"얹\", \"자\", \"끼\", \"땠\", \"ㅐ\", \"⑵\", \"린\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"뿜\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"뎅\", \"넨\", \"ʟ\", \"燦\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/zh-Hans": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2633047,
"_n_tokens": 554154,
"_n_chars": 927311,
"_n_oov_chars": 68599,
"oov_ratio": 0.0739762603916054,
"_oov_charset": "[\"%\", \"⑥\", \"撐\", \"毎\", \"⒋\", \"铩\", \"\\b\", \"嘣\", \"瑥\", \"篢\", \"龇\", \"彙\", \"逑\", \"î\", \"黩\", \"]\", \"�\", \"戢\", \"唷\", \"旆\", \"\", \"\", \"7\", \"\\u0000\", \"\", \"8\", \"-\", \"©\", \"②\", \"⑴\", \",\", \"霊\", \":\", \"ὐ\", \"①\", \"〝\", \"\", \"…\", \""\", \"浞\", \"_\", \"漲\", \"③\", \"薩\", \"p\", \"娛\", \"・\", \"⑶\", \"託\", \"n\", \"6\", \"黢\", \"狳\", \"\", \"T\", \"倨\", \"⒁\", \"3\", \"慮\", \"/\", \"\", \"亂\", \"忪\", \"s\", \"屣\", \"犰\", \"阽\", \"瑢\", \"歩\", \"镏\", \"疴\", \"噴\", \"岣\", \"欸\", \"1\", \"矍\", \"⑤\", \"採\", \"+\", \"屄\", \"9\", \"\", \"挲\", \"⒃\", \"5\", \"瑒\", \"⒂\", \"〃\", \"a\", \"h\", \"r\", \"ヨ\", \"Ø\", \"旳\", \"擤\", \"④\", \"⑸\", \"艋\", \"0\", \"d\", \"▪\", \"韪\", \"鲎\", \" \", \";\", \")\", \"[\", \"卍\", \"⑨\", \"賣\", \"ê\", \"℃\", \"舎\", \"溘\", \" \", \"o\", \"⑩\", \"„\", \"⒀\", \"D\", \"⑿\", \"(\", \"N\", \".\", \"⑷\", \"耩\", \"C\", \"円\", \"2\", \"瑑\", \"瑧\", \"锒\", \"t\", \"ㄓ\", \"併\", \"\\u0006\", \"!\", \"ς\", \"猡\", \"\", \"\\u0005\", \"瑨\", \"⑦\", \"\\u0007\", \"劑\", \"?\", \"鼯\", \"灑\", \"壓\", \" \", \"損\", \"啐\", \"V\", \"⒌\", \"e\", \"4\", \"讦\", \"ό\", \"⑧\", \"A\", \"&\", \"黧\", \"i\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/ar": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2813283,
"_n_tokens": 996313,
"_n_chars": 1560987,
"_n_oov_chars": 928499,
"oov_ratio": 0.5948153315818774,
"_oov_charset": "[\"﴾\", \"😀\", \"ة\", \"ِ\", \"إ\", \"«\", \"ن\", \"ـ\", \"�\", \"\", \"ھ\", \"چ\", \"©\", \"█\", \"\", \"٩\", \"ُ\", \"\", \"ک\", \"ت\", \"؛\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ﻻ\", \"ﻷ\", \"ج\", \"″\", \"…\", \"
\", \"ف\", \"ص\", \"ﷺ\", \"ۚ\", \"â\", \"ع\", \"٪\", \"😊\", \"ٱ\", \"،\", \"٣\", \"۸\", \"س\", \"ۗ\", \"ی\", \"½\", \"ذ\", \"ه\", \"ح\", \"۲\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"﴿\", \"ئ\", \"ْ\", \"Х\", \"ί\", \"ٌ\", \"▪\", \"۰\", \"خ\", \"٠\", \"ۖ\", \"ؤ\", \"١\", \"ض\", \"أ\", \"َ\", \"κ\", \"¡\", \"٨\", \"؟\", \"ي\", \"ۤ\", \"ﻹ\", \"آ\", \"ظ\", \"🙂\", \"⤴\", \"ء\", \"ب\", \"۷\", \"ή\", \"ٹ\", \"›\", \"ٰ\", \"ى\", \"ر\", \"غ\", \"‹\", \"٢\", \"٦\", \"\", \"ط\", \"م\", \"پ\", \"ً\", \"χ\", \"ٍ\", \"▫\", \"ّ\", \"♥\", \"و\", \"٧\", \"↩\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/de": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1814876,
"_n_tokens": 960463,
"_n_chars": 1784021,
"_n_oov_chars": 5169,
"oov_ratio": 0.0028973874186458567,
"_oov_charset": "[\"…\", \"›\", \"Ä\", \"😀\", \"😢\", \"😉\", \"❤\", \"û\", \"å\", \"ί\", \"œ\", \"\", \"™\", \"¤\", \"č\", \"Ã\", \"ư\", \" \", \"‹\", \"«\", \"Ü\", \"☺\", \"😆\", \"¹\", \"â\", \"ô\", \"ė\", \"�\", \"ï\", \"ς\", \"¶\", \"Á\", \"🙁\", \"\", \"😃\", \"ø\", \"♦\", \"Ö\", \"‽\", \"€\", \"\", \"➔\", \"©\", \"😦\", \"Ÿ\", \"²\", \"´\", \"😈\", \"ι\", \"😂\", \"¿\", \"🙂\", \"‐\", \"ń\", \"\", \"🙄\", \"„\", \"½\", \"ć\", \"ß\", \"§\", \"š\", \"\", \"‚\", \"♥\", \"¬\", \"♡\", \"\", \"İ\", \"ớ\", \"↩\", \"Ø\", \"̈\", \"£\", \"¼\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/en": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1124813,
"_n_tokens": 526033,
"_n_chars": 1121360,
"_n_oov_chars": 141,
"oov_ratio": 0.00012574017264749946,
"_oov_charset": "[\"…\", \"😉\", \"③\", \"\", \"¦\", \"‑\", \"«\", \"😥\", \"�\", \"¡\", \"ï\", \"ñ\", \"\", \"\", \"⑦\", \"\", \"´\", \"⑩\", \"🙂\", \"⑤\", \"⑧\", \"\", \"£\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/es": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1664455,
"_n_tokens": 879530,
"_n_chars": 1630297,
"_n_oov_chars": 3885,
"oov_ratio": 0.002383001379503244,
"_oov_charset": "[\"…\", \"😀\", \"▷\", \"✪\", \"Ú\", \"😉\", \"❤\", \"Ñ\", \"\", \"👏\", \"º\", \"«\", \"Ó\", \"¡\", \"ñ\", \"ª\", \"️\", \"Á\", \"✖\", \"🙁\", \"ø\", \"✓\", \"€\", \"©\", \"😦\", \"²\", \"✔\", \"´\", \"¿\", \"🙂\", \"ý\", \"👍\", \"\", \"\", \"Í\", \"\", \"ô\", \"″\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/fa": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2054052,
"_n_tokens": 730377,
"_n_chars": 1145876,
"_n_oov_chars": 744234,
"oov_ratio": 0.6494891244776921,
"_oov_charset": "[\"۹\", \"ة\", \"ۆ\", \"ِ\", \"إ\", \"«\", \"ن\", \"ـ\", \"�\", \"\", \"ھ\", \"چ\", \"©\", \"ב\", \"٩\", \"ُ\", \"\", \"ک\", \"ت\", \"؛\", \"۶\", \"۴\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ج\", \"ט\", \"…\", \"ف\", \"۔\", \"ژ\", \"\", \"ص\", \"ۀ\", \"ے\", \"ڪ\", \"ع\", \"٪\", \"۳\", \"️\", \"،\", \"٣\", \"۸\", \"س\", \"ی\", \"ذ\", \"ه\", \"ح\", \"۲\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"٫\", \"ئ\", \"ْ\", \"ٌ\", \"۰\", \"خ\", \"٠\", \"ٴ\", \"ؤ\", \"١\", \"ض\", \"أ\", \"َ\", \"٨\", \"؟\", \"ي\", \"ٔ\", \"آ\", \"ظ\", \"▐\", \"ء\", \"ب\", \"۷\", \"›\", \"ى\", \"❤\", \"ر\", \"۵\", \"غ\", \"۱\", \"٢\", \"◄\", \"گ\", \"\", \"ּ\", \" \", \"ط\", \"م\", \"پ\", \"ً\", \"✿\", \"ﮧ\", \"ٍ\", \"ّ\", \"♥\", \"و\", \"٧\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/fr": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1540504,
"_n_tokens": 812012,
"_n_chars": 1484970,
"_n_oov_chars": 5476,
"oov_ratio": 0.003687616584846832,
"_oov_charset": "[\"…\", \"😀\", \"Ê\", \"̧\", \"😉\", \"❤\", \"û\", \"♕\", \"
\", \"̂\", \"œ\", \"Ç\", \"ğ\", \"™\", \"♠\", \"🤔\", \"Â\", \"È\", \"«\", \"î\", \"â\", \"�\", \"ï\", \"ê\", \"℃\", \"ë\", \"Î\", \"€\", \"²\", \"´\", \"ã\", \"🙂\", \"‐\", \"§\", \"Ô\", \"µ\", \"À\", \"\", \"ô\", \"″\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/ja": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1774770,
"_n_tokens": 565505,
"_n_chars": 603065,
"_n_oov_chars": 26633,
"oov_ratio": 0.044162735360201634,
"_oov_charset": "[\"%\", \"臨\", \"徴\", \"償\", \"営\", \"馳\", \"揶\", \"ぬ\", \"懸\", \"緒\", \"鐘\", \"樺\", \"\\b\", \"摂\", \"姦\", \"|\", \"◯\", \"納\", \"嶽\", \"噛\", \"脳\", \"監\", \"熱\", \"塵\", \"幣\", \"閑\", \"倫\", \"麗\", \"豊\", \"雑\", \"7\", \"嘆\", \"\", \"ィ\", \"塊\", \"8\", \"価\", \"聴\", \"喫\", \"F\", \"-\", \"閉\", \"⇔\", \"締\", \"紋\", \"詩\", \"S\", \"‐\", \"貴\", \"諏\", \"餃\", \"糞\", \"測\", \"斉\", \"貨\", \"貢\", \"輝\", \"①\", \"陣\", \"獣\", \"〝\", \"漬\", \"財\", \"釣\", \"窮\", \"諦\", \"診\", \"腎\", \"…\", \"レ\", \"▷\", \"詳\", \"ゎ\", \"ぱ\", \"ぽ\", \"頬\", \"桟\", \"託\", \"偽\", \"n\", \"凪\", \"T\", \"X\", \"奪\", \"課\", \"仏\", \"g\", \"遅\", \"/\", \"姉\", \"靄\", \"髭\", \"輿\", \"M\", \"😊\", \"飽\", \"濫\", \"換\", \"ぁ\", \"猟\", \"済\", \"¥\", \"繋\", \"\\u001b\", \"駆\", \"´\", \"‼\", \"✨\", \"P\", \"儲\", \"<\", \"訳\", \"腸\", \"灘\", \"憲\", \"園\", \"斬\", \"遡\", \"H\", \"賃\", \"嬢\", \"載\", \"恥\", \"減\", \"競\", \"I\", \"呟\", \"凱\", \"コ\", \"郵\", \"拶\", \"穂\", \"f\", \"陥\", \"軌\", \"墾\", \"浄\", \"複\", \"図\", \"喚\", \"曇\", \"練\", \"隣\", \"Ⅱ\", \"捩\", \"職\", \"彌\", \"麹\", \"y\", \"倉\", \"銀\", \"b\", \"痺\", \"廃\", \"⻑\", \"蠍\", \"興\", \"臓\", \"薬\", \"掴\", \"紛\", \"敗\", \"艶\", \"鞄\", \"遜\", \"⑩\", \"Ⅶ\", \"戻\", \"齢\", \"絡\", \"訟\", \"テ\", \"霧\", \"賭\", \"紡\", \"猶\", \"綱\", \"須\", \".\", \"彫\", \"乗\", \"貫\", \"燭\", \"謀\", \"❤\", \"◡\", \"誌\", \"誤\", \"揚\", \"児\", \"円\", \"爾\", \"⇒\", \"塚\", \"飴\", \"ア\", \"篤\", \"。\", \"訓\", \"ゾ\", \"Y\", \"亀\", \"腫\", \"隠\", \"勧\", \"醸\", \"t\", \"誠\", \"駕\", \"ぉ\", \"産\", \"m\", \"圧\", \"妬\", \"楓\", \"執\", \"責\", \"鑑\", \"?\", \"繰\", \"譚\", \"掛\", \"丿\", \"貸\", \"L\", \"ー\", \"塗\", \"損\", \"蛍\", \"轄\", \"拡\", \"ぇ\", \"傾\", \"嘩\", \"臥\", \"A\", \"韓\", \"純\", \"舗\", \"籠\", \"終\", \"巣\", \"蓋\", \"鯖\", \"カ\", \"💦\", \"縄\", \"i\", \"駄\", \"厳\", \"頓\", \"欽\", \"週\", \"悪\", \"僅\", \"滲\", \"剤\", \"悶\", \"艦\", \"聖\", \"淵\", \"縛\", \"織\", \"闘\", \"欝\", \"彙\", \"復\", \"膿\", \"�\", \"呂\", \"紀\", \"綺\", \"騙\", \"尋\", \"闊\", \"両\", \"訃\", \"鉄\", \"遺\", \"繍\", \"鍋\", \"唄\", \"険\", \"Q\", \"訂\", \"庁\", \"渦\", \"曽\", \"鍵\", \"獄\", \"\", \"蒔\", \"纏\", \"頃\", \"編\", \"団\", \"ゼ\", \"贅\", \"″\", \"鮮\", \"゙\", \"飛\", \"馴\", \"薩\", \"餌\", \"薦\", \"・\", \"鴻\", \"呑\", \"捗\", \"氾\", \"慶\", \"湧\", \"賞\", \"喪\", \"3\", \"衝\", \"`\", \"頒\", \"讃\", \"墳\", \"粋\", \"@\", \"謳\", \"磯\", \"緻\", \"紗\", \"「\", \"輩\", \"歩\", \"誕\", \"餓\", \"闖\", \"鳥\", \"飯\", \"輪\", \"貿\", \"駐\", \"鍛\", \"採\", \"貶\", \"縁\", \"謂\", \"+\", \"洩\", \"⌒\", \"躾\", \"棄\", \"辿\", \"謬\", \"癒\", \"橋\", \"稲\", \"✧\", \"襲\", \"覧\", \"㎞\", \"脈\", \"憶\", \"階\", \"筆\", \"E\", \"喰\", \"庫\", \"枠\", \"韮\", \"d\", \"鉛\", \"ぜ\", \"厭\", \"騰\", \"飾\", \"飲\", \"」\", \"渇\", \"慣\", \"ぴ\", \"賀\", \"冨\", \"剰\", \"談\", \"遼\", \"頼\", \"メ\", \"異\", \"贔\", \"粧\", \"屓\", \"揺\", \"帯\", \"゚\", \"検\", \"J\", \"*\", \"黙\", \"絵\", \"養\", \"髪\", \"違\", \"抜\", \"輸\", \"晩\", \"顔\", \"棟\", \"N\", \"銃\", \"帳\", \"贋\", \"ノ\", \"諾\", \"艸\", \"丼\", \"寧\", \"紐\", \"鳴\", \"釈\", \"脅\", \"滝\", \"欄\", \"2\", \"恵\", \"曖\", \"環\", \"婦\", \"孫\", \"証\", \"‥\", \"ヲ\", \"鎮\", \"陰\", \"K\", \"=\", \"潰\", \"ヘ\", \"!\", \"潔\", \"讐\", \"梱\", \"篠\", \"鉢\", \"銘\", \"囲\", \"礎\", \"穫\", \"謄\", \"訣\", \"満\", \"贈\", \"渉\", \" \", \"軟\", \"誹\", \"汚\", \"膚\", \"^\", \"澤\", \"k\", \"筈\", \"牽\", \"饉\", \"鉱\", \"澪\", \"و\", \"債\", \"貝\", \"畳\", \"憤\", \"範\", \"貼\", \"焼\", \"棲\", \"審\", \"戯\", \"譜\", \"鋭\", \"適\", \"捲\", \"協\", \"夢\", \"俵\", \"荘\", \"聞\", \"«\", \"顧\", \"択\", \"遙\", \"瘍\", \"錠\", \"]\", \"綜\", \"謙\", \"謗\", \"喩\", \"傷\", \"増\", \"惣\", \"額\", \"涼\", \"暦\", \"誘\", \"②\", \"麺\", \"継\", \"凍\", \"痩\", \"鶏\", \":\", \"維\", \"R\", \"ゝ\", \"針\", \"擬\", \"〟\", \"趨\", \"罠\", \"砕\", \"預\", \"縦\", \"ㅂ\", \"絆\", \"ゥ\", \"③\", \"湯\", \"勢\", \"滅\", \"顎\", \"6\", \"貯\", \"慮\", \"唸\", \"総\", \"箋\", \"\", \"専\", \"購\", \"緩\", \"涙\", \"噴\", \"醤\", \"揃\", \"煩\", \"剣\", \"羨\", \"売\", \"亜\", \"誇\", \"9\", \"飢\", \"桜\", \"貧\", \"輔\", \"餅\", \"宮\", \"汎\", \"釘\", \"a\", \"懐\", \"h\", \"壊\", \"ヨ\", \"r\", \"鈴\", \"築\", \"掃\", \"壌\", \"羅\", \"賠\", \"0\", \"嗚\", \"w\", \"弾\", \"ぷ\", \"l\", \"掻\", \"療\", \"︎\", \"駿\", \"郷\", \"鎌\", \"ゞ\", \"災\", \"軽\", \"飼\", \"漑\", \"嚥\", \"啓\", \"島\", \"℃\", \"軸\", \"濃\", \"覗\", \"ヘ\", \"侶\", \" \", \"擁\", \"o\", \"閲\", \"♪\", \"糧\", \"噂\", \"僕\", \"隕\", \"幹\", \"ぅ\", \"賊\", \"墜\", \"﨑\", \"歓\", \"貞\", \"紙\", \"綻\", \"Z\", \"(\", \"😢\", \"槍\", \"訴\", \"娯\", \"傑\", \"諸\", \"C\", \"潤\", \"寛\", \"驚\", \"挙\", \"B\", \"鏡\", \"冊\", \"併\", \"頂\", \"🌙\", \"獲\", \"緊\", \"傘\", \"頑\", \"リ\", \"億\", \"観\", \"奨\", \"跡\", \"瀬\", \"氷\", \"験\", \"陽\", \"賑\", \"疇\", \"緑\", \"詈\", \"処\", \"綾\", \"簗\", \"憑\", \"嘗\", \"嵐\", \"Ⅹ\", \"詮\", \"従\", \"⑧\", \"憂\", \"&\", \"頻\", \"♡\", \"罵\", \"縫\", \"ヾ\", \"護\", \"歯\", \"O\", \"漁\", \"側\", \"謎\", \"辺\", \"毎\", \"G\", \"領\", \"繊\", \"壇\", \"⑪\", \"訪\", \"偉\", \"込\", \"ハ\", \"😭\", \"騒\", \"錬\", \"覇\", \"頷\", \"๑\", \"勲\", \"穀\", \"犠\", \"轢\", \"詰\", \"駅\", \"©\", \"鱈\", \"緯\", \",\", \"賢\", \"霊\", \"😌\", \"$\", \"絶\", \"囁\", \">\", \"農\", \"蔵\", \"撲\", \"ぃ\", \"逡\", \"龍\", \"̈\", \"躊\", \"仮\", \"_\", \"悩\", \"〆\", \"醜\", \"値\", \"雰\", \"販\", \"U\", \"脇\", \"ぞ\", \"聾\", \"積\", \"殺\", \"扱\", \"、\", \"費\", \"渋\", \"訊\", \"撫\", \"儀\", \"s\", \"Д\", \"縞\", \"雲\", \"権\", \"ヶ\", \"捨\", \"順\", \"1\", \"績\", \"拝\", \"項\", \"勝\", \"摯\", \"殻\", \"蝋\", \"纒\", \"広\", \"紹\", \"5\", \"閣\", \"備\", \"軒\", \"渕\", \"拠\", \"鎖\", \"徹\", \"穢\", \"罰\", \"貪\", \"④\", \"歴\", \"匂\", \"駒\", \" ̄\", \"∇\", \"鵜\", \"暢\", \"顕\", \"樹\", \"殲\", \"袴\", \"斂\", \";\", \")\", \"[\", \"礫\", \"暁\", \"゚\", \"説\", \"W\", \"渓\", \"衆\", \"峠\", \"梶\", \"̀\", \"栄\", \"舎\", \"ヨ\", \"詐\", \"瘻\", \"暫\", \"負\", \"彿\", \"帰\", \"鬱\", \"挿\", \"穏\", \"捜\", \"ヵ\", \"慄\", \"敵\", \"ぼ\", \"諺\", \"煙\", \"兎\", \"窪\", \"謡\", \"層\", \"ヌ\", \"斎\", \"懇\", \"蓮\", \"∀\", \"効\", \"陳\", \"堅\", \"払\", \"ロ\", \"閃\", \"D\", \"綴\", \"沖\", \"銭\", \"懲\", \"軋\", \"鶴\", \"譲\", \"糾\", \"酔\", \"魚\", \"訝\", \"鋲\", \"虜\", \"鈍\", \"転\", \"ウ\", \"縮\", \"窓\", \"岡\", \"賛\", \"詠\", \"綬\", \"絞\", \"絨\", \"覚\", \"佇\", \"揮\", \"劉\", \"塩\", \"♫\", \"躍\", \"彡\", \"ゥ\", \"貰\", \"゙\", \"詫\", \"楊\", \"栃\", \"フ\", \"V\", \"舘\", \"廻\", \"働\", \"e\", \"4\", \"\\", \"圏\", \"奮\", \"労\", \"偵\", \"衛\", \"館\", \"掲\", \"構\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/ko": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1524839,
"_n_tokens": 344411,
"_n_chars": 655190,
"_n_oov_chars": 430264,
"oov_ratio": 0.656701109601795,
"_oov_charset": "[\"%\", \"먼\", \"ᴇ\", \"셔\", \"버\", \"증\", \"량\", \"禮\", \"鐘\", \"웅\", \"樺\", \"석\", \"옆\", \"깽\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"²\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"댈\", \"녀\", \"남\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"챙\", \"필\", \"呪\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"v\", \"콘\", \"홈\", \"험\", \"분\", \"직\", \"廟\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"콥\", \"≪\", \"쬐\", \"듬\", \"쫓\", \"봄\", \"ㅣ\", \"교\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"육\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"▒\", \"♧\", \"점\", \"똑\", \"것\", \"새\", \"곰\", \"룹\", \"🚨\", \"🗺\", \"㎍\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"⇒\", \"틀\", \"藝\", \"봉\", \"왠\", \"섦\", \"겁\", \"낀\", \"혁\", \"판\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"吳\", \"롱\", \"얏\", \"팍\", \"힉\", \"댔\", \"眞\", \"쌍\", \"높\", \"쾅\", \"굽\", \"더\", \"줏\", \"보\", \"淨\", \"긍\", \"쌈\", \"폿\", \"紀\", \"닳\", \"닷\", \"젝\", \"겨\", \"€\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"츠\", \"텔\", \"💣\", \"🔹\", \"↔\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"챗\", \"\", \"궜\", \"榮\", \"낳\", \"꺽\", \"맥\", \"「\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"융\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"贖\", \"飾\", \"웍\", \"퀸\", \"뀔\", \"면\", \"諒\", \"끄\", \"할\", \"홋\", \"뗀\", \"툼\", \"흐\", \"룩\", \"ㅇ\", \"문\", \"슷\", \"不\", \"陰\", \"왓\", \"믹\", \"탐\", \"엎\", \"계\", \"퀘\", \"라\", \"◐\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"맵\", \"킹\", \"광\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"틋\", \"헛\", \"머\", \"②\", \"염\", \"겔\", \"째\", \"밌\", \":\", \"콩\", \"♤\", \"쉬\", \"놨\", \"궈\", \"濁\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"滅\", \"\", \"월\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"귤\", \"쏠\", \"릭\", \"헌\", \"🙋\", \"앗\", \"코\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"외\", \"노\", \"쥐\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"℃\", \"삣\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"훼\", \"척\", \"쵸\", \"🍟\", \"驚\", \"ㅙ\", \"재\", \"충\", \"왔\", \"떳\", \"떻\", \"채\", \"삘\", \"얽\", \"웬\", \"찌\", \"➍\", \"주\", \"푸\", \"맺\", \"🏫\", \"찮\", \"템\", \"立\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"◀\", \"펼\", \"◈\", \"휠\", \"류\", \"냐\", \"©\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"잇\", \"뇌\", \"獻\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"▣\", \"칼\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"ㄱ\", \"닮\", \"俠\", \"싼\", \"동\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"춰\", \"뇨\", \"훔\", \"차\", \"ⅳ\", \"꾀\", \"갇\", \"챨\", \"돼\", \"네\", \"헤\", \"陳\", \"껑\", \"샹\", \"퀵\", \"푹\", \"魚\", \"튀\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"ⓒ\", \"렇\", \"ㅝ\", \"테\", \"핍\", \"헨\", \"창\", \"🍔\", \"곳\", \"포\", \"걱\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"烏\", \"譯\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"|\", \"궐\", \"릉\", \"힜\", \"퓰\", \"쳤\", \"꿈\", \"ã\", \"술\", \"꼭\", \"⑴\", \"향\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"⑶\", \"뻤\", \"땐\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"투\", \"ᴍ\", \"Ⅰ\", \"載\", \"응\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"깨\", \"잘\", \"롤\", \"堯\", \"화\", \"넵\", \"銀\", \"賣\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"캘\", \"폰\", \"곤\", \"❤\", \"🥁\", \"개\", \"윗\", \"壽\", \"ʏ\", \"축\", \"듀\", \"봅\", \"◦\", \"밟\", \"?\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"협\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"💦\", \"올\", \"취\", \"켰\", \"틱\", \"흰\", \"민\", \"�\", \"쌀\", \"흗\", \"예\", \"濟\", \"밍\", \"캉\", \"넛\", \"돗\", \"숏\", \"ⓔ\", \"걀\", \"득\", \"🌵\", \"밭\", \"팠\", \"쁜\", \"륜\", \"@\", \"균\", \"💕\", \"덜\", \"쪄\", \"️\", \"🤗\", \"긋\", \"력\", \"ㅅ\", \"駐\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"⑸\", \"🍰\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"헬\", \"졸\", \"엣\", \"칠\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"*\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"넥\", \"냥\", \"‥\", \"젠\", \"뻑\", \"닙\", \"탱\", \"뜩\", \"씩\", \"있\", \"믐\", \"들\", \"켄\", \"았\", \"뮐\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"♥\", \"잔\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"適\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"㎡\", \"ㅎ\", \"빅\", \"쿨\", \"뒷\", \"ⅰ\", \"쨍\", \"🙆\", \"쾨\", \"침\", \"🚿\", \"요\", \"蟄\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"ㄴ\", \"윤\", \"짧\", \"년\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"얍\", \"🏻\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"듣\", \"찔\", \"켓\", \"열\", \"즌\", \"태\", \"宮\", \"樂\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"습\", \"럭\", \"랙\", \"길\", \"탬\", \"잤\", \" \", \"줌\", \"♪\", \"딱\", \"장\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"과\", \"꿕\", \"였\", \"위\", \"숙\", \"ⅲ\", \"횡\", \"쎄\", \"둡\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"陽\", \"雙\", \"넘\", \"氷\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"관\", \"뜻\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"촌\", \"뮌\", \"빌\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"ㄹ\", \"꼬\", \"龍\", \"핏\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"쒀\", \"공\", \"🙇\", \"토\", \"죄\", \"골\", \"쁘\", \"빔\", \"뾱\", \"준\", \"슴\", \"罰\", \"쩍\", \"얄\", \"퓨\", \"④\", \"뚝\", \"峴\", \"킥\", \"벽\", \"➋\", \"데\", \"璿\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"짱\", \"펙\", \"댁\", \"슬\", \"쁨\", \"曆\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"靑\", \"내\", \"陸\", \"줍\", \"詔\", \"톱\", \"온\", \"▶\", \"킁\", \"을\", \"😂\", \"ⅱ\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"끔\", \"뀐\", \"덟\", \"합\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"韜\", \"🍭\", \"펠\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"紋\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"덧\", \"띈\", \"혈\", \"썅\", \"①\", \"훠\", \"탄\", \"窮\", \"두\", \"꽂\", \"…\", \"쏘\", \"궁\", \"팽\", \"톡\", \"🦄\", \"緞\", \"져\", \"칫\", \"돈\", \"換\", \"탕\", \"삶\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"쓴\", \"벳\", \"틈\", \"빕\", \"옷\", \"👍\", \"턴\", \"❍\", \"폼\", \"∙\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"멋\", \"삿\", \"틔\", \"✈\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"誡\", \"썹\", \"➏\", \"놈\", \"燭\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"敎\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"좌\", \"쿠\", \"떠\", \"└\", \"낮\", \"臥\", \"굉\", \"터\", \"🤟\", \"닥\", \"략\", \"딸\", \"ɪ\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"歲\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"鮮\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"劍\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"貿\", \"툴\", \"램\", \"앎\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"찢\", \"뺀\", \"瀧\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"에\", \"좋\", \"벤\", \"뚜\", \"택\", \"운\", \"뛸\", \"얼\", \"벙\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"協\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"고\", \"했\", \"퍽\", \"뮬\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"켜\", \"꽝\", \"😱\", \"왜\", \"③\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"깡\", \"숍\", \"컵\", \"얻\", \"닐\", \"🤕\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"옮\", \"펩\", \"맑\", \"혀\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"캣\", \"鎭\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"紙\", \"쯔\", \"壞\", \"결\", \"엇\", \"›\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"黃\", \"표\", \"몹\", \"\", \"담\", \"뽑\", \"✔\", \"희\", \"픽\", \"랫\", \"생\", \"확\", \"번\", \"Ⅹ\", \"며\", \"힌\", \"⑧\", \"♡\", \"텝\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"킬\", \"씽\", \"😭\", \"맬\", \"기\", \"팡\", \"핥\", \"穀\", \"ㆍ\", \"및\", \"맨\", \"큰\", \"륨\", \"훈\", \"렛\", \"펑\", \"§\", \"효\", \"農\", \"∮\", \"볕\", \"흙\", \"각\", \"체\", \"링\", \"벼\", \"륵\", \"殺\", \"콰\", \"槪\", \"꿰\", \"탑\", \"觸\", \"빤\", \"타\", \"국\", \"많\", \"卽\", \"낸\", \"☀\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"齋\", \"샴\", \"쫑\", \"읽\", \"앞\", \"늬\", \"츈\", \"픈\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"ᴛ\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"히\", \"씌\", \"욜\", \"풀\", \"詠\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"衛\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"魯\", \"샬\", \"덤\", \"멍\", \"튄\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"⑹\", \"곁\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"멘\", \"👏\", \"감\", \"課\", \"識\", \"텨\", \"😊\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"모\", \"빴\", \"켈\", \"릿\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"럿\", \"엽\", \"숟\", \"브\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"쿵\", \"\", \"췄\", \"藥\", \"질\", \"햇\", \"춘\", \"쿼\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"貸\", \"홍\", \"시\", \"韓\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"⋅\", \"껴\", \"곱\", \"聖\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"료\", \"형\", \"뮤\", \"랐\", \"족\", \"울\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"닌\", \"累\", \"후\", \"늑\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"웨\", \"휙\", \"당\", \"」\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"푼\", \"워\", \"💰\", \"싯\", \"먹\", \"🍞\", \"굴\", \"뭔\", \"핑\", \"받\", \"찍\", \"숲\", \"피\", \"듐\", \"¹\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"☎\", \"가\", \" \", \"널\", \"콤\", \"≫\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"⑥\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"😣\", \"정\", \"꼴\", \"쭙\", \"떴\", \"☞\", \"규\", \"군\", \"줬\", \"樂\", \"앱\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"루\", \"ㅞ\", \"뻐\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"勢\", \"밤\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"❏\", \"잼\", \"쭈\", \"컸\", \"쫄\", \"몸\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"란\", \"⑨\", \"몽\", \"넓\", \"혐\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"寛\", \"💅\", \"됬\", \"멀\", \"든\", \"⑦\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"유\", \"서\", \"누\", \"삐\", \"쿰\", \"된\", \"처\", \"♣\", \"💥\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"휩\", \"훑\", \"황\", \"역\", \"s\", \"웠\", \"셰\", \"렬\", \"雲\", \"눕\", \"⑤\", \"씻\", \"익\", \"軒\", \"찼\", \"얇\", \"팀\", \"£\", \"펄\", \"뷔\", \"진\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"樹\", \"룸\", \"뉴\", \"跏\", \"괌\", \"팔\", \"샐\", \"독\", \"꿍\", \"춥\", \"㉿\", \"얹\", \"자\", \"끼\", \"땠\", \"ㅐ\", \"⑵\", \"린\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"뿜\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"뎅\", \"넨\", \"ʟ\", \"燦\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"ClueAI/PromptCLUE-base @ cc100/zh-Hans": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2633047,
"_n_tokens": 554154,
"_n_chars": 927311,
"_n_oov_chars": 68599,
"oov_ratio": 0.0739762603916054,
"_oov_charset": "[\"%\", \"⑥\", \"撐\", \"毎\", \"⒋\", \"铩\", \"\\b\", \"嘣\", \"瑥\", \"篢\", \"龇\", \"彙\", \"逑\", \"î\", \"黩\", \"]\", \"�\", \"戢\", \"唷\", \"旆\", \"\", \"\", \"7\", \"\\u0000\", \"\", \"8\", \"-\", \"©\", \"②\", \"⑴\", \",\", \"霊\", \":\", \"ὐ\", \"①\", \"〝\", \"\", \"…\", \""\", \"浞\", \"_\", \"漲\", \"③\", \"薩\", \"p\", \"娛\", \"・\", \"⑶\", \"託\", \"n\", \"6\", \"黢\", \"狳\", \"\", \"T\", \"倨\", \"⒁\", \"3\", \"慮\", \"/\", \"\", \"亂\", \"忪\", \"s\", \"屣\", \"犰\", \"阽\", \"瑢\", \"歩\", \"镏\", \"疴\", \"噴\", \"岣\", \"欸\", \"1\", \"矍\", \"⑤\", \"採\", \"+\", \"屄\", \"9\", \"\", \"挲\", \"⒃\", \"5\", \"瑒\", \"⒂\", \"〃\", \"a\", \"h\", \"r\", \"ヨ\", \"Ø\", \"旳\", \"擤\", \"④\", \"⑸\", \"艋\", \"0\", \"d\", \"▪\", \"韪\", \"鲎\", \" \", \";\", \")\", \"[\", \"卍\", \"⑨\", \"賣\", \"ê\", \"℃\", \"舎\", \"溘\", \" \", \"o\", \"⑩\", \"„\", \"⒀\", \"D\", \"⑿\", \"(\", \"N\", \".\", \"⑷\", \"耩\", \"C\", \"円\", \"2\", \"瑑\", \"瑧\", \"锒\", \"t\", \"ㄓ\", \"併\", \"\\u0006\", \"!\", \"ς\", \"猡\", \"\", \"\\u0005\", \"瑨\", \"⑦\", \"\\u0007\", \"劑\", \"?\", \"鼯\", \"灑\", \"壓\", \" \", \"損\", \"啐\", \"V\", \"⒌\", \"e\", \"4\", \"讦\", \"ό\", \"⑧\", \"A\", \"&\", \"黧\", \"i\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/ar": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 2813283,
"_n_tokens": 621736,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"…\", \"\", \"\", \"ﷺ\", \"\", \"\", \"
\", \"�\", \"ﻹ\", \"\", \"ﻻ\", \"ﻷ\", \"½\", \"″\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/de": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1814876,
"_n_tokens": 470418,
"_n_chars": 1784021,
"_n_oov_chars": 497,
"oov_ratio": 0.00027858416464828607,
"_oov_charset": "[\"…\", \"\", \"\", \"¹\", \"²\", \"´\", \"�\", \"™\", \"½\", \" \", \"¼\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/en": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1124813,
"_n_tokens": 307881,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"…\", \"\", \"⑦\", \"‑\", \"③\", \"⑧\", \"´\", \"�\", \"⑩\", \"⑤\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/es": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1664455,
"_n_tokens": 462231,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"º\", \"²\", \"´\", \"\", \"ª\", \"″\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/fa": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 2054052,
"_n_tokens": 419922,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"…\", \"\", \"\", \"ﮧ\", \"\", \"\", \"�\", \" \", \"\", \"\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/fr": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1540504,
"_n_tokens": 460944,
"_n_chars": 1484970,
"_n_oov_chars": 839,
"oov_ratio": 0.0005649945790150643,
"_oov_charset": "[\"…\", \"µ\", \"²\", \"´\", \"�\", \"™\", \"℃\", \"″\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/ja": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1774770,
"_n_tokens": 290542,
"_n_chars": 603065,
"_n_oov_chars": 6762,
"oov_ratio": 0.011212721680084236,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"]\", \"�\", \"7\", \"\", \"ィ\", \"8\", \"F\", \"-\", \"②\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"@\", \"s\", \"M\", \"「\", \"¥\", \"\\u001b\", \"´\", \"‼\", \"1\", \"P\", \"<\", \"+\", \"9\", \"纒\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"0\", \" ̄\", \"w\", \"l\", \"d\", \";\", \")\", \"[\", \"Ⅱ\", \"W\", \"y\", \"b\", \"℃\", \"⻑\", \"」\", \"ヨ\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"テ\", \"゚\", \"J\", \"*\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \".\", \"C\", \"ウ\", \"2\", \"ア\", \"‥\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"t\", \"!\", \"m\", \"リ\", \"?\", \"L\", \" \", \"ー\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"⑧\", \"A\", \"&\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/ko": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1524839,
"_n_tokens": 424586,
"_n_chars": 655190,
"_n_oov_chars": 1365,
"oov_ratio": 0.0020833651307254385,
"_oov_charset": "[\"%\", \"⑥\", \"Ⅳ\", \"㉣\", \"立\", \"|\", \"〮\", \"힜\", \"樂\", \"ㅈ\", \"�\", \"ㅟ\", \"ㅋ\", \"뭥\", \"ㅍ\", \"㎡\", \"ㅎ\", \"\", \"ㆍ\", \"흗\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \"璣\", \":\", \"①\", \"ㅜ\", \"ㄹ\", \"\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"\", \"v\", \"識\", \"ㅆ\", \"쒀\", \"s\", \"@\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"Ⅰ\", \"ㅅ\", \"⑤\", \"ㄱ\", \"쓕\", \"累\", \"뾱\", \"樂\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"쫗\", \"ㅕ\", \"킌\", \"ㅛ\", \"츈\", \"ㅏ\", \"龍\", \"㉰\", \"Ⅱ\", \"ㅓ\", \"⑨\", \"℃\", \"삣\", \"」\", \"㉿\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"ㅐ\", \"⑵\", \"챨\", \"ㅔ\", \"퍙\", \"良\", \"ㅚ\", \"*\", \"㎍\", \"理\", \"梁\", \"웖\", \"꿕\", \"\", \"➏\", \"Ⅲ\", \"陸\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"ㅝ\", \"¹\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"왘\", \"폍\", \"綃\", \"ㅖ\", \"⑦\", \"?\", \"\", \"金\", \"ⅱ\", \"Ⅹ\", \"렜\", \"⑧\", \"ㅊ\", \"女\", \"Ⅵ\", \"ㅢ\", \"힉\"]",
"lossless": false
},
"CohereForAI/aya-101 @ cc100/zh-Hans": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 2633047,
"_n_tokens": 621182,
"_n_chars": 927311,
"_n_oov_chars": 68514,
"oov_ratio": 0.07388459750827932,
"_oov_charset": "[\"%\", \"⑥\", \"⒋\", \"\\b\", \"瑥\", \"篢\", \"黩\", \"]\", \"�\", \"\", \"\", \"7\", \"\\u0000\", \"8\", \"-\", \"②\", \"⑴\", \",\", \":\", \"①\", \"\", \"…\", \""\", \"_\", \"③\", \"鲱\", \"p\", \"・\", \"⑶\", \"n\", \"6\", \"黢\", \"\", \"T\", \"⒁\", \"3\", \"/\", \"\", \"s\", \"犰\", \"阽\", \"瑢\", \"犄\", \"1\", \"⑤\", \"+\", \"9\", \"⒃\", \"5\", \"瑒\", \"⒂\", \"a\", \"h\", \"r\", \"擤\", \"④\", \"⑸\", \"0\", \"d\", \" \", \";\", \")\", \"[\", \"腭\", \"⑨\", \"℃\", \" \", \"o\", \"⑩\", \"⒀\", \"D\", \"⑿\", \"(\", \"N\", \".\", \"棂\", \"⑷\", \"耩\", \"C\", \"2\", \"瑑\", \"锒\", \"t\", \"\\u0006\", \"!\", \"猡\", \"佝\", \"\", \"\\u0005\", \"瑨\", \"⑦\", \"\\u0007\", \"?\", \"鼯\", \" \", \"V\", \"⒌\", \"e\", \"4\", \"⑧\", \"A\", \"&\", \"i\"]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/ar": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 2813283,
"_n_tokens": 1106277,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/de": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1814876,
"_n_tokens": 583628,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/en": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1124813,
"_n_tokens": 259357,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/es": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1664455,
"_n_tokens": 494577,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/fa": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 2054052,
"_n_tokens": 866434,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/fr": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1540504,
"_n_tokens": 458961,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/ja": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1774770,
"_n_tokens": 605168,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/ko": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1524839,
"_n_tokens": 973288,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"靈\", \"不\", \"良\", \"女\", \"樂\", \"識\", \"樂\", \"流\", \"理\", \"金\", \"梁\", \"陸\", \"立\", \"龍\", \"累\"]",
"lossless": false
},
"EleutherAI/gpt-neox-20b @ cc100/zh-Hans": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 2633047,
"_n_tokens": 1220529,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/ar": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 2813283,
"_n_tokens": 498287,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"…\", \"\", \"\", \"ﷺ\", \"\", \"\", \"
\", \"�\", \"ﻹ\", \"\", \"ﻻ\", \"ﻷ\", \"½\", \"″\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/de": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1814876,
"_n_tokens": 412571,
"_n_chars": 1784021,
"_n_oov_chars": 498,
"oov_ratio": 0.0002791446961666931,
"_oov_charset": "[\"…\", \"\", \"‽\", \"\", \"¹\", \"²\", \"´\", \"�\", \"™\", \"½\", \" \", \"¼\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/en": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1124813,
"_n_tokens": 280026,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"…\", \"\", \"⑦\", \"‑\", \"③\", \"⑧\", \"´\", \"�\", \"⑩\", \"⑤\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/es": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1664455,
"_n_tokens": 379850,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"º\", \"²\", \"´\", \"\", \"ª\", \"″\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/fa": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 2054052,
"_n_tokens": 310926,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"…\", \"\", \"\", \"ﮧ\", \"\", \"\", \"�\", \" \", \"\", \"\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/fr": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1540504,
"_n_tokens": 385041,
"_n_chars": 1484970,
"_n_oov_chars": 841,
"oov_ratio": 0.0005663414075705233,
"_oov_charset": "[\"…\", \"µ\", \"
\", \"²\", \"´\", \"�\", \"™\", \"℃\", \"″\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/ja": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1774770,
"_n_tokens": 324820,
"_n_chars": 603065,
"_n_oov_chars": 6779,
"oov_ratio": 0.011240911012909057,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"欝\", \"]\", \"�\", \"7\", \"\", \"ィ\", \"8\", \"F\", \"-\", \"杼\", \"②\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"ゎ\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"\", \"@\", \"s\", \"M\", \"「\", \"¥\", \"\\u001b\", \"´\", \"‼\", \"1\", \"P\", \"<\", \"+\", \"9\", \"纒\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"0\", \" ̄\", \"w\", \"l\", \"韮\", \"d\", \";\", \")\", \"[\", \"漑\", \"Ⅱ\", \"W\", \"y\", \"b\", \"℃\", \"⻑\", \"」\", \"ヨ\", \"瘻\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"テ\", \"﨑\", \"゚\", \"J\", \"*\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \"贋\", \".\", \"鋲\", \"C\", \"ウ\", \"2\", \"ア\", \"‥\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"t\", \"!\", \"碓\", \"m\", \"リ\", \"?\", \"詈\", \"L\", \" \", \"ー\", \"簗\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"饉\", \"⑧\", \"A\", \"&\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/ko": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1524839,
"_n_tokens": 354571,
"_n_chars": 655190,
"_n_oov_chars": 1403,
"oov_ratio": 0.002141363573925121,
"_oov_charset": "[\"%\", \"⑥\", \"쟤\", \"Ⅳ\", \"蚩\", \"㉣\", \"立\", \"|\", \"🍭\", \"〮\", \"힜\", \"樂\", \"ㅈ\", \"�\", \"ㅟ\", \"ㅋ\", \"뭥\", \"ㅍ\", \"㎡\", \"ㅎ\", \"\", \"ㆍ\", \"흗\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \"🚿\", \":\", \"썅\", \"①\", \"ㅜ\", \"ㄹ\", \"🏷\", \"\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"🌵\", \"流\", \"ㄷ\", \"⑶\", \"\", \"v\", \"\", \"識\", \"槪\", \"ㅆ\", \"쒀\", \"s\", \"@\", \"➎\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"趺\", \"🤕\", \"Ⅰ\", \"ㅅ\", \"⑤\", \"卽\", \"ㄱ\", \"쓕\", \"累\", \"뾱\", \"樂\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"쫗\", \"ㅕ\", \"킌\", \"ㅛ\", \"츈\", \"ㅏ\", \"龍\", \"跏\", \"㉰\", \"Ⅱ\", \"짢\", \"ㅓ\", \"⑨\", \"℃\", \"삣\", \"」\", \"㉿\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"ㅐ\", \"⑵\", \"챨\", \"ㅔ\", \"퍙\", \"良\", \"ㅚ\", \"➌\", \"⚀\", \"🗺\", \"*\", \"㎍\", \"理\", \"梁\", \"웖\", \"꿕\", \"\", \"➏\", \"🍞\", \"🥁\", \"Ⅲ\", \"陸\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"🍟\", \"悧\", \"ⓒ\", \"ㅝ\", \"¹\", \"섦\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"왘\", \"믐\", \"綃\", \"ㅖ\", \"⑦\", \"폍\", \"?\", \"\", \"킁\", \"金\", \"ⅱ\", \"삘\", \"Ⅹ\", \"렜\", \"⑧\", \"ㅊ\", \"띕\", \"女\", \"Ⅵ\", \"ㅢ\", \"➍\"]",
"lossless": false
},
"FacebookAI/xlm-roberta-base @ cc100/zh-Hans": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 2633047,
"_n_tokens": 599844,
"_n_chars": 927311,
"_n_oov_chars": 68556,
"oov_ratio": 0.07392988975651103,
"_oov_charset": "[\"浠\", \"%\", \"⑥\", \"⒋\", \"牖\", \"\\b\", \"樯\", \"鄯\", \"瑥\", \"篢\", \"勖\", \"黩\", \"]\", \"�\", \"戢\", \"旆\", \"\", \"\", \"7\", \"\\u0000\", \"\", \"8\", \"-\", \"②\", \"韫\", \"⑴\", \",\", \":\", \"穰\", \"①\", \"\", \"…\", \""\", \"浞\", \"_\", \"③\", \"鲱\", \"p\", \"・\", \"⑶\", \"n\", \"6\", \"狳\", \"\", \"T\", \"倨\", \"⒁\", \"3\", \"绉\", \"/\", \"\", \"s\", \"屣\", \"犰\", \"阽\", \"瑢\", \"镏\", \"疴\", \"飕\", \"犄\", \"岣\", \"1\", \"矍\", \"⑤\", \"+\", \"\", \"9\", \"⒃\", \"5\", \"瑒\", \"⒂\", \"a\", \"h\", \"r\", \"擤\", \"④\", \"⑸\", \"0\", \"d\", \"韪\", \"鲎\", \" \", \";\", \")\", \"[\", \"⑨\", \"℃\", \"纰\", \" \", \"o\", \"⑩\", \"偻\", \"⒀\", \"D\", \"⑿\", \"鳃\", \"(\", \"翕\", \"N\", \".\", \"逶\", \"棂\", \"聒\", \"⑷\", \"傥\", \"耩\", \"C\", \"2\", \"瑑\", \"瑧\", \"撷\", \"t\", \"\\u0006\", \"!\", \"猡\", \"\", \"\\u0005\", \"瑨\", \"⑦\", \"\\u0007\", \"?\", \"鼯\", \" \", \"嘭\", \"V\", \"⒌\", \"诨\", \"4\", \"e\", \"讦\", \"⑧\", \"A\", \"&\", \"黧\", \"茏\", \"i\"]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/ar": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 2813283,
"_n_tokens": 1195640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/de": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1814876,
"_n_tokens": 620541,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/en": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1124813,
"_n_tokens": 288965,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/es": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1664455,
"_n_tokens": 530592,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/fa": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 2054052,
"_n_tokens": 851630,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/fr": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1540504,
"_n_tokens": 509958,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/ja": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1774770,
"_n_tokens": 546876,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/ko": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1524839,
"_n_tokens": 580873,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/starchat-alpha @ cc100/zh-Hans": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 2633047,
"_n_tokens": 882018,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/ar": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/de": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/en": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/es": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/fa": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/fr": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/ja": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/ko": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/zh-Hans": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/ar": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/de": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/en": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/es": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/fa": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/fr": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/ja": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/ko": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"LLM360/CrystalCoder @ cc100/zh-Hans": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/ar": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/de": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/en": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/es": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/fa": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/fr": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/ja": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/ko": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/zh-Hans": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"OrionStarAI/Orion-14B-Chat @ cc100/ar": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 2813283,
"_n_tokens": 1531053,
"_n_chars": 1560987,
"_n_oov_chars": 1513,
"oov_ratio": 0.0009692585524415002,
"_oov_charset": "[\"…\", \"﴾\", \"ٰ\", \"
\", \"ٌ\", \"ﷺ\", \"ۚ\", \"ۖ\", \"�\", \"٪\", \"ٱ\", \"\", \"\", \"ۤ\", \"ﻹ\", \"ۗ\", \"½\", \"⤴\", \"\", \"؛\", \"\", \"﴿\", \"\", \"ﻻ\", \"ﻷ\", \"″\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/de": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1814876,
"_n_tokens": 744404,
"_n_chars": 1784021,
"_n_oov_chars": 497,
"oov_ratio": 0.00027858416464828607,
"_oov_charset": "[\"…\", \"\", \"\", \"¹\", \"²\", \"´\", \"�\", \"™\", \"½\", \" \", \"¼\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/en": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1124813,
"_n_tokens": 265948,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"…\", \"\", \"⑦\", \"‑\", \"③\", \"⑧\", \"´\", \"�\", \"⑩\", \"⑤\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/es": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1664455,
"_n_tokens": 628571,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"º\", \"²\", \"´\", \"\", \"ª\", \"″\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/fa": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 2054052,
"_n_tokens": 1131108,
"_n_chars": 1145876,
"_n_oov_chars": 8144,
"oov_ratio": 0.007107226261829378,
"_oov_charset": "[\"…\", \"\", \"\", \"؛\", \"ۀ\", \"\", \"ﮧ\", \"\", \"ٴ\", \"ٔ\", \"�\", \"ٌ\", \"\", \"٪\", \"۔\", \"ۆ\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/fr": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1540504,
"_n_tokens": 564107,
"_n_chars": 1484970,
"_n_oov_chars": 839,
"oov_ratio": 0.0005649945790150643,
"_oov_charset": "[\"…\", \"µ\", \"²\", \"´\", \"�\", \"™\", \"℃\", \"″\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/ja": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1774770,
"_n_tokens": 324956,
"_n_chars": 603065,
"_n_oov_chars": 3909,
"oov_ratio": 0.006481888353660053,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"]\", \"�\", \"7\", \"\", \"ィ\", \"8\", \"F\", \"-\", \"②\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"\", \"@\", \"s\", \"M\", \"「\", \"¥\", \"\\u001b\", \"´\", \"‼\", \"1\", \"P\", \"<\", \"+\", \"9\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"0\", \" ̄\", \"w\", \"l\", \"d\", \")\", \"[\", \"Ⅱ\", \"W\", \"y\", \"b\", \"℃\", \"ヨ\", \"」\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"テ\", \"゚\", \"J\", \"*\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \".\", \"C\", \"ウ\", \"2\", \"ア\", \"‥\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"t\", \"!\", \"m\", \"リ\", \"?\", \"L\", \"ー\", \"簗\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"⑧\", \"A\", \"&\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/ko": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1524839,
"_n_tokens": 351149,
"_n_chars": 655190,
"_n_oov_chars": 1443,
"oov_ratio": 0.002202414566766892,
"_oov_charset": "[\"%\", \"⑥\", \"쟤\", \"Ⅳ\", \"쭙\", \"㉣\", \"立\", \"|\", \"깽\", \"힜\", \"樂\", \"맬\", \"ㅈ\", \"�\", \"ㅟ\", \"쫒\", \"ㅋ\", \"튄\", \"뭥\", \"ㅍ\", \"㎡\", \"ㅎ\", \"돠\", \"\", \"ㆍ\", \"흗\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"⑴\", \"⑹\", \"쾨\", \"Ⅷ\", \"⁴\", \"ㅞ\", \":\", \"썅\", \"①\", \"ㅜ\", \"ㄹ\", \"훠\", \"\", \"꺄\", \"잴\", \"쳇\", \"…\", \"뜹\", \"ⓔ\", \"ㅗ\", \"뮈\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"쥰\", \"v\", \"궜\", \"識\", \"팹\", \"ㅆ\", \"쒀\", \"s\", \"@\", \"얍\", \"Ⅴ\", \"「\", \"ㅁ\", \"죤\", \"靈\", \"ㅠ\", \"㏊\", \"Ⅰ\", \"ㅅ\", \"쐬\", \"⑤\", \"ㄱ\", \"쓕\", \"累\", \"앎\", \"롸\", \"뾱\", \"樂\", \"홑\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"쫗\", \"ㅕ\", \"쫑\", \"킌\", \"ㅛ\", \"츈\", \"ㅏ\", \"빳\", \"龍\", \"㉰\", \"Ⅱ\", \"짢\", \"휙\", \"ㅓ\", \"⑨\", \"℃\", \"삣\", \"」\", \"틔\", \"봬\", \"㉿\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"픕\", \"ㅐ\", \"⑵\", \"챨\", \"뼘\", \"ㅔ\", \"퍙\", \"良\", \"ㅚ\", \"⚀\", \"*\", \"㎍\", \"튿\", \"셌\", \"理\", \"갉\", \"뗀\", \"梁\", \"웖\", \"탰\", \"꿕\", \"\", \"넹\", \"Ⅲ\", \"갛\", \"쌉\", \"陸\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"ㅝ\", \"¹\", \"섦\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"왘\", \"믐\", \"폍\", \"ㅖ\", \"⑦\", \"녜\", \"?\", \"\", \"킁\", \"뮐\", \"金\", \"ⅱ\", \"삘\", \"Ⅹ\", \"렜\", \"⑧\", \"ㅊ\", \"귈\", \"솨\", \"띕\", \"女\", \"Ⅵ\", \"ㅢ\", \"흄\", \"껀\", \"힉\"]",
"lossless": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/zh-Hans": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 2633047,
"_n_tokens": 529926,
"_n_chars": 927311,
"_n_oov_chars": 21462,
"oov_ratio": 0.02314433884640644,
"_oov_charset": "[\"…\", \"%\", \".\", \"⑸\", \"⑥\", \""\", \"⒋\", \"_\", \"0\", \"⑷\", \"③\", \"d\", \"C\", \"p\", \"・\", \"2\", \"\\b\", \"⑶\", \"n\", \"6\", \" \", \"T\", \")\", \"[\", \"⒁\", \"3\", \"/\", \"t\", \"]\", \"�\", \"\\u0006\", \"⑨\", \"s\", \"℃\", \"\\u0005\", \"\", \"7\", \"\\u0007\", \"\\u0000\", \"⑦\", \"8\", \"-\", \"i\", \"②\", \" \", \"o\", \"⑩\", \"⑴\", \"1\", \"⑤\", \",\", \"V\", \"+\", \"⒌\", \"9\", \":\", \"⒃\", \"e\", \"4\", \"⒀\", \"5\", \"⒂\", \"①\", \"A\", \"⑧\", \"a\", \"&\", \"\", \"h\", \"r\", \"D\", \"⑿\", \"(\", \"N\", \"④\"]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/ar": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/de": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/en": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen-7B-Chat @ cc100/es": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen-7B-Chat @ cc100/fa": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/fr": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/ja": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/ko": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"靈\", \"不\", \"良\", \"女\", \"樂\", \"識\", \"樂\", \"流\", \"理\", \"金\", \"梁\", \"陸\", \"立\", \"龍\", \"累\"]",
"lossless": false
},
"Qwen/Qwen-7B-Chat @ cc100/zh-Hans": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-1.8B @ cc100/ar": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-1.8B @ cc100/de": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-1.8B @ cc100/en": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-1.8B @ cc100/es": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-1.8B @ cc100/fa": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-1.8B @ cc100/fr": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-1.8B @ cc100/ja": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-1.8B @ cc100/ko": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"靈\", \"不\", \"良\", \"女\", \"樂\", \"識\", \"樂\", \"流\", \"理\", \"金\", \"梁\", \"陸\", \"立\", \"龍\", \"累\"]",
"lossless": false
},
"Qwen/Qwen1.5-1.8B @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-110B @ cc100/ar": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-110B @ cc100/de": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-110B @ cc100/en": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-110B @ cc100/es": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-110B @ cc100/fa": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-110B @ cc100/fr": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-110B @ cc100/ja": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-110B @ cc100/ko": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"靈\", \"不\", \"良\", \"女\", \"樂\", \"識\", \"樂\", \"流\", \"理\", \"金\", \"梁\", \"陸\", \"立\", \"龍\", \"累\"]",
"lossless": false
},
"Qwen/Qwen1.5-110B @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-14B @ cc100/ar": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-14B @ cc100/de": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-14B @ cc100/en": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-14B @ cc100/es": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen1.5-14B @ cc100/fa": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-14B @ cc100/fr": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-14B @ cc100/ja": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen1.5-14B @ cc100/ko": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"靈\", \"不\", \"良\", \"女\", \"樂\", \"識\", \"樂\", \"流\", \"理\", \"金\", \"梁\", \"陸\", \"立\", \"龍\", \"累\"]",
"lossless": false
},
"Qwen/Qwen1.5-14B @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/ar": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2813283,
"_n_tokens": 1422065,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/de": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1814876,
"_n_tokens": 527308,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/en": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1124813,
"_n_tokens": 284617,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/es": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1664455,
"_n_tokens": 482211,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/fa": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2054052,
"_n_tokens": 1145072,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/fr": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1540504,
"_n_tokens": 447233,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/ja": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1774770,
"_n_tokens": 593613,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/ko": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1524839,
"_n_tokens": 952744,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-Math @ cc100/zh-Hans": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2633047,
"_n_tokens": 653923,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/ar": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2813283,
"_n_tokens": 1422065,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/de": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1814876,
"_n_tokens": 527308,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/en": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1124813,
"_n_tokens": 284617,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/es": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1664455,
"_n_tokens": 482211,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/fa": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2054052,
"_n_tokens": 1145072,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/fr": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1540504,
"_n_tokens": 447233,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/ja": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1774770,
"_n_tokens": 593613,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/ko": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1524839,
"_n_tokens": 952744,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Skywork/Skywork-13B-base @ cc100/zh-Hans": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2633047,
"_n_tokens": 653923,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm-6b @ cc100/ar": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 2813283,
"_n_tokens": 1077200,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"…\", \"\", \"\", \"ﷺ\", \"\", \"\", \"
\", \"�\", \"ﻹ\", \"\", \"ﻻ\", \"ﻷ\", \"½\", \"″\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/de": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1814876,
"_n_tokens": 569464,
"_n_chars": 1784021,
"_n_oov_chars": 497,
"oov_ratio": 0.00027858416464828607,
"_oov_charset": "[\"…\", \"\", \"\", \"¹\", \"²\", \"´\", \"�\", \"™\", \"½\", \" \", \"¼\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/en": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1124813,
"_n_tokens": 264761,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"…\", \"\", \"⑦\", \"‑\", \"③\", \"⑧\", \"´\", \"�\", \"⑩\", \"⑤\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/es": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1664455,
"_n_tokens": 494848,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"º\", \"²\", \"´\", \"\", \"ª\", \"″\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/fa": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 2054052,
"_n_tokens": 890808,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"…\", \"\", \"\", \"ﮧ\", \"\", \"\", \"�\", \" \", \"\", \"\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/fr": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1540504,
"_n_tokens": 479261,
"_n_chars": 1484970,
"_n_oov_chars": 839,
"oov_ratio": 0.0005649945790150643,
"_oov_charset": "[\"…\", \"µ\", \"²\", \"´\", \"�\", \"™\", \"℃\", \"″\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/ja": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1774770,
"_n_tokens": 469930,
"_n_chars": 603065,
"_n_oov_chars": 6759,
"oov_ratio": 0.01120774709193868,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"]\", \"�\", \"7\", \"\", \"ィ\", \"8\", \"F\", \"-\", \"②\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"@\", \"s\", \"M\", \"「\", \"¥\", \"\\u001b\", \"´\", \"‼\", \"1\", \"P\", \"<\", \"+\", \"9\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"0\", \" ̄\", \"w\", \"l\", \"d\", \";\", \")\", \"[\", \"Ⅱ\", \"W\", \"y\", \"b\", \"℃\", \"ヨ\", \"」\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"テ\", \"゚\", \"J\", \"*\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \".\", \"C\", \"ウ\", \"2\", \"ア\", \"‥\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"t\", \"!\", \"m\", \"リ\", \"?\", \"L\", \" \", \"ー\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"⑧\", \"A\", \"&\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/ko": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1524839,
"_n_tokens": 919630,
"_n_chars": 655190,
"_n_oov_chars": 1337,
"oov_ratio": 0.002040629435736199,
"_oov_charset": "[\"%\", \"⑥\", \"Ⅳ\", \"㉣\", \"立\", \"|\", \"樂\", \"ㅈ\", \"�\", \"ㅟ\", \"ㅋ\", \"ㅍ\", \"㎡\", \"ㅎ\", \"\", \"ㆍ\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \":\", \"①\", \"ㅜ\", \"ㄹ\", \"\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"\", \"v\", \"識\", \"ㅆ\", \"s\", \"@\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"Ⅰ\", \"ㅅ\", \"⑤\", \"ㄱ\", \"累\", \"樂\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"ㅕ\", \"ㅛ\", \"ㅏ\", \"龍\", \"㉰\", \"Ⅱ\", \"ㅓ\", \"⑨\", \"℃\", \"」\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"ㅐ\", \"⑵\", \"ㅔ\", \"良\", \"ㅚ\", \"*\", \"㎍\", \"理\", \"梁\", \"Ⅲ\", \"陸\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"ㅝ\", \"¹\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"ㅖ\", \"⑦\", \"?\", \"\", \"金\", \"ⅱ\", \"Ⅹ\", \"⑧\", \"ㅊ\", \"女\", \"Ⅵ\", \"ㅢ\"]",
"lossless": false
},
"THUDM/chatglm-6b @ cc100/zh-Hans": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 2633047,
"_n_tokens": 507384,
"_n_chars": 927311,
"_n_oov_chars": 68481,
"oov_ratio": 0.07384901074181154,
"_oov_charset": "[\"%\", \"⑥\", \"⒋\", \"\\b\", \"]\", \"�\", \"\", \"7\", \"8\", \"-\", \"②\", \"⑴\", \",\", \":\", \"①\", \"\", \"…\", \""\", \"_\", \"③\", \"p\", \"・\", \"⑶\", \"n\", \"6\", \"T\", \"⒁\", \"3\", \"/\", \"s\", \"1\", \"⑤\", \"+\", \"9\", \"⒃\", \"5\", \"⒂\", \"a\", \"h\", \"r\", \"④\", \"⑸\", \"0\", \"d\", \" \", \";\", \")\", \"[\", \"⑨\", \"℃\", \" \", \"o\", \"⑩\", \"⒀\", \"D\", \"⑿\", \"(\", \"N\", \".\", \"⑷\", \"C\", \"2\", \"t\", \"\\u0006\", \"!\", \"\\u0005\", \"⑦\", \"\\u0007\", \"?\", \" \", \"V\", \"⒌\", \"e\", \"4\", \"⑧\", \"A\", \"&\", \"i\"]",
"lossless": false
},
"THUDM/chatglm2-6b @ cc100/ar": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 2813283,
"_n_tokens": 1421847,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/de": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1814876,
"_n_tokens": 619757,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/en": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1124813,
"_n_tokens": 269329,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/es": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1664455,
"_n_tokens": 546476,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/fa": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 2054052,
"_n_tokens": 1145051,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/fr": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1540504,
"_n_tokens": 495028,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/ja": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1774770,
"_n_tokens": 581380,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/ko": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1524839,
"_n_tokens": 652156,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm2-6b @ cc100/zh-Hans": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 2633047,
"_n_tokens": 563646,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm3-6b @ cc100/ar": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 2813283,
"_n_tokens": 1421847,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm3-6b @ cc100/de": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1814876,
"_n_tokens": 619822,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"THUDM/chatglm3-6b @ cc100/en": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1124813,
"_n_tokens": 269347,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"THUDM/chatglm3-6b @ cc100/es": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1664455,
"_n_tokens": 546501,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"THUDM/chatglm3-6b @ cc100/fa": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 2054052,
"_n_tokens": 1145051,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm3-6b @ cc100/fr": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1540504,
"_n_tokens": 495052,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"THUDM/chatglm3-6b @ cc100/ja": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1774770,
"_n_tokens": 581380,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"THUDM/chatglm3-6b @ cc100/ko": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1524839,
"_n_tokens": 652160,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"THUDM/chatglm3-6b @ cc100/zh-Hans": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 2633047,
"_n_tokens": 563646,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/ar": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 2813283,
"_n_tokens": 1422070,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/de": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1814876,
"_n_tokens": 528918,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/en": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1124813,
"_n_tokens": 285652,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/es": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1664455,
"_n_tokens": 482553,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/fa": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 2054052,
"_n_tokens": 1145046,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/fr": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1540504,
"_n_tokens": 447372,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/ja": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1774770,
"_n_tokens": 567792,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/ko": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1524839,
"_n_tokens": 793053,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/zh-Hans": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 2633047,
"_n_tokens": 577385,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/ar": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 2813283,
"_n_tokens": 1422073,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/de": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1814876,
"_n_tokens": 529170,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/en": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1124813,
"_n_tokens": 286946,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/es": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1664455,
"_n_tokens": 484099,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/fa": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 2054052,
"_n_tokens": 1145048,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/fr": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1540504,
"_n_tokens": 448567,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/ja": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1774770,
"_n_tokens": 406571,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/ko": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1524839,
"_n_tokens": 484082,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/zh-Hans": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 2633047,
"_n_tokens": 577211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/ar": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/de": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/en": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/es": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/fa": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/fr": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/ja": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/ko": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/zh-Hans": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/ar": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 2813283,
"_n_tokens": 1195640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/de": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1814876,
"_n_tokens": 620541,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/en": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1124813,
"_n_tokens": 288965,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/es": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1664455,
"_n_tokens": 530592,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/fa": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 2054052,
"_n_tokens": 851630,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/fr": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1540504,
"_n_tokens": 509958,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/ja": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1774770,
"_n_tokens": 546876,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/ko": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1524839,
"_n_tokens": 580873,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 2633047,
"_n_tokens": 882018,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/ar": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/de": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/en": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/es": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/fa": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/fr": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/ja": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/ko": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/ar": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/de": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/en": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/es": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/fa": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/fr": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/ja": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/ko": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/ar": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/de": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/en": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/es": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/fa": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/fr": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/ja": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/ko": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"abeja/gpt-neox-japanese-2.7b @ cc100/ar": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 2809195,
"_n_chars": 1560987,
"_n_oov_chars": 1250131,
"oov_ratio": 0.8008593281045903,
"_oov_charset": "[\"﴾\", \"ة\", \"–\", \"ِ\", \"إ\", \"”\", \"«\", \"ن\", \"ـ\", \"\", \"ھ\", \"چ\", \"©\", \"█\", \"\", \"٩\", \"à\", \"ُ\", \"\", \"ρ\", \"ک\", \"ت\", \"؛\", \"↩\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ﻻ\", \"ﻷ\", \"ج\", \"″\", \"
\", \"ف\", \"‘\", \"ص\", \"ﷺ\", \"ۚ\", \"’\", \"â\", \"ع\", \"٪\", \"😊\", \"ٱ\", \"τ\", \"،\", \"٣\", \"۸\", \"س\", \"ۗ\", \"ی\", \"½\", \"ذ\", \"ه\", \"ح\", \"۲\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"﴿\", \"ئ\", \"ْ\", \"ا\", \"Х\", \"ί\", \"ٌ\", \"▪\", \"“\", \"۰\", \"خ\", \"٠\", \"ۖ\", \"ؤ\", \"١\", \"ض\", \"أ\", \"َ\", \"κ\", \"¡\", \"٨\", \"؟\", \"ي\", \"ل\", \"η\", \"•\", \"α\", \"é\", \"ۤ\", \"ﻹ\", \"آ\", \"ظ\", \"🙂\", \"⤴\", \"ء\", \"ب\", \"۷\", \"ή\", \"ٹ\", \"»\", \"ٰ\", \"›\", \"ى\", \"ر\", \"μ\", \"—\", \"غ\", \"‹\", \"٢\", \"ö\", \"٦\", \"\", \"ط\", \"م\", \"پ\", \"ً\", \"χ\", \"ٍ\", \"▫\", \"ّ\", \"♥\", \"ä\", \"و\", \"٧\", \"®\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/de": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 1807780,
"_n_chars": 1784021,
"_n_oov_chars": 26647,
"oov_ratio": 0.01493648337099171,
"_oov_charset": "[\"û\", \"–\", \"è\", \"¤\", \"č\", \"”\", \"«\", \"ė\", \"🙁\", \"\", \"ó\", \"€\", \"©\", \"²\", \"ι\", \"¿\", \"🙄\", \"á\", \"‐\", \"ā\", \"ń\", \"ć\", \"°\", \"à\", \"ρ\", \"\", \"İ\", \"ô\", \"̈\", \"😉\", \"‘\", \"Ü\", \"’\", \"☺\", \"â\", \"Á\", \"τ\", \"♦\", \"Ö\", \"´\", \"\", \"ε\", \"½\", \"ß\", \"š\", \"ç\", \"−\", \"Ø\", \"£\", \"¼\", \"Ä\", \"ί\", \"œ\", \"“\", \"™\", \"≠\", \"ư\", \" \", \"\", \"ï\", \"😃\", \"‽\", \"•\", \"α\", \"➔\", \"é\", \"😈\", \"🙂\", \"„\", \"ü\", \"¬\", \"ớ\", \"😆\", \"»\", \"›\", \"😢\", \"å\", \"\", \"Ã\", \"—\", \"‹\", \"·\", \"¹\", \"É\", \"ö\", \"ς\", \"ø\", \"\", \"😦\", \"Ÿ\", \"😂\", \"\", \"‚\", \"♥\", \"ú\", \"ä\", \"♡\", \"↩\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/en": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 1121413,
"_n_chars": 1121360,
"_n_oov_chars": 1703,
"oov_ratio": 0.0015186915887850467,
"_oov_charset": "[\"»\", \"😉\", \"③\", \"‘\", \"“\", \"\", \"–\", \"è\", \"—\", \"¦\", \"”\", \"‑\", \"«\", \"’\", \"😥\", \"¡\", \"ï\", \"ñ\", \"\", \"\", \"⑦\", \"\", \"•\", \"ó\", \"é\", \"´\", \"⑩\", \"🙂\", \"⑤\", \"⑧\", \"\", \"®\", \"£\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/es": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 1658946,
"_n_chars": 1630297,
"_n_oov_chars": 31423,
"oov_ratio": 0.01927440214881092,
"_oov_charset": "[\"»\", \"▷\", \"✪\", \"Ú\", \"😉\", \"Ñ\", \"‘\", \"М\", \"“\", \"\", \"–\", \"è\", \"—\", \"👏\", \"”\", \"í\", \"―\", \"·\", \"º\", \"«\", \"Ó\", \"’\", \"É\", \"ö\", \"\", \"¡\", \"ñ\", \"ª\", \"️\", \"Á\", \"✖\", \"🙁\", \"ø\", \"•\", \"ó\", \"✓\", \"€\", \"©\", \"é\", \"²\", \"✔\", \"´\", \"😦\", \"¿\", \"🙂\", \"á\", \"ò\", \"°\", \"ý\", \"à\", \"ú\", \"ü\", \"′\", \"👍\", \"\", \"\", \"Í\", \"\", \"®\", \"ô\", \"″\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/fa": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 2036715,
"_n_chars": 1145876,
"_n_oov_chars": 899514,
"oov_ratio": 0.7850011694110008,
"_oov_charset": "[\"۹\", \"ة\", \"–\", \"ۆ\", \"ِ\", \"إ\", \"”\", \"«\", \"ن\", \"ـ\", \"\", \"ھ\", \"چ\", \"©\", \"ב\", \"٩\", \"ُ\", \"\", \"ک\", \"ت\", \"؛\", \"۶\", \"۴\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ج\", \"ט\", \"ف\", \"‘\", \"۔\", \"ژ\", \"\", \"ص\", \"ۀ\", \"ے\", \"’\", \"ڪ\", \"ع\", \"٪\", \"۳\", \"️\", \"،\", \"٣\", \"۸\", \"س\", \"ی\", \"ذ\", \"ه\", \"ح\", \"۲\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"٫\", \"ئ\", \"ْ\", \"ا\", \"ٌ\", \"“\", \"۰\", \"خ\", \"٠\", \"ٴ\", \"ؤ\", \"١\", \"ض\", \"أ\", \"َ\", \"\", \"٨\", \"؟\", \"ل\", \"ي\", \"•\", \"ٔ\", \"آ\", \"ظ\", \"▐\", \"ء\", \"ب\", \"۷\", \"»\", \"›\", \"ى\", \"ر\", \"۵\", \"غ\", \"۱\", \"·\", \"٢\", \"◄\", \"گ\", \"\", \"ּ\", \" \", \"ط\", \"م\", \"پ\", \"ً\", \"✿\", \"ﮧ\", \"ٍ\", \"ّ\", \"♥\", \"و\", \"٧\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/fr": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 1524129,
"_n_chars": 1484970,
"_n_oov_chars": 47360,
"oov_ratio": 0.031892900193269895,
"_oov_charset": "[\"»\", \"Ê\", \"̧\", \"😉\", \"̂\", \"û\", \"♕\", \"
\", \"ù\", \"‘\", \"œ\", \"Ç\", \"“\", \"–\", \"è\", \"ğ\", \"™\", \"♠\", \"—\", \"🤔\", \"Â\", \"”\", \"í\", \"―\", \"·\", \"È\", \"«\", \"’\", \"î\", \"â\", \"É\", \"\", \"ï\", \"ê\", \"℃\", \"ë\", \"•\", \"Î\", \"€\", \"é\", \"²\", \"´\", \"ã\", \"🙂\", \"‐\", \"°\", \"à\", \"Ô\", \"ü\", \"µ\", \"ç\", \"ä\", \"À\", \"\", \"®\", \"ô\", \"́\", \"″\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/ja": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 410803,
"_n_chars": 603065,
"_n_oov_chars": 1588,
"oov_ratio": 0.0026332153250478805,
"_oov_charset": "[\"⑪\", \"–\", \"ハ\", \"◯\", \"”\", \"嶽\", \"😭\", \"«\", \"欝\", \"๑\", \"\", \"💦\", \"ィ\", \"⇔\", \"©\", \"②\", \"‐\", \"😌\", \"①\", \"〝\", \"\", \"〟\", \"龍\", \"̈\", \"″\", \"レ\", \"▷\", \"ゥ\", \"ㅂ\", \"③\", \"゙\", \"〆\", \"頬\", \"・\", \"、\", \"’\", \"\", \"Д\", \"😊\", \"「\", \"ヶ\", \"¥\", \"凛\", \"´\", \"‼\", \"✨\", \"ε\", \"⌒\", \"纒\", \"ω\", \"─\", \"國\", \"−\", \"渕\", \"✧\", \"コ\", \"㎞\", \"́\", \"④\", \" ̄\", \"∇\", \"︎\", \"“\", \"剥\", \"―\", \"〇\", \"Ⅱ\", \"゚\", \"彌\", \"嚥\", \"垠\", \"壬\", \"̀\", \"〉\", \"℃\", \"⻑\", \"」\", \"ヨ\", \"冨\", \"•\", \"ヘ\", \" \", \"メ\", \"⑩\", \"Ⅶ\", \"曰\", \"兎\", \"屓\", \"テ\", \"﨑\", \"゚\", \"∀\", \"ロ\", \"藁\", \"ノ\", \"β\", \"»\", \"😢\", \"◡\", \"堺\", \"嶋\", \"μ\", \"ウ\", \"⇒\", \"ア\", \"—\", \"。\", \"做\", \"🌙\", \"♫\", \"填\", \"※\", \"》\", \"リ\", \"゙\", \"〈\", \" \", \"ー\", \"舘\", \"フ\", \"《\", \"澤\", \"Ⅹ\", \"⑧\", \"و\", \"♡\", \"應\", \"®\", \"カ\", \"叱\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/ko": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 1512832,
"_n_chars": 655190,
"_n_oov_chars": 433188,
"oov_ratio": 0.6611639371785284,
"_oov_charset": "[\"먼\", \"ᴇ\", \"셔\", \"버\", \"증\", \"량\", \"禮\", \"웅\", \"석\", \"옆\", \"깽\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"²\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"댈\", \"녀\", \"남\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"챙\", \"필\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"콘\", \"經\", \"홈\", \"험\", \"분\", \"직\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"콥\", \"≪\", \"쬐\", \"듬\", \"쫓\", \"봄\", \"ㅣ\", \"교\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"육\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"▒\", \"♧\", \"점\", \"똑\", \"說\", \"것\", \"새\", \"곰\", \"룹\", \"🚨\", \"🗺\", \"㎍\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"⇒\", \"틀\", \"藝\", \"봉\", \"왠\", \"섦\", \"겁\", \"낀\", \"혁\", \"판\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"吳\", \"關\", \"롱\", \"얏\", \"팍\", \"힉\", \"댔\", \"眞\", \"쌍\", \"높\", \"쾅\", \"굽\", \"더\", \"줏\", \"보\", \"淨\", \"긍\", \"쌈\", \"폿\", \"닳\", \"닷\", \"젝\", \"겨\", \"€\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"츠\", \"텔\", \"💣\", \"🔹\", \"↔\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"챗\", \"\", \"궜\", \"榮\", \"낳\", \"꺽\", \"맥\", \"「\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"융\", \"國\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"웍\", \"퀸\", \"뀔\", \"면\", \"끄\", \"할\", \"홋\", \"뗀\", \"툼\", \"흐\", \"룩\", \"ㅇ\", \"‧\", \"문\", \"슷\", \"不\", \"왓\", \"·\", \"믹\", \"탐\", \"엎\", \"계\", \"퀘\", \"라\", \"◐\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"맵\", \"킹\", \"광\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"틋\", \"헛\", \"머\", \"②\", \"염\", \"겔\", \"째\", \"밌\", \"콩\", \"♤\", \"쉬\", \"놨\", \"궈\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"\", \"월\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"귤\", \"쏠\", \"릭\", \"헌\", \"🙋\", \"앗\", \"코\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"외\", \"노\", \"쥐\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"℃\", \"삣\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"훼\", \"척\", \"쵸\", \"🍟\", \"ㅙ\", \"재\", \"》\", \"충\", \"왔\", \"떳\", \"떻\", \"채\", \"삘\", \"《\", \"얽\", \"웬\", \"찌\", \"®\", \"➍\", \"주\", \"푸\", \"맺\", \"🏫\", \"찮\", \"템\", \"立\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"◀\", \"펼\", \"◈\", \"휠\", \"류\", \"냐\", \"©\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"잇\", \"뇌\", \"獻\", \"拜\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"▣\", \"칼\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"ㄱ\", \"닮\", \"俠\", \"♀\", \"싼\", \"동\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"춰\", \"뇨\", \"훔\", \"차\", \"•\", \"ⅳ\", \"꾀\", \"갇\", \"챨\", \"돼\", \"네\", \"헤\", \"團\", \"껑\", \"샹\", \"퀵\", \"푹\", \"μ\", \"튀\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"ⓒ\", \"렇\", \"ㅝ\", \"테\", \"※\", \"핍\", \"헨\", \"창\", \"🍔\", \"곳\", \"포\", \"걱\", \"發\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"譯\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"궐\", \"릉\", \"힜\", \"氣\", \"퓰\", \"쳤\", \"꿈\", \"ã\", \"술\", \"꼭\", \"⑴\", \"향\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"⑶\", \"뻤\", \"땐\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"투\", \"ᴍ\", \"Ⅰ\", \"응\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"깨\", \"잘\", \"롤\", \"화\", \"넵\", \"賣\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"캘\", \"폰\", \"곤\", \"개\", \"윗\", \"壽\", \"ʏ\", \"축\", \"듀\", \"봅\", \"獨\", \"◦\", \"밟\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"협\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"💦\", \"올\", \"취\", \"켰\", \"틱\", \"”\", \"흰\", \"≤\", \"민\", \"쌀\", \"흗\", \"예\", \"濟\", \"밍\", \"캉\", \"넛\", \"돗\", \"숏\", \"ⓔ\", \"걀\", \"득\", \"🌵\", \"밭\", \"팠\", \"쁜\", \"륜\", \"균\", \"💕\", \"덜\", \"쪄\", \"️\", \"🤗\", \"對\", \"긋\", \"력\", \"ㅅ\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"⑸\", \"🍰\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"헬\", \"졸\", \"엣\", \"칠\", \"曰\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"넥\", \"냥\", \"—\", \"젠\", \"뻑\", \"닙\", \"탱\", \"뜩\", \"씩\", \"있\", \"믐\", \"들\", \"켄\", \"았\", \"뮐\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"♥\", \"잔\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"㎡\", \"ㅎ\", \"빅\", \"쿨\", \"뒷\", \"ⅰ\", \"쨍\", \"🙆\", \"쾨\", \"침\", \"🚿\", \"요\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"ㄴ\", \"윤\", \"짧\", \"년\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"얍\", \"🏻\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"듣\", \"찔\", \"켓\", \"열\", \"즌\", \"태\", \"樂\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"습\", \"럭\", \"랙\", \"길\", \"탬\", \"잤\", \"α\", \" \", \"줌\", \"딱\", \"장\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"과\", \"꿕\", \"였\", \"위\", \"숙\", \"⊙\", \"ⅲ\", \"횡\", \"쎄\", \"둡\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"雙\", \"넘\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"관\", \"뜻\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"촌\", \"뮌\", \"빌\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"ㄹ\", \"꼬\", \"龍\", \"핏\", \"德\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"쒀\", \"공\", \"🙇\", \"토\", \"臺\", \"죄\", \"골\", \"쁘\", \"빔\", \"뾱\", \"ç\", \"준\", \"슴\", \"쩍\", \"얄\", \"퓨\", \"④\", \"뚝\", \"킥\", \"벽\", \"➋\", \"데\", \"價\", \"璿\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"짱\", \"펙\", \"댁\", \"슬\", \"쁨\", \"曆\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"靑\", \"내\", \"陸\", \"줍\", \"會\", \"톱\", \"온\", \"▶\", \"將\", \"킁\", \"을\", \"😂\", \"ⅱ\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"끔\", \"뀐\", \"덟\", \"합\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"🍭\", \"펠\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"덧\", \"띈\", \"혈\", \"썅\", \"①\", \"훠\", \"탄\", \"두\", \"꽂\", \"쏘\", \"궁\", \"‘\", \"팽\", \"톡\", \"🦄\", \"져\", \"實\", \"칫\", \"돈\", \"탕\", \"삶\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"學\", \"쓴\", \"벳\", \"틈\", \"빕\", \"옷\", \"👍\", \"턴\", \"❍\", \"폼\", \"∙\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"멋\", \"삿\", \"틔\", \"✈\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"썹\", \"➏\", \"»\", \"놈\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"敎\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"좌\", \"쿠\", \"떠\", \"└\", \"낮\", \"굉\", \"터\", \"🤟\", \"닥\", \"략\", \"딸\", \"ɪ\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"歲\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"劍\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"툴\", \"램\", \"앎\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"찢\", \"뺀\", \"瀧\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"에\", \"좋\", \"벤\", \"뚜\", \"택\", \"운\", \"뛸\", \"얼\", \"벙\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"體\", \"고\", \"했\", \"퍽\", \"뮬\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"켜\", \"꽝\", \"😱\", \"왜\", \"③\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"깡\", \"숍\", \"컵\", \"얻\", \"닐\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"戊\", \"옮\", \"펩\", \"맑\", \"ω\", \"혀\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"캣\", \"鎭\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"쯔\", \"壞\", \"결\", \"엇\", \"›\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"黃\", \"표\", \"몹\", \"\", \"담\", \"뽑\", \"✔\", \"희\", \"픽\", \"랫\", \"생\", \"확\", \"번\", \"Ⅹ\", \"며\", \"힌\", \"⑧\", \"♡\", \"應\", \"텝\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"킬\", \"씽\", \"😭\", \"맬\", \"기\", \"팡\", \"핥\", \"ㆍ\", \"및\", \"맨\", \"큰\", \"륨\", \"훈\", \"렛\", \"펑\", \"효\", \"∮\", \"볕\", \"흙\", \"각\", \"체\", \"링\", \"參\", \"벼\", \"륵\", \"專\", \"콰\", \"槪\", \"꿰\", \"탑\", \"觸\", \"빤\", \"타\", \"국\", \"變\", \"많\", \"渴\", \"卽\", \"낸\", \"☀\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"齋\", \"샴\", \"쫑\", \"읽\", \"앞\", \"늬\", \"츈\", \"픈\", \"―\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"ᴛ\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"히\", \"씌\", \"욜\", \"풀\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"샬\", \"덤\", \"멍\", \"튄\", \"∼\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"⑹\", \"곁\", \"±\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"멘\", \"👏\", \"감\", \"識\", \"텨\", \"😊\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"모\", \"빴\", \"켈\", \"릿\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"럿\", \"엽\", \"숟\", \"브\", \"內\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"쿵\", \"\", \"췄\", \"藥\", \"질\", \"햇\", \"춘\", \"쿼\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"〈\", \"홍\", \"시\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"⋅\", \"껴\", \"곱\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"료\", \"형\", \"뮤\", \"랐\", \"족\", \"울\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"닌\", \"累\", \"후\", \"늑\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"웨\", \"휙\", \"당\", \"」\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"푼\", \"假\", \"워\", \"💰\", \"싯\", \"먹\", \"🍞\", \"굴\", \"뭔\", \"핑\", \"받\", \"찍\", \"숲\", \"피\", \"듐\", \"¹\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"☎\", \"가\", \"널\", \"콤\", \"≫\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"⑥\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"😣\", \"정\", \"꼴\", \"쭙\", \"–\", \"떴\", \"☞\", \"규\", \"군\", \"줬\", \"樂\", \"앱\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"°\", \"루\", \"ㅞ\", \"뻐\", \"′\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"밤\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"❏\", \"잼\", \"쭈\", \"컸\", \"쫄\", \"몸\", \"“\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"\", \"란\", \"⑨\", \"몽\", \"넓\", \"〉\", \"혐\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"💅\", \"됬\", \"멀\", \"든\", \"⑦\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"유\", \"서\", \"누\", \"삐\", \"쿰\", \"된\", \"처\", \"♣\", \"💥\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"數\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"’\", \"휩\", \"훑\", \"황\", \"역\", \"웠\", \"셰\", \"렬\", \"눕\", \"⑤\", \"씻\", \"익\", \"찼\", \"얇\", \"팀\", \"£\", \"펄\", \"뷔\", \"진\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"룸\", \"뉴\", \"괌\", \"팔\", \"샐\", \"독\", \"꿍\", \"춥\", \"㉿\", \"얹\", \"자\", \"끼\", \"땠\", \"ㅐ\", \"⑵\", \"린\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"뿜\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"뎅\", \"넨\", \"ʟ\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/zh-Hans": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1049033,
"_n_chars": 927311,
"_n_oov_chars": 165802,
"oov_ratio": 0.17879869860273415,
"_oov_charset": "[\"调\", \"饶\", \"痫\", \"瘠\", \"缝\", \"讥\", \"篢\", \"玛\", \"饿\", \"逑\", \"黩\", \"俭\", \"沧\", \"旆\", \"榭\", \"场\", \"曾\", \"挈\", \"诶\", \"岖\", \"份\", \"荣\", \"鲍\", \"逊\", \"睿\", \"籽\", \"揽\", \"划\", \"娇\", \"醋\", \"诱\", \"馏\", \"唬\", \"轩\", \"浞\", \"桥\", \"泽\", \"捍\", \"皱\", \"压\", \"闸\", \"饰\", \"喔\", \"\", \"睐\", \"虽\", \"闫\", \"钞\", \"饮\", \"缔\", \"卤\", \"涤\", \"坚\", \"纬\", \"毙\", \"钦\", \"蜡\", \"疙\", \"欸\", \"卷\", \"夺\", \"鸩\", \"歉\", \"挲\", \"涮\", \"赖\", \"找\", \"赢\", \"饽\", \"冰\", \"值\", \"筷\", \"嵘\", \"熄\", \"仓\", \"韧\", \"轶\", \"够\", \"秆\", \"浇\", \"赠\", \"层\", \"溃\", \"谴\", \"谛\", \"溯\", \"轨\", \"脯\", \"剧\", \"乔\", \"孽\", \"渲\", \"晾\", \"哒\", \"恺\", \"绚\", \"总\", \"萦\", \"厌\", \"玫\", \"睬\", \"谐\", \"阶\", \"佝\", \"伦\", \"询\", \"瘾\", \"忑\", \"财\", \"垛\", \"酿\", \"伤\", \"郜\", \"眨\", \"皈\", \"谢\", \"栏\", \"铩\", \"飙\", \"焊\", \"颓\", \"懵\", \"俩\", \"畴\", \"炖\", \"诠\", \"挪\", \"础\", \"远\", \"掺\", \"谧\", \"怕\", \"萧\", \"吞\", \"戍\", \"嘛\", \"臊\", \"逛\", \"鉴\", \"冯\", \"钢\", \"锄\", \"辽\", \"驳\", \"读\", \"剩\", \"栈\", \"簇\", \"针\", \"溉\", \"颜\", \"抢\", \"抖\", \"浊\", \"烊\", \"亿\", \"义\", \"缚\", \"胳\", \"髓\", \"岣\", \"笨\", \"\", \"鹭\", \"侦\", \"赎\", \"旖\", \"荨\", \"曦\", \"呗\", \"侬\", \"桦\", \"锋\", \"兴\", \"舰\", \"祛\", \"嫖\", \"睁\", \"疗\", \"盏\", \"茧\", \"枪\", \"叼\", \"渊\", \"嗪\", \"蓟\", \"呕\", \"开\", \"犷\", \"楞\", \"传\", \"稳\", \"册\", \"险\", \"训\", \"车\", \"毕\", \"邋\", \"涌\", \"馒\", \"吩\", \"瘙\", \"撷\", \"·\", \"扎\", \"衔\", \"裆\", \"韦\", \"扳\", \"呐\", \"挖\", \"佛\", \"傻\", \"窜\", \"买\", \"辐\", \"啬\", \"搅\", \"茏\", \"收\", \"耸\", \"炅\", \"铛\", \"钩\", \"显\", \"噢\", \"憋\", \"泻\", \"润\", \"倏\", \"嗓\", \"②\", \"韫\", \"赚\", \"售\", \"臻\", \"贡\", \"袒\", \"阵\", \"镭\", \"擎\", \"犟\", \"队\", \"ὐ\", \"废\", \"婪\", \"泾\", \"肤\", \"荤\", \"驻\", \"忡\", \"壑\", \"薯\", \"挠\", \"柬\", \"碱\", \"屣\", \"宪\", \"绥\", \"咱\", \"蚪\", \"砍\", \"费\", \"锚\", \"巢\", \"π\", \"擞\", \"篮\", \"晖\", \"构\", \"抡\", \"挥\", \"嚎\", \"橱\", \"丐\", \"炕\", \"效\", \"耍\", \"绅\", \"辙\", \"淖\", \"妈\", \"℃\", \"饷\", \"猬\", \"尘\", \"谩\", \"ě\", \"鹃\", \"棵\", \"脸\", \"撑\", \"柜\", \"涡\", \"姆\", \"袭\", \"扭\", \"啡\", \"帐\", \"辫\", \"帜\", \"颈\", \"晚\", \"坟\", \"饨\", \"济\", \"渎\", \"懒\", \"ς\", \"储\", \"填\", \"瑨\", \"杂\", \"》\", \"胶\", \"《\", \"逻\", \"缠\", \"鹕\", \"默\", \"诞\", \"恶\", \"馆\", \"婶\", \"帕\", \"挤\", \"轻\", \"稻\", \"诅\", \"县\", \"惩\", \"铲\", \"狈\", \"脖\", \"连\", \"绎\", \"页\", \"篡\", \"姊\", \"郴\", \"钻\", \"憨\", \"澜\", \"遴\", \"铝\", \"聆\", \"圾\", \"©\", \"á\", \"肃\", \"倾\", \"氰\", \"绒\", \"拜\", \"扪\", \"缜\", \"韵\", \"鲱\", \"忧\", \"蚂\", \"赂\", \"厕\", \"\", \"纱\", \"熬\", \"捡\", \"龚\", \"叹\", \"饵\", \"惘\", \"阽\", \"绸\", \"躲\", \"顺\", \"挎\", \"弹\", \"撇\", \"带\", \"忐\", \"鲨\", \"墒\", \"纪\", \"赡\", \"罩\", \"韪\", \"缩\", \"聪\", \"瓣\", \"贸\", \"删\", \"嘈\", \"馋\", \"瓜\", \"庞\", \"驰\", \"饼\", \"•\", \"祢\", \"岔\", \"绽\", \"黯\", \"饱\", \"斌\", \"势\", \"骛\", \"〖\", \"拎\", \"这\", \"锻\", \"娱\", \"诚\", \"栋\", \"质\", \"缮\", \"硕\", \"奖\", \"腊\", \"讼\", \"藐\", \"价\", \"\", \"涂\", \"※\", \"垃\", \"鼯\", \"矗\", \"涉\", \"渗\", \"凿\", \"泸\", \"厢\", \"牠\", \"發\", \"荆\", \"啦\", \"敌\", \"瑄\", \"聋\", \"泵\", \"牖\", \"罐\", \"樯\", \"军\", \"骄\", \"脑\", \"喂\", \"宾\", \"赔\", \"鹤\", \"贫\", \"嘟\", \"蜿\", \"盎\", \"芜\", \"衬\", \"⑴\", \"攥\", \"霉\", \"〝\", \"绪\", \"让\", \"贝\", \"贬\", \"苹\", \"烧\", \"闵\", \"⑶\", \"熙\", \"峭\", \"艰\", \"讪\", \"单\", \"璎\", \"瓷\", \"狠\", \"啃\", \"烟\", \"瑢\", \"挡\", \"涣\", \"侥\", \"凑\", \"缺\", \"败\", \"墉\", \"遗\", \"拦\", \"尝\", \"椭\", \"鹅\", \"耙\", \"瑒\", \"职\", \"恳\", \"旳\", \"晤\", \"呃\", \"舔\", \"邬\", \"项\", \"碎\", \"孙\", \"兑\", \"豫\", \"慑\", \"袜\", \"拂\", \"赅\", \"賣\", \"逾\", \"闯\", \"拯\", \"咚\", \"羁\", \"捞\", \"帅\", \"赏\", \"轴\", \"仿\", \"榄\", \"阱\", \"莺\", \"纹\", \"飞\", \"朵\", \"权\", \"签\", \"陡\", \"喷\", \"垮\", \"镉\", \"畅\", \"暨\", \"业\", \"滨\", \"侧\", \"赁\", \"币\", \"产\", \"肠\", \"铁\", \"瞩\", \"嘤\", \"寻\", \"谑\", \"颁\", \"睑\", \"掂\", \"晕\", \"啐\", \"减\", \"凳\", \"岭\", \"驼\", \"哎\", \"鸥\", \"龟\", \"块\", \"厮\", \"姣\", \"您\", \"醉\", \"备\", \"响\", \"竭\", \"琐\", \"办\", \"榷\", \"岚\", \"”\", \"巩\", \"爰\", \"谣\", \"匾\", \"惶\", \"湮\", \"掰\", \"佟\", \"阎\", \"楣\", \"凯\", \"笼\", \"书\", \"卫\", \"锂\", \"诃\", \"蓁\", \"甯\", \"离\", \"跷\", \"亟\", \"极\", \"偌\", \"踱\", \"戾\", \"掀\", \"狳\", \"霏\", \"灭\", \"宁\", \"捂\", \"喱\", \"τ\", \"铨\", \"凛\", \"拨\", \"吵\", \"哟\", \"骏\", \"啪\", \"鲤\", \"剂\", \"杆\", \"瞟\", \"Ø\", \"⑸\", \"宫\", \"择\", \"插\", \"淅\", \"绕\", \"斋\", \"揭\", \"鹜\", \"伫\", \"惊\", \"戳\", \"拔\", \"虑\", \"伙\", \"讶\", \"撸\", \"丢\", \"终\", \"舱\", \"湄\", \"躺\", \"摆\", \"岛\", \"曰\", \"严\", \"熏\", \"呜\", \"护\", \"丽\", \"钓\", \"狱\", \"咒\", \"裤\", \"挣\", \"—\", \"键\", \"骆\", \"眯\", \"馁\", \"蜒\", \"骗\", \"粮\", \"乘\", \"奋\", \"辩\", \"瞒\", \"顽\", \"骅\", \"霸\", \"轮\", \"甩\", \"氛\", \"创\", \"岗\", \"嘎\", \"嘣\", \"渍\", \"么\", \"递\", \"搡\", \"怔\", \"鳗\", \"莴\", \"\", \"萝\", \"浑\", \"盐\", \"绍\", \"脐\", \"欢\", \"剔\", \"锁\", \"协\", \"狰\", \"辖\", \"贿\", \"贮\", \"锥\", \"颌\", \"赋\", \"蓝\", \"擘\", \"钥\", \"咕\", \"氮\", \"焰\", \"结\", \"峥\", \"夸\", \"鸟\", \"苍\", \"亵\", \"爹\", \"兹\", \"屄\", \"粼\", \"舆\", \"骼\", \"损\", \"丰\", \"谚\", \"藕\", \"沏\", \"谬\", \"柠\", \"继\", \"决\", \"释\", \"溅\", \"癫\", \"习\", \"浓\", \"垠\", \"叠\", \"絮\", \"谱\", \"锢\", \"擀\", \"碰\", \"妒\", \"α\", \"扣\", \"惫\", \"彻\", \" \", \"笔\", \"酱\", \"肾\", \"艺\", \"檐\", \"桌\", \"辅\", \"佣\", \"淌\", \"计\", \"撩\", \"刘\", \"挝\", \"趁\", \"聒\", \"⑷\", \"捅\", \"耩\", \"坯\", \"惭\", \"绞\", \"诫\", \"啤\", \"订\", \"伞\", \"劑\", \"莲\", \"拟\", \"蹩\", \"涟\", \"壓\", \"赐\", \"舍\", \"诊\", \"跤\", \"蝇\", \"邹\", \"暄\", \"咯\", \"沟\", \"咙\", \"圈\", \"沾\", \"浆\", \"秸\", \"热\", \"资\", \"铂\", \"唠\", \"哪\", \"灵\", \"贴\", \"仅\", \"嗲\", \"鸠\", \"尴\", \"\", \"晗\", \"觉\", \"抨\", \"筹\", \"估\", \"缥\", \"矶\", \"讨\", \"蚀\", \"谦\", \"栾\", \"喆\", \"兰\", \"闷\", \"德\", \"霾\", \"弃\", \"闾\", \"菇\", \"贾\", \"悬\", \"秽\", \"姗\", \"扑\", \"每\", \"咐\", \"过\", \"毗\", \"厂\", \"娄\", \"璇\", \"荧\", \"镐\", \"暧\", \"纸\", \"骤\", \"匀\", \"⒃\", \"怵\", \"戏\", \"ç\", \"埂\", \"苯\", \"诬\", \"砾\", \"剑\", \"驾\", \"啕\", \"④\", \"瘫\", \"组\", \"缉\", \"惯\", \"扛\", \"價\", \"權\", \"览\", \"澡\", \"芷\", \"胫\", \"灶\", \"盘\", \"诩\", \"盯\", \"拧\", \"滤\", \"镶\", \"庆\", \"膛\", \"虾\", \"讯\", \"搐\", \"访\", \"绛\", \"肮\", \"盹\", \"疯\", \"谎\", \"铃\", \"踹\", \"喻\", \"镀\", \"辉\", \"垒\", \"虏\", \"迟\", \"妆\", \"皂\", \"轼\", \"潦\", \"狞\", \"娴\", \"偎\", \"懑\", \"蚌\", \"浏\", \"吱\", \"杀\", \"涝\", \"⒋\", \"搀\", \"蹿\", \"胖\", \"钉\", \"颇\", \"摧\", \"齿\", \"筛\", \"监\", \"恼\", \"\", \"绊\", \"议\", \"娅\", \"摔\", \"汩\", \"识\", \"①\", \"贷\", \"骁\", \"圣\", \"胺\", \"摄\", \"‘\", \"撕\", \"黢\", \"纯\", \"联\", \"违\", \"陕\", \"乌\", \"窥\", \"谓\", \"忪\", \"嗔\", \"壹\", \"紧\", \"亚\", \"烷\", \"凉\", \"帘\", \"嗦\", \"哼\", \"题\", \"验\", \"关\", \"瞧\", \"冲\", \"铤\", \"腻\", \"滩\", \"遛\", \"耦\", \"玮\", \"澈\", \"噼\", \"旎\", \"凤\", \"赘\", \"噬\", \"倜\", \"蔷\", \"窦\", \"忆\", \"锦\", \"簧\", \"嗨\", \"锣\", \"铣\", \"覃\", \"恿\", \"滚\", \"汉\", \"贪\", \"遑\", \"匮\", \"宠\", \"悚\", \"»\", \"误\", \"卖\", \"棂\", \"迤\", \"拖\", \"鹑\", \"锤\", \"戛\", \"陨\", \"竞\", \"谈\", \"缭\", \"榆\", \"猡\", \"冈\", \"锏\", \"氨\", \"汹\", \"尬\", \"绷\", \"尧\", \"吴\", \"蔼\", \"诀\", \"赣\", \"踩\", \"漩\", \"临\", \"酝\", \"圩\", \"优\", \"啸\", \"耻\", \"ù\", \"魇\", \"钱\", \"龇\", \"卢\", \"记\", \"鸽\", \"î\", \"毁\", \"唷\", \"瘩\", \"摇\", \"據\", \"搜\", \"噩\", \"啥\", \"乡\", \"标\", \"谨\", \"哑\", \"蛔\", \"阳\", \"缈\", \"团\", \"级\", \"见\", \"吊\", \"嘀\", \"扯\", \"载\", \"试\", \"树\", \"囤\", \"丧\", \"・\", \"倨\", \"吆\", \"灾\", \"妞\", \"夯\", \"颖\", \"译\", \"筝\", \"铮\", \"驱\", \"净\", \"帮\", \"阑\", \"郸\", \"跑\", \"诣\", \"煲\", \"穗\", \"你\", \"蕴\", \"户\", \"霭\", \"选\", \"态\", \"罄\", \"玷\", \"馕\", \"鳞\", \"荟\", \"荡\", \"姬\", \"扩\", \"跃\", \"锈\", \"郑\", \"墅\", \"许\", \"妇\", \"贱\", \"岌\", \"纷\", \"汤\", \"搞\", \"导\", \"偻\", \"⒀\", \"剁\", \"陆\", \"盼\", \"榨\", \"鳃\", \"佬\", \"钵\", \"认\", \"销\", \"约\", \"负\", \"讳\", \"桅\", \"增\", \"竖\", \"撬\", \"劝\", \"臃\", \"术\", \"爸\", \"辆\", \"秃\", \"羡\", \"罚\", \"粱\", \"倘\", \"鸣\", \"拢\", \"坝\", \"惦\", \"唏\", \"绝\", \"桩\", \"扰\", \"环\", \"沦\", \"裹\", \"阂\", \"茁\", \"叨\", \"辑\", \"绳\", \"鹈\", \"穰\", \"给\", \"趟\", \"缴\", \"烦\", \"镳\", \"烁\", \"讲\", \"赵\", \"猎\", \"兢\", \"③\", \"颉\", \"囊\", \"圜\", \"确\", \"怀\", \"壤\", \"镏\", \"牺\", \"蒂\", \"硅\", \"犄\", \"趋\", \"沪\", \"勋\", \"拣\", \"痪\", \"铎\", \"须\", \"厉\", \"笃\", \"藏\", \"墙\", \"夹\", \"艋\", \"纺\", \"钰\", \"咧\", \"蜕\", \"瘦\", \"别\", \"哗\", \"歧\", \"鲎\", \"汛\", \"贯\", \"杰\", \"嗯\", \"邻\", \"检\", \"歼\", \"卧\", \"雏\", \"惴\", \"锲\", \"则\", \"录\", \"顿\", \"屌\", \"狮\", \"纠\", \"谆\", \"颗\", \"惮\", \"击\", \"轿\", \"蛊\", \"礴\", \"屉\", \"蹦\", \"碟\", \"〗\", \"ㄓ\", \"遢\", \"泠\", \"详\", \"银\", \"处\", \"琼\", \"靓\", \"嗡\", \"颠\", \"肿\", \"璨\", \"迩\", \"⑧\", \"规\", \"垫\", \"馍\", \"肓\", \"账\", \"综\", \"勖\", \"翱\", \"馅\", \"哧\", \"孀\", \"仆\", \"猝\", \"媳\", \"渐\", \"奂\", \"缪\", \"隶\", \"醛\", \"编\", \"咏\", \"鹉\", \"运\", \"劲\", \"鸦\", \"坷\", \"羔\", \"查\", \"婺\", \"获\", \"诗\", \"乓\", \"苒\", \"沉\", \"赃\", \"蚁\", \"俪\", \"娛\", \"瞅\", \"贵\", \"號\", \"觑\", \"辄\", \"莘\", \"钧\", \"亂\", \"谅\", \"坞\", \"胜\", \"归\", \"疴\", \"绑\", \"缘\", \"壳\", \"扬\", \"渴\", \"晓\", \"炼\", \"敝\", \"莅\", \"鹰\", \"叮\", \"碳\", \"雳\", \"洁\", \"蹭\", \"鬓\", \"褂\", \"抠\", \"剐\", \"诉\", \"夭\", \"购\", \"宽\", \"缀\", \"诙\", \"祸\", \"梦\", \"―\", \"踢\", \"籁\", \"槛\", \"预\", \"缕\", \"绩\", \"ê\", \"纰\", \"骂\", \"锡\", \"掐\", \"颧\", \"链\", \"阅\", \"„\", \"迹\", \"图\", \"亲\", \"觅\", \"聂\", \"抿\", \"毋\", \"颊\", \"粹\", \"趴\", \"耀\", \"荫\", \"馄\", \"踌\", \"铸\", \"艳\", \"樱\", \"瑧\", \"苇\", \"纽\", \"饥\", \"赌\", \"馈\", \"鸭\", \"咦\", \"报\", \"库\", \"捆\", \"黏\", \"绣\", \"滥\", \"鲁\", \"烯\", \"绿\", \"旷\", \"讦\", \"ό\", \"纨\", \"炝\", \"慷\", \"莓\", \"缅\", \"绘\", \"枣\", \"皑\", \"观\", \"锅\", \"评\", \"贺\", \"顾\", \"众\", \"脉\", \"哥\", \"节\", \"启\", \"塌\", \"网\", \"烂\", \"颐\", \"胧\", \"厝\", \"坛\", \"摹\", \"匆\", \"磅\", \"鲸\", \"颤\", \"惋\", \"穷\", \"à\", \"轰\", \"续\", \"窗\", \"偿\", \"骇\", \"溪\", \"错\", \"镍\", \"刨\", \"跚\", \"氯\", \"湃\", \"斩\", \"蹒\", \"诡\", \"骚\", \"陈\", \"媲\", \"论\", \"飕\", \"鹦\", \"垄\", \"搁\", \"脏\", \"执\", \"时\", \"沥\", \"视\", \"掷\", \"贤\", \"厅\", \"呸\", \" \", \"辕\", \"腭\", \"烬\", \"噱\", \"懂\", \"拥\", \"渔\", \"睹\", \"档\", \"〞\", \"缆\", \"劳\", \"边\", \"辗\", \"內\", \"⑩\", \"螃\", \"张\", \"亏\", \"阁\", \"霈\", \"谔\", \"俞\", \"焕\", \"齐\", \"歹\", \"铭\", \"鲜\", \"诧\", \"钊\", \"风\", \"瘀\", \"玳\", \"测\", \"睽\", \"愤\", \"钜\", \"际\", \"锒\", \"牵\", \"还\", \"窝\", \"镕\", \"〈\", \"咔\", \"萤\", \"寐\", \"闪\", \"潢\", \"璀\", \"陇\", \"胀\", \"鱼\", \"唉\", \"亩\", \"讷\", \"侨\", \"黧\", \"饭\", \"鸿\", \"珏\", \"钝\", \"诟\", \"瞪\", \"绵\", \"丝\", \"鳌\", \"麽\", \"哦\", \"烘\", \"闹\", \"砖\", \"钮\", \"难\", \"顶\", \"钟\", \"举\", \"雯\", \"缄\", \"驶\", \"缸\", \"摊\", \"瞄\", \"巅\", \"镇\", \"犰\", \"偷\", \"涩\", \"衅\", \"织\", \"仪\", \"闻\", \"庙\", \"梭\", \"频\", \"尔\", \"软\", \"靛\", \"迈\", \"稣\", \"漪\", \"擤\", \"圆\", \"崽\", \"阴\", \"驴\", \"飚\", \"磕\", \"潇\", \"伟\", \"贞\", \"锐\", \"赞\", \"证\", \"怂\", \"篱\", \"练\", \"鹌\", \"讽\", \"雾\", \"谍\", \"撅\", \"摞\", \"烫\", \"涨\", \"课\", \"吕\", \"假\", \"唤\", \"拽\", \"个\", \"仑\", \"孪\", \"飓\", \"芃\", \"庐\", \"赶\", \"骑\", \"萨\", \"犹\", \"阐\", \"杨\", \"做\", \"薰\", \"伉\", \"韩\", \"磺\", \"丛\", \"腾\", \" \", \"嘭\", \"寰\", \"听\", \"怎\", \"驿\", \"氧\", \"蓦\", \"⑥\", \"闭\", \"步\", \"搂\", \"纤\", \"审\", \"–\", \"揪\", \"敛\", \"吭\", \"毡\", \"嚷\", \"戢\", \"诵\", \"责\", \"绰\", \"兽\", \"阔\", \"线\", \"呦\", \"°\", \"胰\", \"镑\", \"驮\", \"货\", \"茵\", \"\", \"满\", \"咪\", \"丫\", \"谀\", \"吮\", \"⒁\", \"债\", \"绉\", \"两\", \"弈\", \"瞎\", \"锯\", \"窿\", \"转\", \"谋\", \"鸡\", \"彤\", \"侣\", \"扔\", \"蕤\", \"况\", \"吓\", \"嚣\", \"⒂\", \"─\", \"纳\", \"辈\", \"专\", \"词\", \"愿\", \"历\", \"颂\", \"灿\", \"痊\", \"▪\", \"“\", \"胁\", \"悯\", \"纾\", \"焯\", \"剥\", \"裳\", \"从\", \"扫\", \"喽\", \"疮\", \"烛\", \"⑨\", \"呛\", \"〉\", \"莹\", \"當\", \"飘\", \"扒\", \"倡\", \"药\", \"掳\", \"邓\", \"纵\", \"诈\", \"愣\", \"污\", \"嘻\", \"镜\", \"龄\", \"翕\", \"逶\", \"粪\", \"疤\", \"输\", \"砸\", \"泱\", \"缓\", \"傥\", \"儿\", \"滢\", \"刚\", \"迁\", \"靶\", \"篓\", \"铜\", \"楂\", \"俏\", \"⑦\", \"棱\", \"犁\", \"窍\", \"⒌\", \"诨\", \"摒\", \"癜\", \"嘿\", \"冻\", \"浠\", \"抚\", \"撐\", \"抬\", \"另\", \"俨\", \"领\", \"瑥\", \"膊\", \"孱\", \"贼\", \"煞\", \"养\", \"马\", \"笆\", \"贩\", \"氢\", \"痹\", \"眶\", \"额\", \"较\", \"矿\", \"坠\", \"攒\", \"篷\", \"崛\", \"积\", \"佘\", \"锌\", \"姐\", \"惠\", \"’\", \"汇\", \"韬\", \"濒\", \"俱\", \"罢\", \"蘸\", \"烃\", \"栅\", \"婴\", \"泪\", \"⑤\", \"师\", \"诸\", \"岂\", \"适\", \"驭\", \"阀\", \"侄\", \"伪\", \"补\", \"谭\", \"诲\", \"壶\", \"惬\", \"达\", \"婊\", \"蝌\", \"惕\", \"谊\", \"卻\", \"洼\", \"谁\", \"铄\", \"挚\", \"黑\", \"农\", \"异\", \"é\", \"矫\", \"陷\", \"细\", \"碴\", \"屿\", \"纲\", \"盖\", \"桢\", \"营\", \"蘑\", \"蟑\", \"闲\", \"跻\", \"⑿\", \"笋\", \"哇\", \"ο\", \"铺\", \"翘\", \"瑑\", \"红\", \"强\", \"∶\", \"吨\", \"乒\", \"辨\", \"饲\", \"隐\", \"揍\", \"换\", \"荐\", \"闺\", \"邮\", \"泼\", \"岁\", \"鹏\", \"暂\", \"甬\", \"烤\", \"谜\", \"舀\", \"顷\"]",
"lossless": false
},
"ai21labs/Jamba-v0.1 @ cc100/ar": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 2813283,
"_n_tokens": 717886,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/de": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1814876,
"_n_tokens": 525856,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/en": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1124813,
"_n_tokens": 264242,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/es": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1664455,
"_n_tokens": 410883,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/fa": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 2054052,
"_n_tokens": 722550,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/fr": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1540504,
"_n_tokens": 402899,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/ja": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1774770,
"_n_tokens": 673256,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/ko": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1524839,
"_n_tokens": 705688,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ai21labs/Jamba-v0.1 @ cc100/zh-Hans": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 2633047,
"_n_tokens": 1057054,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"allenai/OLMo-7B @ cc100/ar": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2813283,
"_n_tokens": 1106277,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/de": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1814876,
"_n_tokens": 583628,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/en": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1124813,
"_n_tokens": 259357,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/es": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1664455,
"_n_tokens": 494577,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/fa": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2054052,
"_n_tokens": 866434,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/fr": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1540504,
"_n_tokens": 458961,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/ja": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1774770,
"_n_tokens": 605168,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/ko": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1524839,
"_n_tokens": 973288,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"靈\", \"不\", \"良\", \"女\", \"樂\", \"識\", \"樂\", \"流\", \"理\", \"金\", \"梁\", \"陸\", \"立\", \"龍\", \"累\"]",
"lossless": false
},
"allenai/OLMo-7B @ cc100/zh-Hans": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2633047,
"_n_tokens": 1220529,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/ar": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 373371,
"_n_chars": 1560987,
"_n_oov_chars": 70253,
"oov_ratio": 0.04500549972549419,
"_oov_charset": "[\"A\", \"ٰ\", \"N\", \"P\", \"ْ\", \"
\", \"Х\", \"ί\", \"ٌ\", \"H\", \"ِ\", \"U\", \"إ\", \"G\", \"ۚ\", \"R\", \"ؤ\", \"Y\", \"ۖ\", \"Q\", \"أ\", \"َ\", \"â\", \"�\", \"ö\", \"I\", \"V\", \"J\", \"\", \"K\", \"\", \"B\", \"E\", \"é\", \"Z\", \"C\", \"\", \"ۤ\", \"آ\", \"T\", \"O\", \"ۗ\", \"X\", \"⤴\", \"M\", \"à\", \"ً\", \"ُ\", \"\", \"ٍ\", \"F\", \"ّ\", \"\", \"S\", \"W\", \"ä\", \"ή\", \"D\", \"\", \"L\", \"↩\", \"ئ\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/de": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 831523,
"_n_chars": 1784021,
"_n_oov_chars": 110861,
"oov_ratio": 0.06214108466212001,
"_oov_charset": "[\"û\", \"è\", \"č\", \"R\", \"�\", \"ė\", \"V\", \"J\", \"\", \"ó\", \"C\", \"🙄\", \"á\", \"‐\", \"ā\", \"ń\", \"ć\", \"à\", \"W\", \"\", \"İ\", \"ô\", \"̈\", \"U\", \"Ü\", \"â\", \"I\", \"Á\", \"Ö\", \"B\", \"E\", \"Z\", \"T\", \"\", \"M\", \"š\", \"ç\", \"L\", \"Ø\", \"Ä\", \"P\", \"ί\", \"H\", \"≠\", \"ư\", \" \", \"Y\", \"\", \"ï\", \"😃\", \"‽\", \"K\", \"➔\", \"é\", \"😈\", \"X\", \"F\", \"S\", \"ü\", \"D\", \"ớ\", \"😆\", \"A\", \"😢\", \"N\", \"å\", \"\", \"G\", \"Ã\", \"Q\", \"É\", \"ö\", \"\", \"😦\", \"Ÿ\", \"O\", \"\", \"ú\", \"ä\", \"↩\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/en": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 428095,
"_n_chars": 1121360,
"_n_oov_chars": 31072,
"oov_ratio": 0.02770921024470286,
"_oov_charset": "[\"A\", \"N\", \"P\", \"③\", \"\", \"è\", \"H\", \"U\", \"G\", \"R\", \"Y\", \"Q\", \"😥\", \"�\", \"ï\", \"ñ\", \"I\", \"\", \"V\", \"J\", \"\", \"⑦\", \"K\", \"\", \"ó\", \"B\", \"E\", \"é\", \"Z\", \"C\", \"⑩\", \"T\", \"O\", \"X\", \"⑤\", \"M\", \"F\", \"S\", \"⑧\", \"W\", \"D\", \"L\", \"\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/es": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 712440,
"_n_chars": 1630297,
"_n_oov_chars": 68311,
"oov_ratio": 0.04190095424330659,
"_oov_charset": "[\"A\", \"▷\", \"✪\", \"Ú\", \"N\", \"P\", \"Ñ\", \"М\", \"\", \"è\", \"H\", \"U\", \"G\", \"í\", \"―\", \"R\", \"Y\", \"Ó\", \"Q\", \"É\", \"ö\", \"\", \"ñ\", \"I\", \"️\", \"Á\", \"V\", \"✖\", \"J\", \"K\", \"ó\", \"é\", \"E\", \"B\", \"Z\", \"C\", \"😦\", \"T\", \"O\", \"á\", \"X\", \"ò\", \"ý\", \"M\", \"à\", \"F\", \"S\", \"ú\", \"ü\", \"W\", \"D\", \"\", \"\", \"L\", \"Í\", \"\", \"ô\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/fa": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 490998,
"_n_chars": 1145876,
"_n_oov_chars": 17493,
"oov_ratio": 0.015266049729639158,
"_oov_charset": "[\"A\", \"N\", \"P\", \"ْ\", \"ٌ\", \"H\", \"\", \"U\", \"G\", \"ِ\", \"إ\", \"R\", \"ؤ\", \"Y\", \"ۀ\", \"Q\", \"أ\", \"ٴ\", \"َ\", \"\", \"�\", \"I\", \"️\", \"V\", \"J\", \"\", \"K\", \"\", \"B\", \"E\", \"Z\", \"ٔ\", \"C\", \"ּ\", \"آ\", \"T\", \"O\", \"X\", \"▐\", \"M\", \"\", \"ً\", \"ُ\", \"ٍ\", \"F\", \"\", \"ّ\", \"S\", \"W\", \"D\", \"\", \"L\", \"ئ\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/fr": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 635419,
"_n_chars": 1484970,
"_n_oov_chars": 66823,
"oov_ratio": 0.044999562280719475,
"_oov_charset": "[\"A\", \"Ê\", \"N\", \"P\", \"̂\", \"̧\", \"û\", \"
\", \"ù\", \"Ç\", \"è\", \"H\", \"ğ\", \"U\", \"G\", \"🤔\", \"Â\", \"í\", \"―\", \"È\", \"R\", \"Y\", \"Q\", \"î\", \"â\", \"É\", \"�\", \"\", \"ï\", \"ê\", \"I\", \"ë\", \"V\", \"J\", \"K\", \"Î\", \"B\", \"é\", \"E\", \"Z\", \"C\", \"ã\", \"T\", \"O\", \"‐\", \"X\", \"M\", \"à\", \"Ô\", \"F\", \"S\", \"ü\", \"ç\", \"W\", \"ä\", \"À\", \"D\", \"L\", \"\", \"ô\", \"́\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/ja": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 513394,
"_n_chars": 603065,
"_n_oov_chars": 179949,
"oov_ratio": 0.29839072073491246,
"_oov_charset": "[\"%\", \"臨\", \"償\", \"共\", \"馳\", \"敏\", \"緒\", \"墓\", \"称\", \"鐘\", \"樺\", \"\\b\", \"ろ\", \"熱\", \"株\", \"欠\", \"幣\", \"祐\", \"倫\", \"洋\", \"雑\", \"巧\", \"価\", \"⇔\", \"C\", \"滞\", \"咎\", \"徘\", \"機\", \"隈\", \"原\", \"斉\", \"馬\", \"珠\", \"昂\", \"陣\", \"拗\", \"甘\", \"漬\", \"係\", \"ガ\", \"嫡\", \"枝\", \"席\", \"六\", \"ぱ\", \"解\", \"T\", \"叩\", \"/\", \"肘\", \"丹\", \"M\", \"濫\", \"済\", \"ボ\", \"啜\", \"括\", \"申\", \"‼\", \"P\", \"供\", \"探\", \"賃\", \"恥\", \"減\", \"I\", \"呟\", \"峨\", \"コ\", \"微\", \"拶\", \"璧\", \"穂\", \"紫\", \"軌\", \"需\", \"外\", \"浄\", \"旋\", \"墾\", \"噤\", \"窒\", \"斧\", \"献\", \"倉\", \"痺\", \"◎\", \"鬼\", \"埋\", \"役\", \"埃\", \"粉\", \"遜\", \"弓\", \"戻\", \"唆\", \"遂\", \"武\", \"標\", \"雅\", \"賭\", \"困\", \"猶\", \"糖\", \"セ\", \"船\", \"乗\", \"泄\", \"◡\", \"衰\", \"穴\", \"円\", \"蔓\", \"⇒\", \"坂\", \"飴\", \"。\", \"線\", \"買\", \"毛\", \"勧\", \"眩\", \"t\", \"域\", \"幅\", \"唐\", \"首\", \"虫\", \"執\", \"責\", \"箭\", \"致\", \"枕\", \"丿\", \"卵\", \"L\", \"梯\", \"損\", \"轄\", \"漂\", \"這\", \"精\", \"純\", \"死\", \"再\", \"常\", \"江\", \"カ\", \"縄\", \"妹\", \"応\", \"頓\", \"拍\", \"『\", \"蓄\", \"滲\", \"催\", \"較\", \"特\", \"演\", \"磨\", \"淵\", \"塔\", \"織\", \"復\", \"却\", \"酵\", \"岳\", \"角\", \"紀\", \"綺\", \"騙\", \"赤\", \"資\", \"仕\", \"』\", \"筋\", \"プ\", \"逃\", \"鉄\", \"茨\", \"尊\", \"達\", \"皿\", \"栽\", \"庁\", \"瞳\", \"味\", \"畜\", \"蒔\", \"獄\", \"頃\", \"ゼ\", \"藤\", \"゙\", \"耶\", \"捗\", \"慶\", \"管\", \"3\", \"墳\", \"ベ\", \"粋\", \"善\", \"謳\", \"対\", \"「\", \"輩\", \"誕\", \"丈\", \"餓\", \"飯\", \"組\", \"隆\", \"採\", \"琢\", \"縁\", \"尿\", \"呆\", \"國\", \"橋\", \"稲\", \"覧\", \"点\", \"張\", \"侮\", \"喰\", \"尾\", \"鉛\", \"暇\", \"試\", \"功\", \"泊\", \"奏\", \"虎\", \"建\", \"横\", \"眼\", \"火\", \"渡\", \"ワ\", \"飾\", \"余\", \"祭\", \"沈\", \"寓\", \"慣\", \"関\", \"賀\", \"場\", \"K\", \"冨\", \"豆\", \"炒\", \"遼\", \"メ\", \"礁\", \"乱\", \"粧\", \"X\", \"稚\", \"揺\", \"棚\", \"J\", \"辣\", \"違\", \"届\", \"抜\", \"友\", \"辞\", \"銃\", \"寧\", \"棒\", \"拘\", \"付\", \"脅\", \"臣\", \"姓\", \"旨\", \"桁\", \"亡\", \"陰\", \"乞\", \"K\", \"侵\", \"ず\", \"耐\", \"帝\", \"礎\", \"阜\", \"鹿\", \"食\", \"胆\", \"軟\", \"誹\", \"床\", \"汚\", \"暖\", \"^\", \"栗\", \"躇\", \"希\", \"饉\", \"還\", \"寄\", \"澪\", \"奔\", \"貝\", \"畳\", \"速\", \"裂\", \"焼\", \"妙\", \"話\", \"光\", \"病\", \"曝\", \"截\", \"伽\", \"俵\", \"虐\", \"荘\", \"遙\", \"舐\", \"錠\", \"拉\", \"座\", \"梁\", \"汰\", \"怨\", \"②\", \"継\", \"鶏\", \"袋\", \"更\", \"担\", \"替\", \"R\", \"〟\", \"拷\", \"抱\", \"難\", \"劣\", \"ㅂ\", \"避\", \"逮\", \"滅\", \"登\", \"研\", \"脆\", \"寡\", \"U\", \"商\", \"薄\", \"践\", \"慮\", \"酬\", \"添\", \"宿\", \"唸\", \"蝶\", \"循\", \"専\", \"梅\", \"片\", \"算\", \"兼\", \"示\", \"兆\", \"妨\", \"介\", \"評\", \"E\", \"象\", \"股\", \"疎\", \"攻\", \"改\", \"華\", \"9\", \"爆\", \"撤\", \"斗\", \"犬\", \"足\", \"今\", \"壊\", \"次\", \"題\", \"L\", \"鈴\", \"r\", \"荷\", \"或\", \"念\", \"欧\", \"擦\", \"篇\", \"潟\", \"ゞ\", \"漑\", \"単\", \"慌\", \"婚\", \"糸\", \"捐\", \"盲\", \"結\", \"啓\", \"推\", \"侶\", \"握\", \"戦\", \"楚\", \"隕\", \"ぅ\", \"種\", \"黄\", \"散\", \"恨\", \"Z\", \"抹\", \"端\", \"政\", \"訴\", \"反\", \"累\", \"恩\", \"令\", \"戴\", \"浸\", \"愉\", \"驚\", \"ひ\", \"弊\", \"🌙\", \"獲\", \"撮\", \"填\", \"通\", \"腐\", \"ジ\", \"件\", \"浮\", \"逼\", \"督\", \"君\", \"肢\", \"堪\", \"延\", \"詮\", \"従\", \"親\", \"感\", \"送\", \"縫\", \"ヾ\", \"急\", \"側\", \"否\", \"毎\", \"質\", \"長\", \"素\", \"巨\", \"末\", \"奉\", \"経\", \"宣\", \"車\", \"猿\", \"等\", \"消\", \"覇\", \"察\", \"固\", \"羞\", \"惜\", \"詰\", \"丸\", \"戸\", \"召\", \"番\", \"塾\", \"裕\", \"陸\", \"拭\", \"笠\", \"赦\", \"境\", \"木\", \"堡\", \"茶\", \"密\", \"簡\", \"_\", \"〆\", \"阿\", \"瓶\", \"敬\", \"げ\", \"姜\", \"号\", \"ぞ\", \"干\", \"訊\", \"儀\", \"モ\", \"即\", \"判\", \"権\", \"滴\", \"ヶ\", \"煮\", \"黒\", \"周\", \"制\", \"勝\", \"摯\", \"杞\", \"紹\", \"◇\", \"渕\", \"グ\", \"極\", \"遍\", \"何\", \"拠\", \"鎖\", \"匂\", \"隼\", \"憧\", \"旗\", \"板\", \"踊\", \"∇\", \"暢\", \"揄\", \"撃\", \"響\", \"翻\", \"俯\", \"培\", \"岐\", \"゚\", \"突\", \"掘\", \"̀\", \"哲\", \"栄\", \"舎\", \"芸\", \"荒\", \"詐\", \"狼\", \"葬\", \"仙\", \"彿\", \"伏\", \"肝\", \"捜\", \"謡\", \"兎\", \"層\", \"装\", \"浦\", \"斎\", \"S\", \"履\", \"陳\", \"松\", \"D\", \"ロ\", \"藁\", \"綴\", \"使\", \"譲\", \"鶴\", \"忙\", \"酔\", \"魚\", \"勉\", \"淡\", \"浜\", \"ウ\", \"妻\", \"ユ\", \"那\", \"賛\", \"某\", \"絞\", \"絨\", \"覚\", \"坐\", \"掌\", \"性\", \"普\", \"留\", \"術\", \"捕\", \"救\", \"※\", \"彡\", \"苗\", \"迫\", \"伴\", \"初\", \"授\", \"淫\", \"摩\", \"楊\", \"フ\", \"残\", \"習\", \"4\", \"泉\", \"勘\", \"圏\", \"痴\", \"井\", \"庄\", \"幡\", \"秒\", \"菅\", \"画\", \"ュ\", \"構\", \"砂\", \"徴\", \"嗅\", \"醍\", \"碌\", \"姦\", \"派\", \"|\", \"納\", \"噛\", \"寿\", \"麗\", \"麦\", \"況\", \"豊\", \"雨\", \"ィ\", \"塊\", \"喫\", \"洪\", \"肌\", \"珂\", \"椒\", \"諏\", \"宇\", \"測\", \"液\", \"匠\", \"貢\", \"剃\", \"〝\", \"パ\", \"諦\", \"認\", \"降\", \"庶\", \"詳\", \"ゎ\", \"同\", \"圃\", \"桟\", \"偽\", \"祀\", \"n\", \"恰\", \"裾\", \"故\", \"魂\", \"疾\", \"刀\", \"輿\", \"飽\", \"寺\", \"ぁ\", \"¥\", \"附\", \"俗\", \"嵩\", \"漠\", \"〜\", \"舞\", \"章\", \"被\", \"均\", \"危\", \"灘\", \"既\", \"嬢\", \"載\", \"科\", \"遵\", \"凱\", \"向\", \"郵\", \"怖\", \"彰\", \"f\", \"婿\", \"邸\", \"導\", \"萼\", \"ぶ\", \"複\", \"滓\", \"卓\", \"距\", \"講\", \"へ\", \"浅\", \"y\", \"銀\", \"宏\", \"舟\", \"廃\", \"⻑\", \"臓\", \"肩\", \"琴\", \"薬\", \"巻\", \"牧\", \"鞄\", \"ど\", \"Ⅶ\", \"回\", \"凡\", \"ァ\", \"訟\", \"絡\", \"便\", \"霧\", \"芝\", \"牛\", \"殴\", \"些\", \"郎\", \"俸\", \"〕\", \"怒\", \"類\", \"児\", \"問\", \"篤\", \"訓\", \"愕\", \"又\", \"亀\", \"Q\", \"尺\", \"誠\", \"勿\", \"ぉ\", \"業\", \"産\", \"m\", \"圧\", \"置\", \"鑑\", \"逆\", \"恣\", \"?\", \"匙\", \"易\", \"発\", \"屹\", \"蛍\", \"勇\", \"炉\", \"捉\", \"拡\", \"系\", \"腺\", \"書\", \"籠\", \"終\", \"半\", \"祉\", \"叱\", \"i\", \"💦\", \"釜\", \"槽\", \"切\", \"李\", \"僅\", \"決\", \"軍\", \"縛\", \"欝\", \"膿\", \"盤\", \"�\", \"陛\", \"景\", \"嗜\", \"尋\", \"墟\", \"訃\", \"核\", \"惚\", \"吐\", \"欺\", \"毒\", \"確\", \"丁\", \"字\", \"Q\", \"渦\", \"鍵\", \"腱\", \"就\", \"編\", \"峰\", \"序\", \"完\", \"飛\", \"扉\", \"馴\", \"持\", \"薦\", \"選\", \"胸\", \"衝\", \"敷\", \"擢\", \"ゲ\", \"紗\", \"串\", \"尻\", \"闖\", \"泳\", \"眺\", \"凛\", \"表\", \"駐\", \"音\", \"弁\", \"潮\", \"鞘\", \"掬\", \"暑\", \"連\", \"勤\", \"依\", \"襲\", \"忍\", \"昇\", \"E\", \"意\", \"属\", \"湖\", \"態\", \"d\", \"欣\", \"池\", \"開\", \"少\", \"ぜ\", \"迅\", \"医\", \"濯\", \"ノ\", \"バ\", \"渇\", \"妃\", \"於\", \"剰\", \"談\", \"委\", \"第\", \"頼\", \"嘘\", \"孤\", \"蔑\", \"喉\", \"凄\", \"曰\", \"壁\", \"仔\", \"*\", \"排\", \"辱\", \"黙\", \"党\", \"旬\", \"七\", \"薪\", \"髪\", \"棟\", \"浩\", \"秋\", \"艸\", \"N\", \"瞑\", \"釈\", \"滝\", \"2\", \"曖\", \"族\", \"孫\", \"証\", \"瓦\", \"佐\", \"‥\", \"曜\", \"民\", \"随\", \"宜\", \"展\", \"偏\", \"殖\", \"鉢\", \"屈\", \"強\", \"穫\", \"謄\", \"淹\", \"訣\", \"妄\", \"疫\", \"烙\", \"兵\", \"沿\", \"幌\", \"挨\", \"運\", \"砦\", \"範\", \"審\", \"短\", \"健\", \"適\", \"滑\", \"捲\", \"障\", \"埼\", \"聞\", \"吸\", \"顧\", \"沸\", \"ね\", \"ヽ\", \"祥\", \"冬\", \"ゅ\", \"宅\", \"胞\", \"惣\", \"額\", \"活\", \"射\", \"染\", \"魔\", \"拓\", \"痩\", \"面\", \"堤\", \"才\", \"維\", \"倒\", \"針\", \"朗\", \"瞬\", \"咽\", \"ご\", \"趨\", \"砕\", \"材\", \"雀\", \"ゥ\", \"絆\", \"然\", \"邦\", \"集\", \"笛\", \"羽\", \"様\", \"乃\", \"竹\", \"顎\", \"洗\", \"犯\", \"貯\", \"昆\", \"総\", \"箋\", \"員\", \"炭\", \"冒\", \"寸\", \"購\", \"緩\", \"僚\", \"涙\", \"根\", \"媒\", \"魅\", \"Z\", \"径\", \"僭\", \"壮\", \"剣\", \"菌\", \"芳\", \"売\", \"誇\", \"伊\", \"志\", \"飢\", \"慨\", \"宮\", \"釘\", \"稜\", \"懐\", \"革\", \"数\", \"ヤ\", \"披\", \"堆\", \"羅\", \"彼\", \"古\", \"相\", \"w\", \"掻\", \"漏\", \"H\", \"乳\", \"務\", \"刻\", \"郷\", \"只\", \"免\", \"嚥\", \"蒸\", \"垠\", \"討\", \"島\", \"灯\", \"悠\", \"腑\", \"逸\", \" \", \"擁\", \"嘲\", \"徐\", \"閲\", \"糧\", \"瑞\", \"蒙\", \"幹\", \"己\", \"賊\", \"奈\", \"良\", \"居\", \"菓\", \"栓\", \"般\", \"仁\", \"綻\", \"享\", \"浪\", \"弥\", \"厄\", \"諸\", \"爪\", \"崖\", \"腹\", \"英\", \"告\", \"潤\", \"G\", \"昏\", \"命\", \"格\", \"挙\", \"B\", \"併\", \"底\", \"冗\", \"拾\", \"塞\", \"厨\", \"陽\", \"氷\", \"府\", \"綾\", \"簗\", \"弄\", \"嘗\", \"休\", \"走\", \"署\", \"振\", \"頻\", \"寂\", \"拳\", \"雪\", \"起\", \"謎\", \"G\", \"々\", \"秘\", \"訪\", \"至\", \"込\", \"条\", \"康\", \"汲\", \"詞\", \"港\", \"勲\", \"J\", \"県\", \"節\", \"枚\", \"犠\", \"杼\", \"左\", \"拙\", \"榴\", \"梓\", \"鱈\", \"荻\", \"緯\", \"霊\", \"葵\", \"杯\", \"昔\", \"絶\", \"$\", \"囁\", \"W\", \"匹\", \"晶\", \"没\", \"撲\", \"逡\", \"幾\", \"草\", \"龍\", \"̈\", \"狂\", \"規\", \"灰\", \"漫\", \"暴\", \"妥\", \"脇\", \"乙\", \"扱\", \"攫\", \"撫\", \"指\", \"迎\", \"模\", \"函\", \"惹\", \"夷\", \"史\", \"朝\", \"白\", \"拝\", \"思\", \"娘\", \"準\", \"考\", \"5\", \"涯\", \"盗\", \"貪\", \"徹\", \"穢\", \"罰\", \"④\", \"堵\", \"雇\", \"歴\", \"駒\", \"疑\", \"季\", \" ̄\", \"堰\", \"顕\", \"毅\", \"袴\", \"謝\", \";\", \"求\", \"膨\", \"[\", \"灌\", \"優\", \"踏\", \"ヨ\", \"柔\", \"触\", \"ょ\", \"含\", \"穏\", \"論\", \"露\", \"敵\", \"笑\", \"盆\", \"挟\", \"且\", \"懇\", \"哀\", \"住\", \"並\", \"む\", \"琉\", \"D\", \"椅\", \"沖\", \"閃\", \"銭\", \"懲\", \"軋\", \"宙\", \"唯\", \"糾\", \"鋲\", \"鈍\", \"転\", \"隅\", \"院\", \"岡\", \"析\", \"斜\", \"静\", \"萎\", \"塩\", \"泥\", \"企\", \"ゥ\", \"乾\", \"正\", \"益\", \"叉\", \"林\", \"硝\", \"慢\", \"叫\", \"劇\", \"照\", \"詫\", \"午\", \"抵\", \"狩\", \"巷\", \"珪\", \"労\", \"揶\", \"媛\", \"凝\", \"◯\", \"嶽\", \"途\", \"背\", \"脳\", \"監\", \"塵\", \"閑\", \"将\", \"乏\", \"7\", \"\", \"止\", \"8\", \"-\", \"聴\", \"閉\", \"紋\", \"S\", \"苦\", \"卑\", \"貌\", \"餃\", \"溢\", \"翌\", \"弟\", \"貨\", \"透\", \"俳\", \"赴\", \"①\", \"契\", \"釣\", \"拒\", \"窮\", \"嬉\", \"△\", \"診\", \"搬\", \"粗\", \"ぎ\", \"ぽ\", \"失\", \"洞\", \"傍\", \"莫\", \"ゴ\", \"充\", \"奪\", \"腔\", \"恒\", \"茫\", \"袈\", \"形\", \"I\", \"烈\", \"噌\", \"焦\", \"換\", \"猟\", \"携\", \"婆\", \"駆\", \"五\", \"料\", \"踪\", \"喋\", \"訳\", \"腸\", \"姥\", \"園\", \"H\", \"巡\", \"競\", \"造\", \"房\", \"́\", \"冷\", \"智\", \"娠\", \"烹\", \"玄\", \"離\", \"淳\", \"図\", \"曇\", \"甥\", \"〇\", \"捩\", \"重\", \"彌\", \"停\", \"麹\", \"無\", \"琵\", \"興\", \"霞\", \"腰\", \"森\", \"募\", \"怠\", \"敗\", \"艶\", \"威\", \"彷\", \"ば\", \"癖\", \"托\", \"F\", \"源\", \"炎\", \"伸\", \"紡\", \"春\", \"須\", \"燥\", \"彫\", \"電\", \"貫\", \"燭\", \"誤\", \"揚\", \"折\", \"爾\", \"袖\", \"見\", \"ゾ\", \"句\", \"竜\", \"腫\", \"醸\", \"枢\", \"駕\", \"碓\", \"愛\", \"睦\", \"斐\", \"繰\", \"寝\", \"悔\", \"掛\", \"室\", \"門\", \"臆\", \"ー\", \"煎\", \"頭\", \"湘\", \"槃\", \"ぇ\", \"臥\", \"A\", \"蓋\", \"震\", \"駄\", \"厳\", \"欽\", \"孝\", \"ほ\", \"週\", \"悪\", \"控\", \"悶\", \"風\", \"祖\", \"流\", \"闘\", \"彙\", \"迷\", \"徳\", \"両\", \"衿\", \"遺\", \"惨\", \"鍋\", \"唄\", \"ド\", \"訂\", \"跨\", \"奴\", \"纏\", \"撒\", \"団\", \"贅\", \"店\", \"鮮\", \"沢\", \"胚\", \"餌\", \"・\", \"耗\", \"呑\", \"氾\", \"激\", \"招\", \"頒\", \"讃\", \"磯\", \"悍\", \"囚\", \"吟\", \"教\", \"鳥\", \"創\", \"昨\", \"与\", \"輪\", \"貿\", \"俊\", \"千\", \"貶\", \"計\", \"粒\", \"M\", \"洒\", \"辿\", \"狙\", \"薙\", \"ゃ\", \"脈\", \"階\", \"筆\", \"崔\", \"痛\", \"服\", \"朴\", \"迭\", \"韮\", \"び\", \"治\", \"例\", \"杏\", \"飲\", \"窃\", \"実\", \"ぴ\", \"低\", \"祈\", \"裟\", \"凶\", \"崎\", \"移\", \"声\", \"贔\", \"細\", \"狐\", \"琳\", \"仰\", \"゚\", \"検\", \"輸\", \"攘\", \"顔\", \"N\", \"究\", \"贋\", \"母\", \"断\", \"ギ\", \"紐\", \"遇\", \"嶋\", \"非\", \"欄\", \"略\", \"恵\", \"環\", \"婦\", \"予\", \"莽\", \"ヲ\", \"航\", \"=\", \"潰\", \"苑\", \"逐\", \"裸\", \"肉\", \"囲\", \"虚\", \"叭\", \"満\", \"O\", \"級\", \"里\", \"混\", \"澤\", \"放\", \"牽\", \"椿\", \"鉱\", \"奇\", \"引\", \"望\", \"譜\", \"打\", \"だ\", \"鋭\", \"筒\", \"協\", \"案\", \"刃\", \"惑\", \"斑\", \"粘\", \"択\", \"油\", \"魏\", \"刷\", \"近\", \"阪\", \"誘\", \"暦\", \"量\", \"遠\", \"凍\", \"珍\", \"布\", \"封\", \"悲\", \"ゆ\", \"把\", \"桃\", \"批\", \"尼\", \"宋\", \"録\", \"桂\", \"蛇\", \"唇\", \"削\", \"具\", \"預\", \"祝\", \"③\", \"喜\", \"殊\", \"色\", \"皮\", \"隙\", \"借\", \"嵌\", \"追\", \"度\", \"祇\", \"硬\", \"恭\", \"偶\", \"彦\", \"柱\", \"菜\", \"隔\", \"揃\", \"裏\", \"禁\", \"着\", \"汎\", \"現\", \"ブ\", \"a\", \"套\", \"わ\", \"掃\", \"率\", \"該\", \"裁\", \"嗚\", \"賠\", \"0\", \"廊\", \"l\", \"弾\", \"療\", \"駿\", \"程\", \"稼\", \"軽\", \"骨\", \"桑\", \"基\", \"濃\", \"覗\", \"杓\", \"因\", \"ヘ\", \"ポ\", \"o\", \"摘\", \"噂\", \"妖\", \"清\", \"苛\", \"遭\", \"遊\", \"墜\", \"癌\", \"搭\", \"衷\", \"紙\", \"券\", \"姑\", \"😢\", \"槍\", \"娯\", \"傑\", \"膏\", \"別\", \"徊\", \"箇\", \"右\", \"▽\", \"路\", \"蹴\", \"冊\", \"頂\", \"深\", \"熟\", \"刊\", \"雷\", \"目\", \"肯\", \"刑\", \"リ\", \"億\", \"観\", \"跡\", \"束\", \"賑\", \"琶\", \"各\", \"設\", \"械\", \"羊\", \"堂\", \"Ⅹ\", \"楠\", \"梗\", \"読\", \"べ\", \"争\", \"磋\", \"⑧\", \"&\", \"應\", \"岬\", \"罵\", \"状\", \"漁\", \"醐\", \"辺\", \"省\", \"記\", \"植\", \"偉\", \"像\", \"挑\", \"怯\", \"煽\", \"R\", \"北\", \"花\", \"男\", \"憎\", \"騒\", \"四\", \"症\", \"錬\", \"迦\", \"吠\", \"穀\", \"型\", \"個\", \"駅\", \"間\", \"也\", \"提\", \"始\", \"賢\", \"祠\", \"😌\", \"街\", \">\", \"蜂\", \"農\", \"蔵\", \"ぃ\", \"老\", \"跳\", \"垢\", \"土\", \"仮\", \"段\", \"痢\", \"値\", \"雰\", \"坊\", \"積\", \"殺\", \"、\", \"渋\", \"助\", \"卒\", \"盛\", \"Д\", \"縞\", \"央\", \"師\", \"捨\", \"葉\", \"峙\", \"施\", \"項\", \"夕\", \"忠\", \"殻\", \"蝋\", \"広\", \"整\", \"備\", \"昼\", \"気\", \"尖\", \"P\", \"燃\", \"存\", \"暁\", \"槌\", \"―\", \"索\", \"坪\", \"説\", \"峠\", \"暮\", \"瘻\", \"暫\", \"負\", \"帰\", \"鬱\", \"約\", \"宗\", \"□\", \"町\", \"茂\", \"ヵ\", \"慄\", \"溶\", \"八\", \"匡\", \"杜\", \"諺\", \"煙\", \"窪\", \"防\", \"ヌ\", \"∀\", \"蔽\", \"堅\", \"払\", \"脂\", \"岩\", \"候\", \"云\", \"越\", \"伝\", \"統\", \"虜\", \"当\", \"佳\", \"堺\", \"咳\", \"待\", \"涅\", \"詠\", \"綬\", \"揮\", \"劉\", \"褒\", \"躍\", \"慈\", \"ヴ\", \"趣\", \"貰\", \"狭\", \"栃\", \"舘\", \"V\", \"班\", \"斡\", \"衛\", \"館\", \"映\", \"巾\", \"補\", \"梳\", \"営\", \"澄\", \"ぬ\", \"懸\", \"際\", \"摂\", \"牲\", \"撰\", \"盟\", \"が\", \"嘆\", \"F\", \"締\", \"詩\", \"請\", \"御\", \"南\", \"貴\", \"‐\", \"肪\", \"沼\", \"嵯\", \"糞\", \"輝\", \"血\", \"必\", \"獣\", \"典\", \"財\", \"夫\", \"腎\", \"レ\", \"▷\", \"窟\", \"殿\", \"冥\", \"幼\", \"頬\", \"受\", \"概\", \"託\", \"靴\", \"凪\", \"枯\", \"身\", \"X\", \"課\", \"仏\", \"g\", \"遅\", \"姉\", \"靄\", \"髭\", \"群\", \"厚\", \"繋\", \"符\", \"\\u001b\", \"播\", \"幸\", \"づ\", \"儲\", \"<\", \"憲\", \"客\", \"斬\", \"陵\", \"遡\", \"伯\", \"柄\", \"楽\", \"喝\", \"促\", \"秩\", \"庭\", \"尚\", \"捧\", \"陥\", \"描\", \"吹\", \"惧\", \"昭\", \"喚\", \"練\", \"邪\", \"歌\", \"奢\", \"隣\", \"Ⅱ\", \"亭\", \"職\", \"ォ\", \"吾\", \"b\", \"痕\", \"壬\", \"退\", \"蠍\", \"灼\", \"掴\", \"紛\", \"⑩\", \"唾\", \"僧\", \"齢\", \"テ\", \"浣\", \"媚\", \"警\", \"綱\", \".\", \"割\", \"矛\", \"包\", \"晋\", \"忘\", \"恐\", \"式\", \"謀\", \"缶\", \"独\", \"誌\", \"村\", \"衣\", \"塚\", \"ア\", \"Y\", \"版\", \"遥\", \"隠\", \"抽\", \"楓\", \"妬\", \"伐\", \"ョ\", \"譚\", \"識\", \"翼\", \"〈\", \"貸\", \"杉\", \"征\", \"塗\", \"双\", \"議\", \"叶\", \"ザ\", \"傾\", \"湿\", \"嘩\", \"韓\", \"舗\", \"承\", \"巣\", \"鯖\", \"但\", \"旭\", \"夜\", \"返\", \"豚\", \"述\", \"剤\", \"艦\", \"歳\", \"秀\", \"聖\", \"檀\", \"柏\", \"局\", \"呂\", \"闊\", \"如\", \"繍\", \"猫\", \"険\", \"濡\", \"帽\", \"籍\", \"列\", \"曽\", \"慎\", \"仲\", \"\", \"旦\", \"辛\", \"酒\", \"鼻\", \"悟\", \"ピ\", \"薩\", \"鴻\", \"位\", \"未\", \"賞\", \"湧\", \"喪\", \"`\", \"直\", \"製\", \"丘\", \"歪\", \"緻\", \"デ\", \"歩\", \"じ\", \"支\", \"傲\", \"え\", \"蘇\", \"交\", \"T\", \"鍛\", \"修\", \"暗\", \"謂\", \"隊\", \"潜\", \"守\", \"+\", \"洩\", \"⌒\", \"躾\", \"棄\", \"謬\", \"私\", \"癒\", \"稀\", \"✧\", \"札\", \"校\", \"咲\", \"㎞\", \"泌\", \"焙\", \"視\", \"憶\", \"報\", \"早\", \"害\", \"慰\", \"限\", \"庫\", \"ぐ\", \"枠\", \"ダ\", \"王\", \"抗\", \"息\", \"厭\", \"続\", \"騰\", \"」\", \"眠\", \"揉\", \"碍\", \"去\", \"異\", \"廉\", \"果\", \"措\", \"寮\", \"税\", \"妊\", \"屓\", \"帯\", \"怪\", \"昧\", \"絵\", \"養\", \"知\", \"晩\", \"融\", \"崩\", \"査\", \"幽\", \"ノ\", \"帳\", \"滋\", \"侍\", \"A\", \"諾\", \"丼\", \"落\", \"任\", \"鳴\", \"ざ\", \"印\", \"甲\", \"曹\", \"岸\", \"鎮\", \"胃\", \"誓\", \"做\", \"潔\", \"讐\", \"梱\", \"由\", \"篠\", \"堀\", \"励\", \"庇\", \"呼\", \"銘\", \"青\", \"波\", \"給\", \"渉\", \"贈\", \"罪\", \"膚\", \"k\", \"筈\", \"ビ\", \"麓\", \"姫\", \"夏\", \"晒\", \"配\", \"債\", \"汁\", \"策\", \"憤\", \"腕\", \"貼\", \"棲\", \"嫉\", \"舌\", \"ふ\", \"戯\", \"占\", \"唱\", \"夢\", \"界\", \"菊\", \"瘍\", \"]\", \"綜\", \"謙\", \"謗\", \"喩\", \"兄\", \"膜\", \"〔\", \"傷\", \"V\", \"増\", \"郭\", \"涼\", \"欲\", \"麺\", \"寇\", \"胎\", \"ゝ\", \"疹\", \"刺\", \"擬\", \"罠\", \"で\", \"許\", \"縦\", \"患\", \"梨\", \"旧\", \"湯\", \"勢\", \"6\", \"汗\", \"幕\", \"器\", \"互\", \"寒\", \"漢\", \"杖\", \"\", \"皆\", \"喇\", \"似\", \"温\", \"噴\", \"写\", \"醤\", \"煩\", \"羨\", \"亜\", \"垣\", \"衡\", \"晴\", \"桜\", \"貧\", \"輔\", \"ペ\", \"童\", \"匿\", \"餅\", \"─\", \"h\", \"ヨ\", \"築\", \"俄\", \"米\", \"升\", \"壌\", \"容\", \"超\", \"ぷ\", \"︎\", \"答\", \"膝\", \"鎌\", \"剥\", \"災\", \"飼\", \"幻\", \"屋\", \"帆\", \"〉\", \"軸\", \"谷\", \"倭\", \"酷\", \"肥\", \"僕\", \"睡\", \"若\", \"﨑\", \"歓\", \"逢\", \"貞\", \"宴\", \"動\", \"浴\", \"熊\", \"憩\", \"礼\", \"克\", \"著\", \"C\", \"吉\", \"漱\", \"忌\", \"寛\", \"鏡\", \"参\", \"盾\", \"紅\", \"矢\", \"捏\", \"緊\", \"傘\", \"頑\", \"牙\", \"奨\", \"瀬\", \"緑\", \"詈\", \"験\", \"接\", \"疇\", \"殆\", \"楼\", \"俺\", \"処\", \"憑\", \"猛\", \"嵐\", \"蛮\", \"甚\", \"票\", \"憂\", \"~\", \"徒\", \"嫌\", \"護\", \"忽\", \"O\", \"雄\", \"歯\", \"⑪\", \"領\", \"繊\", \"壇\", \"辰\", \"津\", \"抑\", \"愚\", \"倍\", \"耳\", \"据\", \"溜\", \"之\", \"ハ\", \"押\", \"変\", \"久\", \"頷\", \"せ\", \"郡\", \"箱\", \"轢\", \"収\", \"及\", \"遽\", \"臭\", \"爽\", \"戒\", \"覆\", \"往\", \"過\", \"快\", \"躊\", \"阻\", \"悩\", \"醜\", \"調\", \"販\", \"U\", \"操\", \"聾\", \"眉\", \"錯\", \"湾\", \"費\", \"旺\", \"s\", \"副\", \"疲\", \"允\", \"泣\", \"雲\", \"言\", \"影\", \"父\", \"順\", \"B\", \"秤\", \"1\", \"尽\", \"陶\", \"戚\", \"誰\", \"口\", \"績\", \"瞭\", \"捺\", \"努\", \"期\", \"纒\", \"亮\", \"姿\", \"閣\", \"伺\", \"奥\", \"曲\", \"軒\", \"ネ\", \"遣\", \"架\", \"耕\", \"旅\", \"鵜\", \"酸\", \"樹\", \"則\", \"殲\", \"斂\", \"肺\", \"後\", \"玉\", \"願\", \"痒\", \"想\", \"礫\", \"泡\", \"Y\", \"麻\", \"垂\", \"弱\", \"渓\", \"ズ\", \"除\", \"W\", \"脱\", \"衆\", \"空\", \"蛋\", \"梶\", \"脚\", \"看\", \"先\", \"挿\", \"藻\", \"ぼ\", \"闇\", \"凌\", \"蓮\", \"喧\", \"宛\", \"効\", \"繁\", \"簿\", \"翔\", \"瓢\", \"徨\", \"士\", \"虹\", \"訝\", \"泰\", \"他\", \"縮\", \"窓\", \"網\", \"義\", \"佇\", \"氏\", \"畑\", \"進\", \"嫁\", \"゙\", \"挫\", \"援\", \"稿\", \"河\", \"鼓\", \"恋\", \"東\", \"廻\", \"為\", \"働\", \"e\", \"\\", \"奮\", \"差\", \"偵\", \"破\", \"掲\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/ko": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 596422,
"_n_chars": 655190,
"_n_oov_chars": 440721,
"oov_ratio": 0.672661365405455,
"_oov_charset": "[\"%\", \"먼\", \"ᴇ\", \"셔\", \"共\", \"버\", \"증\", \"량\", \"禮\", \"鐘\", \"웅\", \"樺\", \"석\", \"옆\", \"깽\", \"祐\", \"洋\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"C\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"機\", \"댈\", \"原\", \"녀\", \"남\", \"係\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"六\", \"챙\", \"필\", \"呪\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"v\", \"解\", \"콘\", \"經\", \"홈\", \"험\", \"분\", \"직\", \"廟\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"申\", \"콥\", \"≪\", \"쬐\", \"듬\", \"쫓\", \"봄\", \"ㅣ\", \"교\", \"外\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"◎\", \"육\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"♧\", \"점\", \"똑\", \"榜\", \"說\", \"것\", \"새\", \"곰\", \"룹\", \"琪\", \"🚨\", \"🗺\", \"武\", \"標\", \"㎍\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"⇒\", \"틀\", \"藝\", \"봉\", \"왠\", \"섦\", \"毛\", \"겁\", \"唐\", \"낀\", \"혁\", \"판\", \"致\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"吳\", \"關\", \"롱\", \"얏\", \"팍\", \"死\", \"江\", \"常\", \"힉\", \"댔\", \"眞\", \"쌍\", \"『\", \"높\", \"쾅\", \"굽\", \"特\", \"더\", \"줏\", \"보\", \"淨\", \"긍\", \"쌈\", \"角\", \"폿\", \"紀\", \"닳\", \"닷\", \"資\", \"젝\", \"겨\", \"』\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"츠\", \"텔\", \"💣\", \"↔\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"管\", \"챗\", \"\", \"궜\", \"榮\", \"낳\", \"꺽\", \"맥\", \"善\", \"「\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"劫\", \"융\", \"國\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"贖\", \"火\", \"飾\", \"웍\", \"K\", \"퀸\", \"뀔\", \"면\", \"X\", \"諒\", \"끄\", \"할\", \"홋\", \"뗀\", \"友\", \"툼\", \"흐\", \"拘\", \"룩\", \"ㅇ\", \"‧\", \"문\", \"슷\", \"不\", \"陰\", \"왓\", \"믹\", \"탐\", \"엎\", \"계\", \"帝\", \"퀘\", \"라\", \"◐\", \"食\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"光\", \"病\", \"맵\", \"킹\", \"광\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"汰\", \"헛\", \"머\", \"틋\", \"②\", \"염\", \"겔\", \"째\", \"밌\", \"콩\", \"♤\", \"쉬\", \"놨\", \"궈\", \"濁\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"滅\", \"\", \"월\", \"U\", \"商\", \"薄\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"E\", \"귤\", \"쏠\", \"릭\", \"改\", \"華\", \"헌\", \"🙋\", \"斗\", \"犬\", \"앗\", \"코\", \"L\", \"題\", \"次\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"외\", \"노\", \"쥐\", \"婚\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"結\", \"삣\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"種\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"政\", \"反\", \"훼\", \"척\", \"쵸\", \"🍟\", \"驚\", \"弊\", \"ㅙ\", \"재\", \"충\", \"왔\", \"떳\", \"떻\", \"君\", \"채\", \"삘\", \"얽\", \"웬\", \"찌\", \"➍\", \"否\", \"주\", \"푸\", \"長\", \"맺\", \"🏫\", \"찮\", \"템\", \"奉\", \"立\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"펼\", \"◈\", \"휠\", \"류\", \"냐\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"笠\", \"잇\", \"뇌\", \"獻\", \"拜\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"敬\", \"칼\", \"姜\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"制\", \"ㄱ\", \"닮\", \"俠\", \"◇\", \"♀\", \"싼\", \"弛\", \"동\", \"極\", \"何\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"춰\", \"뇨\", \"훔\", \"차\", \"ⅳ\", \"꾀\", \"갇\", \"챨\", \"侯\", \"돼\", \"네\", \"S\", \"헤\", \"陳\", \"D\", \"團\", \"껑\", \"샹\", \"퀵\", \"푹\", \"魚\", \"튀\", \"妻\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"某\", \"ⓒ\", \"렇\", \"ㅝ\", \"坐\", \"掌\", \"테\", \"性\", \"留\", \"術\", \"※\", \"핍\", \"헨\", \"初\", \"창\", \"🍔\", \"授\", \"곳\", \"摩\", \"포\", \"걱\", \"發\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"烏\", \"譯\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"|\", \"궐\", \"릉\", \"힜\", \"氣\", \"퓰\", \"쳤\", \"꿈\", \"ã\", \"술\", \"꼭\", \"⑴\", \"향\", \"液\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"同\", \"⑶\", \"뻤\", \"땐\", \"故\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"俗\", \"투\", \"拮\", \"章\", \"Ⅰ\", \"被\", \"載\", \"科\", \"응\", \"向\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"깨\", \"잘\", \"롤\", \"堯\", \"화\", \"넵\", \"銀\", \"賣\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"回\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"擒\", \"캘\", \"폰\", \"邑\", \"곤\", \"〕\", \"類\", \"🥁\", \"개\", \"윗\", \"壽\", \"ʏ\", \"尤\", \"축\", \"Q\", \"듀\", \"봅\", \"業\", \"獨\", \"밟\", \"?\", \"易\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"系\", \"협\", \"書\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"祉\", \"💦\", \"올\", \"취\", \"軍\", \"켰\", \"틱\", \"흰\", \"≤\", \"민\", \"�\", \"쌀\", \"흗\", \"예\", \"毒\", \"濟\", \"字\", \"밍\", \"캉\", \"넛\", \"돗\", \"峰\", \"숏\", \"ⓔ\", \"걀\", \"序\", \"득\", \"🌵\", \"밭\", \"팠\", \"選\", \"쁜\", \"륜\", \"균\", \"덜\", \"쪄\", \"️\", \"🤗\", \"對\", \"긋\", \"력\", \"ㅅ\", \"駐\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"⑸\", \"🍰\", \"意\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"헬\", \"第\", \"졸\", \"엣\", \"칠\", \"曰\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"*\", \"七\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"秋\", \"N\", \"넥\", \"냥\", \"族\", \"‥\", \"젠\", \"뻑\", \"닙\", \"民\", \"탱\", \"뜩\", \"씩\", \"있\", \"믐\", \"들\", \"켄\", \"았\", \"뮐\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"잔\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"適\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"㎡\", \"ㅎ\", \"빅\", \"쿨\", \"冬\", \"뒷\", \"射\", \"ⅰ\", \"쨍\", \"🙆\", \"魔\", \"쾨\", \"面\", \"침\", \"🚿\", \"요\", \"才\", \"蟄\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"ㄴ\", \"윤\", \"짧\", \"然\", \"邦\", \"년\", \"集\", \"乃\", \"竹\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"員\", \"얍\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"Z\", \"듣\", \"찔\", \"켓\", \"志\", \"열\", \"즌\", \"태\", \"宮\", \"樂\", \"革\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"古\", \"相\", \"습\", \"럭\", \"H\", \"乳\", \"랙\", \"길\", \"탬\", \"잤\", \" \", \"줌\", \"蒙\", \"딱\", \"장\", \"己\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"居\", \"仁\", \"과\", \"꿕\", \"英\", \"였\", \"G\", \"위\", \"숙\", \"⊙\", \"ⅲ\", \"命\", \"횡\", \"쎄\", \"둡\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"陽\", \"雙\", \"넘\", \"氷\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"雪\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"至\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"康\", \"관\", \"뜻\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"J\", \"節\", \"촌\", \"뮌\", \"빌\", \"荻\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"W\", \"ㄹ\", \"꼬\", \"草\", \"龍\", \"핏\", \"德\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"乙\", \"쒀\", \"공\", \"🙇\", \"토\", \"史\", \"朝\", \"臺\", \"죄\", \"白\", \"골\", \"쁘\", \"思\", \"빔\", \"뾱\", \"ç\", \"준\", \"슴\", \"罰\", \"쩍\", \"얄\", \"퓨\", \"④\", \"뚝\", \"峴\", \"킥\", \"벽\", \"➋\", \"데\", \"價\", \"謝\", \"求\", \"璿\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"論\", \"짱\", \"펙\", \"댁\", \"슬\", \"쁨\", \"哀\", \"曆\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"院\", \"靑\", \"내\", \"陸\", \"줍\", \"析\", \"詔\", \"會\", \"톱\", \"온\", \"正\", \"將\", \"林\", \"킁\", \"을\", \"ⅱ\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"끔\", \"뀐\", \"덟\", \"합\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"韜\", \"🍭\", \"펠\", \"途\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"紋\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"덧\", \"띈\", \"혈\", \"弟\", \"썅\", \"①\", \"훠\", \"탄\", \"窮\", \"두\", \"△\", \"꽂\", \"쏘\", \"궁\", \"洞\", \"팽\", \"톡\", \"🦄\", \"緞\", \"져\", \"實\", \"칫\", \"I\", \"돈\", \"臀\", \"換\", \"탕\", \"趺\", \"五\", \"삶\", \"料\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"學\", \"쓴\", \"벳\", \"틈\", \"빕\", \"巡\", \"옷\", \"턴\", \"❍\", \"房\", \"폼\", \"離\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"無\", \"멋\", \"삿\", \"틔\", \"✈\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"誡\", \"F\", \"썹\", \"春\", \"➏\", \"놈\", \"燭\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"敎\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"愛\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"門\", \"좌\", \"쿠\", \"떠\", \"└\", \"頭\", \"낮\", \"臥\", \"굉\", \"터\", \"🤟\", \"닥\", \"孝\", \"략\", \"딸\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"徳\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"歲\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"鮮\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"劍\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"貿\", \"툴\", \"램\", \"앎\", \"M\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"治\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"찢\", \"뺀\", \"瀧\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"略\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"肉\", \"에\", \"좋\", \"O\", \"벤\", \"뚜\", \"택\", \"里\", \"운\", \"뛸\", \"얼\", \"벙\", \"望\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"協\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"體\", \"고\", \"했\", \"퍽\", \"뮬\", \"布\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"宋\", \"켜\", \"꽝\", \"왜\", \"③\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"色\", \"깡\", \"皮\", \"숍\", \"컵\", \"얻\", \"닐\", \"🤕\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"戊\", \"옮\", \"펩\", \"맑\", \"혀\", \"現\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"程\", \"캣\", \"鎭\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"紙\", \"쯔\", \"壞\", \"결\", \"엇\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"黃\", \"표\", \"몹\", \"目\", \"\", \"담\", \"뽑\", \"희\", \"픽\", \"랫\", \"생\", \"확\", \"번\", \"堂\", \"Ⅹ\", \"며\", \"힌\", \"⑧\", \"텝\", \"應\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"像\", \"킬\", \"씽\", \"R\", \"北\", \"맬\", \"男\", \"기\", \"팡\", \"핥\", \"穀\", \"ㆍ\", \"및\", \"맨\", \"큰\", \"륨\", \"間\", \"戌\", \"훈\", \"始\", \"렛\", \"펑\", \"蜀\", \"효\", \"農\", \"∮\", \"볕\", \"흙\", \"土\", \"각\", \"체\", \"링\", \"參\", \"벼\", \"륵\", \"專\", \"殺\", \"콰\", \"槪\", \"卒\", \"꿰\", \"탑\", \"觸\", \"빤\", \"타\", \"師\", \"峙\", \"국\", \"變\", \"많\", \"渴\", \"卽\", \"낸\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"齋\", \"샴\", \"P\", \"쫑\", \"읽\", \"앞\", \"늬\", \"츈\", \"存\", \"픈\", \"―\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"巳\", \"□\", \"宗\", \"ᴛ\", \"八\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"히\", \"씌\", \"욜\", \"풀\", \"詠\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"胡\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"衛\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"際\", \"魯\", \"샬\", \"덤\", \"屠\", \"盟\", \"멍\", \"튄\", \"∼\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"南\", \"御\", \"곁\", \"⑹\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"典\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"枯\", \"멘\", \"감\", \"課\", \"識\", \"텨\", \"群\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"客\", \"모\", \"빴\", \"켈\", \"릿\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"昭\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"亭\", \"럿\", \"엽\", \"숟\", \"브\", \"內\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"쿵\", \"警\", \"\", \"包\", \"췄\", \"衣\", \"藥\", \"질\", \"햇\", \"춘\", \"쿼\", \"悖\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"〈\", \"貸\", \"홍\", \"시\", \"韓\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"⋅\", \"夜\", \"껴\", \"述\", \"곱\", \"聖\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"료\", \"형\", \"籍\", \"뮤\", \"랐\", \"족\", \"仲\", \"울\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"直\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"交\", \"T\", \"修\", \"닌\", \"守\", \"累\", \"후\", \"늑\", \"朱\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"王\", \"抗\", \"웨\", \"휙\", \"당\", \"亨\", \"」\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"知\", \"푼\", \"假\", \"워\", \"💰\", \"싯\", \"A\", \"먹\", \"🍞\", \"굴\", \"뭔\", \"甲\", \"핑\", \"받\", \"찍\", \"숲\", \"피\", \"듐\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"가\", \" \", \"널\", \"콤\", \"≫\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"⑥\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"蚩\", \"😣\", \"정\", \"꼴\", \"쭙\", \"떴\", \"界\", \"규\", \"군\", \"줬\", \"樂\", \"戮\", \"兄\", \"앱\", \"〔\", \"V\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"루\", \"ㅞ\", \"뻐\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"勢\", \"밤\", \"漢\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"衡\", \"童\", \"❏\", \"잼\", \"쭈\", \"米\", \"컸\", \"쫄\", \"몸\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"\", \"란\", \"⑨\", \"몽\", \"넓\", \"〉\", \"혐\", \"谷\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"動\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"寛\", \"💅\", \"됬\", \"멀\", \"든\", \"⑦\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"雄\", \"유\", \"서\", \"누\", \"辰\", \"삐\", \"津\", \"쿰\", \"之\", \"된\", \"처\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"數\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"覆\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"휩\", \"훑\", \"황\", \"역\", \"s\", \"副\", \"웠\", \"셰\", \"렬\", \"雲\", \"言\", \"B\", \"눕\", \"⑤\", \"口\", \"씻\", \"익\", \"軒\", \"찼\", \"얇\", \"팀\", \"茅\", \"펄\", \"뷔\", \"耕\", \"진\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"樹\", \"玉\", \"後\", \"룸\", \"뉴\", \"跏\", \"괌\", \"팔\", \"Y\", \"샐\", \"독\", \"꿍\", \"脱\", \"춥\", \"淘\", \"㉿\", \"얹\", \"자\", \"끼\", \"先\", \"땠\", \"ㅐ\", \"⑵\", \"린\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"뿜\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"뎅\", \"넨\", \"東\", \"ʟ\", \"燦\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"asafaya/bert-base-arabic @ cc100/zh-Hans": {
"tokenizer": "bert-base-arabic",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 882108,
"_n_chars": 927311,
"_n_oov_chars": 481828,
"oov_ratio": 0.5195969852616867,
"_oov_charset": "[\"%\", \"调\", \"共\", \"骰\", \"饶\", \"痫\", \"芬\", \"瘠\", \"缝\", \"弗\", \"敏\", \"姚\", \"称\", \"\\b\", \"墓\", \"讥\", \"丙\", \"篢\", \"玛\", \"陪\", \"株\", \"饿\", \"欠\", \"其\", \"黩\", \"俭\", \"沧\", \"逑\", \"洋\", \"硫\", \"旆\", \"敞\", \"弘\", \"榭\", \"曾\", \"糠\", \"挈\", \"巧\", \"诶\", \"码\", \"份\", \"岖\", \"C\", \"徘\", \"滞\", \"荣\", \"咎\", \"扇\", \"鲍\", \"逊\", \"凭\", \"原\", \"睿\", \"袱\", \"籽\", \"珠\", \"揽\", \"划\", \"昂\", \"拗\", \"娇\", \"甘\", \"醋\", \"浚\", \"诱\", \"枝\", \"姻\", \"芙\", \"曼\", \"馏\", \"唬\", \"席\", \"轩\", \"浞\", \"六\", \"篝\", \"桥\", \"泽\", \"咖\", \"劈\", \"捍\", \"皱\", \"解\", \"压\", \"闸\", \"叩\", \"淆\", \"T\", \"蝉\", \"豁\", \"饰\", \"喔\", \"/\", \"肘\", \"\", \"丹\", \"虽\", \"睐\", \"闫\", \"钞\", \"饮\", \"曳\", \"缔\", \"卤\", \"涤\", \"坚\", \"纬\", \"毙\", \"啜\", \"括\", \"钦\", \"蜡\", \"申\", \"疙\", \"蜥\", \"欸\", \"厥\", \"供\", \"卷\", \"夺\", \"鸩\", \"寥\", \"歉\", \"挲\", \"涮\", \"探\", \"挽\", \"赖\", \"峨\", \"种\", \"微\", \"璧\", \"紫\", \"找\", \"赢\", \"饽\", \"需\", \"外\", \"旋\", \"炫\", \"瑕\", \"冰\", \"窒\", \"勃\", \"侃\", \"值\", \"斧\", \"筷\", \"孜\", \"嵘\", \"献\", \"熄\", \"仓\", \"鬼\", \"撼\", \"韧\", \"埋\", \"役\", \"轶\", \"迄\", \"埃\", \"陌\", \"刹\", \"够\", \"秆\", \"粉\", \"肛\", \"榜\", \"弓\", \"浇\", \"吃\", \"赠\", \"唆\", \"蒋\", \"该\", \"简\", \"层\", \"琪\", \"嫂\", \"武\", \"溃\", \"遂\", \"谴\", \"雅\", \"谛\", \"標\", \"溯\", \"孩\", \"困\", \"寨\", \"轨\", \"脯\", \"糖\", \"船\", \"剧\", \"泄\", \"乔\", \"孽\", \"渲\", \"柿\", \"衰\", \"晾\", \"歇\", \"惰\", \"穴\", \"蔓\", \"哒\", \"豌\", \"长\", \"哨\", \"坂\", \"辜\", \"裘\", \"円\", \"绚\", \"恺\", \"总\", \"萦\", \"厌\", \"玫\", \"毛\", \"t\", \"擂\", \"眩\", \"吏\", \"腓\", \"睬\", \"幅\", \"域\", \"谐\", \"阶\", \"佝\", \"塘\", \"粽\", \"唐\", \"首\", \"跪\", \"虫\", \"箭\", \"\\u0007\", \"伦\", \"员\", \"致\", \"询\", \"枕\", \"瘾\", \"卵\", \"梯\", \"損\", \"忑\", \"漂\", \"舶\", \"财\", \"垛\", \"酿\", \"精\", \"伤\", \"死\", \"江\", \"常\", \"再\", \"郜\", \"眨\", \"妹\", \"皈\", \"谢\", \"拍\", \"『\", \"栏\", \"铩\", \"飙\", \"冀\", \"蓄\", \"颓\", \"菩\", \"焊\", \"催\", \"特\", \"演\", \"懵\", \"磨\", \"塔\", \"俩\", \"娑\", \"畴\", \"岳\", \"却\", \"酵\", \"角\", \"蕾\", \"炖\", \"赤\", \"诠\", \"挪\", \"惺\", \"础\", \"远\", \"仕\", \"資\", \"掺\", \"』\", \"筋\", \"谧\", \"怕\", \"逃\", \"萧\", \"吞\", \"戍\", \"茨\", \"嘛\", \"尊\", \"臊\", \"皿\", \"敢\", \"畸\", \"逛\", \"栽\", \"瞳\", \"味\", \"鉴\", \"冯\", \"孕\", \"畜\", \"钢\", \"锄\", \"辽\", \"驳\", \"读\", \"藤\", \"剩\", \"藉\", \"栈\", \"簇\", \"庚\", \"针\", \"耶\", \"溉\", \"颜\", \"汀\", \"管\", \"抢\", \"抖\", \"3\", \"浊\", \"盒\", \"彗\", \"善\", \"棺\", \"烊\", \"亿\", \"丈\", \"义\", \"缚\", \"蹲\", \"竿\", \"羚\", \"胳\", \"跋\", \"咸\", \"髓\", \"岣\", \"隆\", \"笨\", \"琢\", \"採\", \"尿\", \"\", \"鹭\", \"侦\", \"语\", \"赎\", \"旖\", \"呆\", \"荨\", \"劫\", \"曦\", \"呈\", \"玻\", \"点\", \"呗\", \"侬\", \"侮\", \"锋\", \"桦\", \"兴\", \"舰\", \"祛\", \"尾\", \"嫖\", \"暇\", \"楔\", \"功\", \"泊\", \"奏\", \"虎\", \"建\", \"睁\", \"横\", \"眼\", \"晰\", \"火\", \"渡\", \"疗\", \"茧\", \"盏\", \"枪\", \"叼\", \"吻\", \"余\", \"渊\", \"沈\", \"祭\", \"寓\", \"焉\", \"蓟\", \"嗪\", \"呕\", \"晨\", \"祟\", \"经\", \"K\", \"犷\", \"豆\", \"炒\", \"楞\", \"樊\", \"挂\", \"汽\", \"传\", \"礁\", \"芒\", \"乱\", \"X\", \"稚\", \"岱\", \"卿\", \"棚\", \"辣\", \"稳\", \"届\", \"酪\", \"友\", \"辞\", \"准\", \"棠\", \"棒\", \"险\", \"训\", \"车\", \"拘\", \"付\", \"毕\", \"邋\", \"涌\", \"臣\", \"姓\", \"旨\", \"馒\", \"坑\", \"亡\", \"乞\", \"吩\", \"撷\", \"靡\", \"瘙\", \"扎\", \"侵\", \"衔\", \"裆\", \"韦\", \"扳\", \"呐\", \"肚\", \"挺\", \"耐\", \"挖\", \"帝\", \"佛\", \"此\", \"阜\", \"傻\", \"胆\", \"食\", \"鹿\", \"窜\", \"弦\", \"棋\", \"床\", \"荼\", \"买\", \"暖\", \"框\", \"吝\", \"辐\", \"栗\", \"躇\", \"希\", \"寄\", \"啬\", \"尹\", \"濮\", \"奔\", \"霓\", \"搅\", \"莱\", \"速\", \"裂\", \"收\", \"茏\", \"妙\", \"耸\", \"光\", \"炅\", \"病\", \"曝\", \"截\", \"伽\", \"铛\", \"钩\", \"显\", \"虐\", \"鄯\", \"汐\", \"樟\", \"噢\", \"舐\", \"鬣\", \"拉\", \"憋\", \"泻\", \"润\", \"座\", \"穿\", \"梁\", \"甜\", \"汰\", \"倏\", \"嗓\", \"怨\", \"呷\", \"②\", \"韫\", \"赚\", \"售\", \"窖\", \"瞻\", \"臻\", \"贡\", \"袋\", \"袒\", \"阵\", \"镭\", \"更\", \"擎\", \"犟\", \"担\", \"队\", \"替\", \"萄\", \"ὐ\", \"废\", \"拷\", \"婪\", \"抱\", \"躁\", \"泾\", \"肤\", \"堕\", \"劣\", \"荤\", \"驻\", \"避\", \"逮\", \"咋\", \"登\", \"研\", \"脆\", \"寡\", \"U\", \"商\", \"忡\", \"薄\", \"践\", \"弯\", \"酬\", \"壑\", \"添\", \"宿\", \"慮\", \"蝶\", \"循\", \"薯\", \"挠\", \"柬\", \"蛛\", \"狄\", \"梅\", \"片\", \"兼\", \"算\", \"碱\", \"屣\", \"舅\", \"示\", \"宪\", \"兆\", \"绥\", \"咱\", \"妨\", \"蚪\", \"介\", \"砍\", \"E\", \"费\", \"象\", \"股\", \"懊\", \"攻\", \"锚\", \"改\", \"巢\", \"9\", \"爆\", \"擞\", \"篮\", \"仗\", \"撤\", \"塑\", \"斗\", \"晖\", \"竺\", \"构\", \"犬\", \"足\", \"今\", \"L\", \"次\", \"挥\", \"r\", \"抡\", \"殉\", \"芯\", \"嚎\", \"湛\", \"或\", \"荷\", \"橱\", \"念\", \"欧\", \"很\", \"芦\", \"嘉\", \"俘\", \"篇\", \"擦\", \"丐\", \"炕\", \"邯\", \"效\", \"耍\", \"婚\", \"慌\", \"绅\", \"捐\", \"辙\", \"盲\", \"裴\", \"淖\", \"推\", \"妈\", \"饷\", \"猬\", \"尘\", \"谩\", \"ě\", \"悉\", \"握\", \"鞍\", \"楚\", \"鹃\", \"棵\", \"脸\", \"赛\", \"撑\", \"柜\", \"涡\", \"姆\", \"黄\", \"散\", \"袭\", \"扭\", \"啡\", \"恨\", \"帐\", \"抹\", \"端\", \"辫\", \"政\", \"妮\", \"帜\", \"鑫\", \"怜\", \"反\", \"拐\", \"颈\", \"晚\", \"禾\", \"坟\", \"饨\", \"累\", \"恩\", \"令\", \"戴\", \"济\", \"泯\", \"浸\", \"渎\", \"愉\", \"懒\", \"弊\", \"储\", \"填\", \"通\", \"瑨\", \"腐\", \"杂\", \"件\", \"浮\", \"逼\", \"茎\", \"督\", \"君\", \"胶\", \"廖\", \"肢\", \"堪\", \"延\", \"逻\", \"缠\", \"鹕\", \"默\", \"诞\", \"恶\", \"馆\", \"婶\", \"感\", \"刮\", \"帕\", \"送\", \"挤\", \"轻\", \"急\", \"稻\", \"沐\", \"诅\", \"县\", \"否\", \"奶\", \"恍\", \"惩\", \"矩\", \"毎\", \"铲\", \"狈\", \"脖\", \"巨\", \"连\", \"绎\", \"素\", \"页\", \"末\", \"奉\", \"篡\", \"宣\", \"姊\", \"郴\", \"等\", \"钻\", \"茉\", \"消\", \"憨\", \"察\", \"澜\", \"遴\", \"哄\", \"桐\", \"固\", \"聆\", \"羞\", \"惜\", \"圾\", \"铝\", \"召\", \"丸\", \"戸\", \"统\", \"番\", \"á\", \"裕\", \"肃\", \"孔\", \"拭\", \"逅\", \"蕉\", \"倾\", \"氰\", \"绒\", \"箔\", \"邕\", \"儒\", \"拜\", \"彭\", \"扪\", \"漉\", \"缜\", \"殷\", \"皙\", \"境\", \"堡\", \"木\", \"密\", \"韵\", \"茶\", \"_\", \"鲱\", \"忧\", \"徙\", \"蚂\", \"阿\", \"瓶\", \"敬\", \"眷\", \"姜\", \"赂\", \"号\", \"厕\", \"\", \"纱\", \"磁\", \"熬\", \"干\", \"捡\", \"龚\", \"卜\", \"滇\", \"即\", \"叹\", \"牟\", \"饵\", \"判\", \"阽\", \"绸\", \"惘\", \"滴\", \"煮\", \"鞭\", \"竟\", \"瑜\", \"躲\", \"顺\", \"挎\", \"周\", \"制\", \"弹\", \"疵\", \"撇\", \"蒜\", \"问\", \"带\", \"恪\", \"忐\", \"弛\", \"遍\", \"何\", \"凰\", \"鲨\", \"墒\", \"啼\", \"纪\", \"赡\", \"旗\", \"溺\", \"板\", \"憧\", \"踊\", \"罩\", \"韪\", \"袁\", \"褐\", \"腋\", \"翻\", \"俯\", \"培\", \"岐\", \"缩\", \"聪\", \"瓣\", \"突\", \"贸\", \"掘\", \"柳\", \"删\", \"嘈\", \"瓜\", \"馋\", \"哲\", \"舎\", \"逍\", \"荒\", \"庞\", \"狼\", \"诺\", \"葬\", \"驰\", \"仙\", \"饼\", \"祢\", \"岔\", \"伏\", \"肝\", \"柘\", \"侯\", \"绽\", \"黯\", \"饱\", \"斌\", \"煌\", \"遮\", \"岑\", \"装\", \"浦\", \"势\", \"俚\", \"S\", \"骛\", \"履\", \"蔬\", \"松\", \"D\", \"〖\", \"拎\", \"粤\", \"恙\", \"使\", \"这\", \"锻\", \"忙\", \"勉\", \"酌\", \"诚\", \"淡\", \"栋\", \"质\", \"妻\", \"那\", \"掏\", \"悼\", \"缮\", \"硕\", \"奖\", \"某\", \"腊\", \"坐\", \"讼\", \"掌\", \"藐\", \"璜\", \"价\", \"性\", \"留\", \"普\", \"\", \"捕\", \"涂\", \"※\", \"救\", \"垃\", \"苗\", \"迫\", \"鼯\", \"伴\", \"霄\", \"初\", \"矗\", \"涉\", \"躯\", \"授\", \"渗\", \"泸\", \"凿\", \"淫\", \"摩\", \"厢\", \"膳\", \"残\", \"牠\", \"發\", \"荆\", \"泉\", \"勘\", \"4\", \"畏\", \"痴\", \"井\", \"巴\", \"啦\", \"庄\", \"敌\", \"秒\", \"禧\", \"画\", \"抉\", \"瑄\", \"砂\", \"聋\", \"聚\", \"炳\", \"泵\", \"嗅\", \"醍\", \"奠\", \"碌\", \"牖\", \"派\", \"罐\", \"樯\", \"军\", \"骄\", \"脑\", \"糟\", \"喂\", \"寿\", \"赔\", \"鹤\", \"贫\", \"麦\", \"雕\", \"嘟\", \"揣\", \"蜿\", \"雨\", \"拌\", \"盎\", \"忱\", \"芜\", \"洪\", \"衬\", \"筑\", \"肌\", \"⑴\", \"稽\", \"矣\", \"呀\", \"椒\", \"肖\", \"攥\", \"宇\", \"液\", \"匠\", \"耘\", \"霉\", \"〝\", \"绪\", \"让\", \"寅\", \"贝\", \"贬\", \"砺\", \"降\", \"庶\", \"苹\", \"同\", \"烧\", \"闵\", \"⑶\", \"髻\", \"褪\", \"n\", \"祀\", \"恰\", \"熙\", \"峭\", \"艰\", \"故\", \"单\", \"讪\", \"璎\", \"魂\", \"疾\", \"瓷\", \"淋\", \"橡\", \"厘\", \"狠\", \"刀\", \"睫\", \"啃\", \"淑\", \"烟\", \"枉\", \"寺\", \"瑢\", \"挡\", \"涣\", \"侥\", \"詹\", \"螺\", \"凑\", \"缺\", \"败\", \"附\", \"俗\", \"漠\", \"舞\", \"章\", \"舛\", \"墉\", \"遗\", \"被\", \"均\", \"拦\", \"亥\", \"危\", \"尝\", \"椭\", \"鹅\", \"既\", \"瑒\", \"耙\", \"沓\", \"科\", \"遵\", \"蜴\", \"向\", \"蚤\", \"职\", \"恳\", \"怖\", \"旳\", \"晤\", \"呃\", \"舔\", \"彰\", \"瘤\", \"邬\", \"婿\", \"邸\", \"屑\", \"辟\", \"项\", \"滓\", \"萼\", \"卓\", \"佩\", \"距\", \"碎\", \"孙\", \"へ\", \"燎\", \"浅\", \"兑\", \"豫\", \"慑\", \"袜\", \"拂\", \"赅\", \"宏\", \"賣\", \"舟\", \"矮\", \"逾\", \"肩\", \"闯\", \"琴\", \"拯\", \"哭\", \"咚\", \"牧\", \"羁\", \"捞\", \"回\", \"帅\", \"赏\", \"轴\", \"凡\", \"仿\", \"便\", \"芝\", \"榄\", \"阱\", \"莺\", \"牛\", \"殴\", \"纹\", \"些\", \"飞\", \"郎\", \"朵\", \"邑\", \"权\", \"楷\", \"〕\", \"怒\", \"鼠\", \"签\", \"陡\", \"渺\", \"喷\", \"垮\", \"镉\", \"畅\", \"勾\", \"暨\", \"粟\", \"尤\", \"滨\", \"又\", \"侧\", \"赁\", \"愕\", \"Q\", \"尺\", \"勿\", \"币\", \"产\", \"呵\", \"啊\", \"聊\", \"肠\", \"置\", \"恣\", \"逆\", \"铁\", \"?\", \"匙\", \"易\", \"寻\", \"瞩\", \"甄\", \"嘤\", \"谑\", \"颁\", \"睑\", \"掂\", \"屹\", \"晕\", \"啐\", \"减\", \"凳\", \"勇\", \"炉\", \"捉\", \"噶\", \"系\", \"腺\", \"蠢\", \"哎\", \"驼\", \"鸥\", \"琛\", \"岭\", \"龟\", \"半\", \"块\", \"厮\", \"祉\", \"姣\", \"i\", \"您\", \"釜\", \"醉\", \"槽\", \"响\", \"叙\", \"切\", \"李\", \"竭\", \"琐\", \"办\", \"榷\", \"岚\", \"榻\", \"巩\", \"狡\", \"爰\", \"�\", \"陛\", \"景\", \"谣\", \"匾\", \"嗜\", \"铮\", \"惶\", \"墟\", \"湮\", \"核\", \"惚\", \"掰\", \"佟\", \"阎\", \"吐\", \"欺\", \"毒\", \"楣\", \"凯\", \"笼\", \"书\", \"丁\", \"亦\", \"確\", \"字\", \"卫\", \"锂\", \"诃\", \"蓁\", \"甯\", \"离\", \"腱\", \"就\", \"聿\", \"跷\", \"峰\", \"涛\", \"痘\", \"亟\", \"序\", \"完\", \"扉\", \"极\", \"持\", \"偌\", \"踱\", \"戾\", \"掀\", \"選\", \"胸\", \"纂\", \"狳\", \"霏\", \"茸\", \"茄\", \"敷\", \"灭\", \"瀛\", \"踝\", \"弑\", \"肋\", \"葛\", \"疏\", \"串\", \"宁\", \"亳\", \"间\", \"董\", \"捂\", \"喱\", \"铨\", \"泳\", \"眺\", \"凛\", \"表\", \"遁\", \"拨\", \"吵\", \"哟\", \"音\", \"骏\", \"啪\", \"潮\", \"鞘\", \"怡\", \"掬\", \"鲤\", \"剂\", \"暑\", \"杆\", \"勤\", \"依\", \"忍\", \"瞟\", \"Ø\", \"昵\", \"⑸\", \"妤\", \"意\", \"跌\", \"宫\", \"择\", \"插\", \"珞\", \"属\", \"淅\", \"湖\", \"绕\", \"斋\", \"翡\", \"d\", \"欣\", \"哉\", \"揭\", \"池\", \"鹜\", \"少\", \"渤\", \"惊\", \"戳\", \"伫\", \"拔\", \"虑\", \"迅\", \"潘\", \"医\", \"砧\", \"采\", \"ノ\", \"伙\", \"气\", \"讶\", \"妃\", \"於\", \"撸\", \"卉\", \"仄\", \"委\", \"第\", \"丢\", \"终\", \"舱\", \"湄\", \"嘘\", \"孤\", \"蔑\", \"喉\", \"凄\", \"壁\", \"摆\", \"躺\", \"岛\", \"严\", \"熏\", \"曰\", \"呜\", \"仔\", \"斛\", \"排\", \"旬\", \"薪\", \"党\", \"护\", \"七\", \"丽\", \"辱\", \"钓\", \"髦\", \"浩\", \"狱\", \"煜\", \"哈\", \"秋\", \"咒\", \"N\", \"裤\", \"2\", \"族\", \"挣\", \"瓦\", \"佐\", \"民\", \"随\", \"键\", \"宜\", \"汝\", \"展\", \"眯\", \"馁\", \"骆\", \"偏\", \"窄\", \"峡\", \"蜒\", \"骗\", \"尉\", \"殖\", \"屈\", \"莎\", \"粮\", \"強\", \"掖\", \"霆\", \"蝗\", \"乘\", \"淹\", \"毫\", \"奋\", \"黛\", \"辩\", \"妄\", \"游\", \"疫\", \"粥\", \"烙\", \"兵\", \"瞒\", \"蚓\", \"顽\", \"沿\", \"袍\", \"挨\", \"骅\", \"霸\", \"運\", \"轮\", \"疼\", \"甩\", \"氛\", \"创\", \"短\", \"哺\", \"岗\", \"健\", \"滑\", \"嘎\", \"障\", \"嘣\", \"渍\", \"猥\", \"么\", \"递\", \"吸\", \"祥\", \"沸\", \"噪\", \"搡\", \"怔\", \"冬\", \"鳗\", \"宅\", \"胞\", \"莴\", \"\", \"活\", \"猪\", \"浑\", \"射\", \"萝\", \"盐\", \"染\", \"擅\", \"绍\", \"魔\", \"拓\", \"脐\", \"拱\", \"堤\", \"面\", \"翰\", \"欢\", \"才\", \"薇\", \"翠\", \"倒\", \"孰\", \"剔\", \"朗\", \"锁\", \"瞬\", \"咽\", \"材\", \"协\", \"雀\", \"蔡\", \"狰\", \"辖\", \"然\", \"邦\", \"涕\", \"集\", \"笛\", \"贿\", \"羽\", \"乃\", \"竹\", \"奘\", \"贮\", \"颌\", \"锥\", \"洗\", \"娥\", \"犯\", \"赋\", \"蓝\", \"擘\", \"昆\", \"鄂\", \"应\", \"钥\", \"咕\", \"氮\", \"寸\", \"炭\", \"结\", \"冒\", \"焰\", \"員\", \"穆\", \"僚\", \"根\", \"峥\", \"夸\", \"媒\", \"刁\", \"鸟\", \"苍\", \"魅\", \"Z\", \"径\", \"亵\", \"壮\", \"爹\", \"兹\", \"菌\", \"芳\", \"伊\", \"屄\", \"志\", \"粼\", \"慨\", \"舆\", \"骼\", \"损\", \"炙\", \"丰\", \"革\", \"蜷\", \"淀\", \"谚\", \"蹄\", \"数\", \"僵\", \"藕\", \"隘\", \"披\", \"堆\", \"沏\", \"谬\", \"彼\", \"古\", \"相\", \"柠\", \"继\", \"决\", \"漏\", \"释\", \"H\", \"乳\", \"溅\", \"刻\", \"只\", \"癫\", \"免\", \"习\", \"浓\", \"蒸\", \"躬\", \"垠\", \"荏\", \"桓\", \"灯\", \"坡\", \"絮\", \"谱\", \"叠\", \"脊\", \"悠\", \"锢\", \"擀\", \"碰\", \"腑\", \"妒\", \"扣\", \"逸\", \"惫\", \"彻\", \" \", \"笔\", \"蒙\", \"徐\", \"瑞\", \"嘲\", \"酱\", \"肾\", \"芽\", \"话\", \"己\", \"艺\", \"檐\", \"奈\", \"棉\", \"珉\", \"桌\", \"良\", \"辅\", \"居\", \"舒\", \"栓\", \"般\", \"淌\", \"仁\", \"享\", \"计\", \"佣\", \"娼\", \"虞\", \"浪\", \"撩\", \"晦\", \"刘\", \"炊\", \"弥\", \"趁\", \"聒\", \"挝\", \"厄\", \"⑷\", \"崖\", \"爪\", \"捅\", \"耩\", \"腹\", \"英\", \"告\", \"虔\", \"坯\", \"渠\", \"G\", \"昏\", \"命\", \"格\", \"惭\", \"罔\", \"绞\", \"诫\", \"啤\", \"併\", \"底\", \"拾\", \"塞\", \"厨\", \"订\", \"伞\", \"劑\", \"莲\", \"拟\", \"蹩\", \"涟\", \"壓\", \"府\", \"舍\", \"诊\", \"赐\", \"跤\", \"伍\", \"蝇\", \"弄\", \"邹\", \"暄\", \"休\", \"咯\", \"走\", \"署\", \"嗣\", \"嚼\", \"彬\", \"侠\", \"沟\", \"寂\", \"振\", \"圈\", \"咙\", \"沾\", \"拳\", \"雪\", \"浆\", \"说\", \"起\", \"秸\", \"热\", \"洛\", \"资\", \"譬\", \"铂\", \"秘\", \"至\", \"愧\", \"条\", \"唠\", \"鼎\", \"炬\", \"琅\", \"哪\", \"贴\", \"灵\", \"无\", \"仅\", \"康\", \"鸠\", \"尴\", \"汲\", \"嗲\", \"\", \"晗\", \"港\", \"J\", \"枚\", \"霖\", \"觉\", \"抨\", \"左\", \"筹\", \"拙\", \"澎\", \"榴\", \"荻\", \"凋\", \"肆\", \"估\", \"缥\", \"杯\", \"矶\", \"葵\", \"霊\", \"昔\", \"讨\", \"蚀\", \"W\", \"谦\", \"朋\", \"匹\", \"栾\", \"晶\", \"没\", \"喆\", \"草\", \"兰\", \"闷\", \"德\", \"狂\", \"霾\", \"漫\", \"弃\", \"灰\", \"雁\", \"闾\", \"菇\", \"陋\", \"贾\", \"悬\", \"秽\", \"暴\", \"妥\", \"姗\", \"孵\", \"扑\", \"撞\", \"乙\", \"爻\", \"攫\", \"每\", \"咐\", \"桔\", \"过\", \"指\", \"迎\", \"厂\", \"毗\", \"娄\", \"璇\", \"荧\", \"模\", \"熔\", \"剖\", \"函\", \"镐\", \"惹\", \"暧\", \"夷\", \"史\", \"朝\", \"纸\", \"骤\", \"白\", \"兜\", \"襟\", \"牒\", \"匀\", \"揖\", \"思\", \"娘\", \"⒃\", \"考\", \"怵\", \"5\", \"涯\", \"戏\", \"ç\", \"埂\", \"苯\", \"诬\", \"砾\", \"盗\", \"剑\", \"驾\", \"啕\", \"④\", \"堵\", \"雇\", \"瘫\", \"组\", \"缉\", \"疑\", \"呢\", \"季\", \"惯\", \"扛\", \"堰\", \"價\", \"娟\", \"毅\", \"權\", \"览\", \"澡\", \";\", \"求\", \"芷\", \"胫\", \"[\", \"膨\", \"灌\", \"涎\", \"灶\", \"踏\", \"苟\", \"柔\", \"盘\", \"炸\", \"诩\", \"触\", \"盯\", \"泛\", \"粕\", \"含\", \"邵\", \"稠\", \"滤\", \"镶\", \"拧\", \"沁\", \"庆\", \"露\", \"笑\", \"盆\", \"晟\", \"膛\", \"挟\", \"虾\", \"讯\", \"搐\", \"且\", \"卦\", \"哀\", \"住\", \"並\", \"椅\", \"D\", \"琉\", \"访\", \"绛\", \"肮\", \"宙\", \"唯\", \"盹\", \"院\", \"椰\", \"疯\", \"谎\", \"铃\", \"踹\", \"什\", \"析\", \"莉\", \"斜\", \"喻\", \"郅\", \"镀\", \"忿\", \"辉\", \"垒\", \"静\", \"萎\", \"虏\", \"迟\", \"企\", \"妆\", \"泥\", \"皂\", \"轼\", \"正\", \"益\", \"佼\", \"糊\", \"叉\", \"乾\", \"林\", \"潦\", \"懦\", \"狞\", \"慢\", \"娴\", \"叫\", \"照\", \"翅\", \"偎\", \"午\", \"懑\", \"抵\", \"蚌\", \"浏\", \"吱\", \"巷\", \"狩\", \"杀\", \"涝\", \"逗\", \"⒋\", \"搀\", \"浙\", \"蹿\", \"媛\", \"胖\", \"凝\", \"钉\", \"颇\", \"途\", \"背\", \"摧\", \"剽\", \"齿\", \"筛\", \"将\", \"监\", \"乏\", \"恼\", \"\", \"7\", \"郁\", \"止\", \"绊\", \"-\", \"8\", \"狗\", \"议\", \"娅\", \"摔\", \"苦\", \"貌\", \"磊\", \"卑\", \"汩\", \"溢\", \"翌\", \"弟\", \"透\", \"赴\", \"识\", \"①\", \"契\", \"椎\", \"瞥\", \"拒\", \"贷\", \"嬉\", \"匈\", \"喀\", \"豹\", \"搬\", \"粗\", \"圣\", \"胺\", \"骁\", \"摄\", \"撕\", \"失\", \"洞\", \"傍\", \"莫\", \"黢\", \"纯\", \"联\", \"违\", \"充\", \"而\", \"陕\", \"腔\", \"乌\", \"窥\", \"恒\", \"茫\", \"谓\", \"忪\", \"涵\", \"嗔\", \"扼\", \"形\", \"恢\", \"I\", \"烈\", \"紧\", \"噌\", \"焦\", \"头\", \"臀\", \"壹\", \"禄\", \"梧\", \"婆\", \"五\", \"携\", \"料\", \"踪\", \"烷\", \"胥\", \"箍\", \"矍\", \"牢\", \"凉\", \"姥\", \"帘\", \"杭\", \"巡\", \"嗦\", \"哼\", \"敦\", \"造\", \"题\", \"翊\", \"验\", \"房\", \"关\", \"冷\", \"智\", \"拼\", \"瞧\", \"烹\", \"冲\", \"剿\", \"玄\", \"娠\", \"穹\", \"淳\", \"铤\", \"腻\", \"滩\", \"遛\", \"蓉\", \"暹\", \"耦\", \"东\", \"玮\", \"枷\", \"桶\", \"澈\", \"祷\", \"重\", \"噼\", \"旎\", \"停\", \"凤\", \"零\", \"赘\", \"柯\", \"噬\", \"搏\", \"实\", \"倜\", \"蔷\", \"坏\", \"霞\", \"腰\", \"忆\", \"森\", \"锦\", \"窦\", \"簧\", \"嗨\", \"募\", \"怠\", \"锣\", \"铣\", \"屎\", \"威\", \"砥\", \"覃\", \"彷\", \"恿\", \"复\", \"滚\", \"狸\", \"癖\", \"汉\", \"托\", \"贪\", \"F\", \"葩\", \"源\", \"炎\", \"罗\", \"伸\", \"拿\", \"勒\", \"遑\", \"愁\", \"匮\", \"春\", \"宠\", \"燥\", \"悚\", \"误\", \"電\", \"卖\", \"棂\", \"舵\", \"抄\", \"貂\", \"迤\", \"折\", \"梢\", \"袖\", \"拖\", \"弩\", \"鹑\", \"屡\", \"锤\", \"戛\", \"陨\", \"腥\", \"竞\", \"谈\", \"句\", \"艘\", \"缭\", \"膀\", \"枢\", \"榆\", \"吗\", \"猡\", \"睦\", \"斐\", \"冈\", \"锏\", \"寝\", \"悔\", \"肴\", \"灑\", \"氨\", \"室\", \"渥\", \"汹\", \"門\", \"尬\", \"臆\", \"绷\", \"乍\", \"煤\", \"尧\", \"煎\", \"湘\", \"吴\", \"蔼\", \"摸\", \"槃\", \"诀\", \"羹\", \"赣\", \"踩\", \"漩\", \"临\", \"A\", \"葱\", \"震\", \"宵\", \"酝\", \"妍\", \"圩\", \"孝\", \"啸\", \"耻\", \"ù\", \"魇\", \"控\", \"敖\", \"甫\", \"骸\", \"祖\", \"龇\", \"流\", \"卢\", \"记\", \"鸽\", \"î\", \"迷\", \"毁\", \"彙\", \"臼\", \"唷\", \"徳\", \"瘩\", \"摇\", \"斤\", \"據\", \"搜\", \"噩\", \"衿\", \"啥\", \"旁\", \"乡\", \"芮\", \"标\", \"乎\", \"谨\", \"哑\", \"蛙\", \"蛔\", \"虱\", \"惨\", \"缈\", \"团\", \"见\", \"吊\", \"醇\", \"幢\", \"嘀\", \"跨\", \"扯\", \"载\", \"奴\", \"撒\", \"仇\", \"试\", \"店\", \"踞\", \"树\", \"黝\", \"胚\", \"囤\", \"滕\", \"p\", \"丧\", \"耗\", \"・\", \"爵\", \"蚯\", \"激\", \"埔\", \"倨\", \"吆\", \"招\", \"灾\", \"冤\", \"妞\", \"瞰\", \"夯\", \"糕\", \"译\", \"颖\", \"筝\", \"悍\", \"倦\", \"驱\", \"净\", \"帮\", \"朔\", \"囚\", \"沽\", \"吟\", \"教\", \"昨\", \"与\", \"胱\", \"俊\", \"阑\", \"郸\", \"千\", \"粒\", \"跑\", \"诣\", \"M\", \"洒\", \"煲\", \"穗\", \"筐\", \"你\", \"呻\", \"狙\", \"爱\", \"蕴\", \"仍\", \"馨\", \"汪\", \"霭\", \"崔\", \"选\", \"痛\", \"服\", \"态\", \"朴\", \"罄\", \"玷\", \"迭\", \"馕\", \"拇\", \"她\", \"鳞\", \"吼\", \"荟\", \"治\", \"例\", \"荡\", \"姬\", \"扩\", \"杏\", \"抓\", \"跃\", \"罹\", \"锈\", \"吁\", \"郑\", \"窃\", \"墅\", \"宰\", \"低\", \"妇\", \"许\", \"贱\", \"凶\", \"祈\", \"崎\", \"蹊\", \"纷\", \"移\", \"岌\", \"汤\", \"声\", \"狐\", \"搞\", \"导\", \"琳\", \"偻\", \"仰\", \"⒀\", \"按\", \"螂\", \"婷\", \"槐\", \"倪\", \"剁\", \"攘\", \"憬\", \"陆\", \"盼\", \"榨\", \"鳃\", \"N\", \"究\", \"佬\", \"母\", \"断\", \"杠\", \"靠\", \"遇\", \"钵\", \"柑\", \"萍\", \"咀\", \"非\", \"认\", \"销\", \"略\", \"予\", \"航\", \"约\", \"鞋\", \"苑\", \"琦\", \"逐\", \"敲\", \"负\", \"裸\", \"广\", \"讳\", \"勺\", \"肉\", \"桅\", \"屯\", \"增\", \"竖\", \"撬\", \"虚\", \"叔\", \"叭\", \"劝\", \"O\", \"臃\", \"里\", \"术\", \"爸\", \"混\", \"辆\", \"疚\", \"放\", \"奇\", \"引\", \"秃\", \"羡\", \"罚\", \"望\", \"打\", \"戈\", \"粱\", \"倘\", \"鸣\", \"拢\", \"鼾\", \"惦\", \"瑰\", \"筒\", \"坝\", \"掉\", \"案\", \"绝\", \"洽\", \"刃\", \"玲\", \"唏\", \"它\", \"惑\", \"桩\", \"斑\", \"粘\", \"油\", \"魏\", \"沫\", \"炮\", \"扰\", \"刷\", \"近\", \"环\", \"沦\", \"卸\", \"裹\", \"阂\", \"哮\", \"弧\", \"茁\", \"阪\", \"叨\", \"量\", \"珍\", \"辑\", \"绳\", \"布\", \"鹈\", \"封\", \"给\", \"悲\", \"趟\", \"缴\", \"潭\", \"烦\", \"把\", \"穰\", \"徽\", \"镳\", \"桃\", \"批\", \"烁\", \"讲\", \"尼\", \"坎\", \"宋\", \"汶\", \"桂\", \"蛇\", \"赵\", \"具\", \"削\", \"唇\", \"漆\", \"猎\", \"祝\", \"兢\", \"③\", \"喜\", \"颉\", \"殊\", \"色\", \"坦\", \"囊\", \"圜\", \"苣\", \"确\", \"皮\", \"隙\", \"怀\", \"傅\", \"壤\", \"瀚\", \"借\", \"沃\", \"嵌\", \"葫\", \"追\", \"度\", \"硬\", \"镏\", \"恭\", \"偶\", \"牺\", \"柱\", \"蒂\", \"彦\", \"棍\", \"菜\", \"隔\", \"硅\", \"犄\", \"踵\", \"禁\", \"趋\", \"沪\", \"勋\", \"拣\", \"着\", \"痪\", \"屏\", \"铎\", \"獗\", \"爬\", \"须\", \"厉\", \"笃\", \"藏\", \"a\", \"套\", \"墙\", \"掩\", \"朽\", \"悦\", \"夹\", \"蟀\", \"率\", \"裁\", \"艋\", \"纺\", \"0\", \"廊\", \"钰\", \"咧\", \"蜕\", \"瘦\", \"别\", \"霍\", \"哗\", \"慧\", \"歧\", \"慕\", \"程\", \"蜃\", \"汛\", \"鲎\", \"贯\", \"杰\", \"骨\", \"芭\", \"桑\", \"逝\", \"墨\", \"基\", \"爷\", \"巫\", \"嗯\", \"卍\", \"邻\", \"掠\", \"检\", \"剪\", \"歼\", \"因\", \"坤\", \"卧\", \"雏\", \"o\", \"惴\", \"摘\", \"苛\", \"清\", \"妖\", \"遭\", \"悴\", \"锲\", \"癌\", \"则\", \"录\", \"搭\", \"衷\", \"顿\", \"麾\", \"屌\", \"沂\", \"券\", \"蜜\", \"纠\", \"狮\", \"姑\", \"谆\", \"颗\", \"惮\", \"击\", \"轿\", \"猴\", \"蛊\", \"徊\", \"膏\", \"別\", \"礴\", \"屉\", \"蹴\", \"右\", \"蹦\", \"路\", \"碟\", \"〗\", \"ㄓ\", \"\\u0006\", \"蟹\", \"深\", \"禅\", \"遢\", \"熟\", \"秦\", \"刊\", \"雷\", \"\\u0005\", \"目\", \"肯\", \"刑\", \"泠\", \"茜\", \"详\", \"束\", \"银\", \"琶\", \"各\", \"娶\", \"械\", \"处\", \"琼\", \"娜\", \"堂\", \"羊\", \"佰\", \"靓\", \"楠\", \"梗\", \"争\", \"嗡\", \"颠\", \"肿\", \"磋\", \"璨\", \"&\", \"迩\", \"战\", \"沮\", \"⑧\", \"状\", \"规\", \"垫\", \"馍\", \"醐\", \"肓\", \"熹\", \"账\", \"斥\", \"范\", \"省\", \"综\", \"植\", \"萃\", \"腿\", \"像\", \"挑\", \"怯\", \"煽\", \"匕\", \"R\", \"北\", \"凹\", \"勖\", \"花\", \"翱\", \"男\", \"馅\", \"黔\", \"孀\", \"哧\", \"四\", \"症\", \"仆\", \"迦\", \"猝\", \"媳\", \"渐\", \"奂\", \"缪\", \"型\", \"吠\", \"隶\", \"個\", \"也\", \"醛\", \"提\", \"始\", \"恃\", \"迪\", \"兔\", \"编\", \"咏\", \"蜀\", \"鹉\", \"运\", \"毯\", \"街\", \"劲\", \"廓\", \"鸦\", \"蜂\", \"坷\", \"奚\", \"羔\", \"老\", \"跳\", \"查\", \"垢\", \"婺\", \"土\", \"获\", \"诗\", \"乓\", \"苒\", \"耿\", \"沉\", \"段\", \"漲\", \"蚁\", \"赃\", \"俪\", \"娛\", \"瞅\", \"贵\", \"渣\", \"坊\", \"觑\", \"號\", \"檬\", \"辄\", \"莘\", \"汕\", \"钧\", \"冶\", \"助\", \"亂\", \"盛\", \"谅\", \"坞\", \"姨\", \"归\", \"央\", \"疴\", \"绑\", \"缘\", \"峙\", \"施\", \"壳\", \"扬\", \"渴\", \"晓\", \"柴\", \"炼\", \"夕\", \"忠\", \"惟\", \"壕\", \"整\", \"敝\", \"莅\", \"珊\", \"鹰\", \"滔\", \"务\", \"吧\", \"叮\", \"碳\", \"尖\", \"雳\", \"P\", \"肇\", \"洁\", \"蹭\", \"鬓\", \"抠\", \"蒿\", \"褂\", \"剐\", \"诉\", \"夭\", \"购\", \"燃\", \"宽\", \"缀\", \"存\", \"诙\", \"祸\", \"槌\", \"梦\", \"索\", \"坪\", \"―\", \"踢\", \"籁\", \"帷\", \"槛\", \"预\", \"旱\", \"缕\", \"绩\", \"ê\", \"暮\", \"柚\", \"纰\", \"骂\", \"锡\", \"掐\", \"颧\", \"溘\", \"涸\", \"雌\", \"进\", \"链\", \"巳\", \"宗\", \"町\", \"茂\", \"阅\", \"溶\", \"八\", \"渝\", \"杜\", \"迹\", \"图\", \"防\", \"亲\", \"薛\", \"觅\", \"聂\", \"抿\", \"橙\", \"蔽\", \"脂\", \"毋\", \"颊\", \"岩\", \"候\", \"云\", \"粹\", \"雍\", \"越\", \"扮\", \"当\", \"佳\", \"趴\", \"类\", \"耀\", \"荫\", \"待\", \"咳\", \"馄\", \"踌\", \"铸\", \"艳\", \"樱\", \"阮\", \"禽\", \"瑧\", \"涅\", \"苇\", \"纽\", \"劾\", \"饥\", \"棕\", \"褒\", \"橘\", \"娩\", \"慈\", \"馈\", \"鸭\", \"趣\", \"咦\", \"报\", \"库\", \"碑\", \"狭\", \"捆\", \"黏\", \"绣\", \"滥\", \"鲁\", \"V\", \"烯\", \"绿\", \"胡\", \"班\", \"旷\", \"卡\", \"们\", \"讦\", \"ό\", \"纨\", \"炝\", \"维\", \"慷\", \"莓\", \"缅\", \"葡\", \"绘\", \"瑶\", \"映\", \"巾\", \"枣\", \"澄\", \"梳\", \"晃\", \"皑\", \"观\", \"锅\", \"魁\", \"俑\", \"贺\", \"牲\", \"顾\", \"众\", \"脉\", \"屠\", \"哥\", \"节\", \"启\", \"盟\", \"撰\", \"塌\", \"烂\", \"颐\", \"胧\", \"厝\", \"\\u0000\", \"坛\", \"摹\", \"侈\", \"遏\", \"匆\", \"磅\", \"鲸\", \"寞\", \"颤\", \"惋\", \"南\", \"御\", \"餐\", \"穷\", \"肪\", \"沼\", \"à\", \"蚊\", \"轰\", \"续\", \"孟\", \"旌\", \"霜\", \"苏\", \"血\", \"必\", \"窗\", \"典\", \"偿\", \"夫\", \"猜\", \"骇\", \"溪\", \"蕃\", \"错\", \"镍\", \"刨\", \"殿\", \"跚\", \"窟\", \""\", \"氯\", \"湃\", \"斩\", \"冥\", \"受\", \"幼\", \"蹒\", \"概\", \"邃\", \"託\", \"蔚\", \"靴\", \"嘴\", \"诡\", \"枯\", \"身\", \"骚\", \"趾\", \"陈\", \"媲\", \"霹\", \"咆\", \"猩\", \"抒\", \"群\", \"厚\", \"园\", \"论\", \"飕\", \"符\", \"鹦\", \"垄\", \"播\", \"搁\", \"脏\", \"幸\", \"执\", \"捷\", \"睛\", \"客\", \"陵\", \"沥\", \"伯\", \"视\", \"喝\", \"愈\", \"柄\", \"耽\", \"促\", \"臧\", \"后\", \"庭\", \"秩\", \"尚\", \"贤\", \"掷\", \"厅\", \"呸\", \"捧\", \"描\", \"吹\", \"惧\", \"皖\", \"凸\", \"昭\", \" \", \"邪\", \"歌\", \"奢\", \"亭\", \"辕\", \"吾\", \"攸\", \"腭\", \"痕\", \"烬\", \"淼\", \"噱\", \"懂\", \"退\", \"拥\", \"渔\", \"灼\", \"蜘\", \"档\", \"睹\", \"瑟\", \"〞\", \"缆\", \"劳\", \"边\", \"辗\", \"內\", \"⑩\", \"唾\", \"僧\", \"醒\", \"螃\", \"张\", \"亏\", \"阁\", \"媚\", \"婉\", \"霈\", \"警\", \"谔\", \"俞\", \".\", \"割\", \"矛\", \"包\", \"晋\", \"焕\", \"忘\", \"恐\", \"式\", \"齐\", \"歹\", \"鄙\", \"独\", \"鲜\", \"村\", \"诧\", \"铭\", \"衣\", \"钊\", \"风\", \"瘀\", \"玳\", \"测\", \"廷\", \"睽\", \"愤\", \"版\", \"遥\", \"钜\", \"锒\", \"糯\", \"抽\", \"牵\", \"还\", \"娃\", \"悖\", \"疆\", \"叛\", \"匪\", \"窝\", \"伐\", \"玖\", \"镕\", \"翼\", \"〈\", \"咔\", \"杉\", \"萤\", \"寐\", \"征\", \"嗤\", \"碧\", \"双\", \"叶\", \"闪\", \"潢\", \"湿\", \"陇\", \"璀\", \"胀\", \"承\", \"鱼\", \"但\", \"唉\", \"讷\", \"侨\", \"旭\", \"亩\", \"黧\", \"夜\", \"已\", \"灸\", \"砌\", \"返\", \"饭\", \"鸿\", \"珏\", \"熨\", \"钝\", \"陀\", \"碾\", \"豚\", \"诟\", \"述\", \"橇\", \"瞪\", \"秀\", \"淞\", \"檀\", \"柏\", \"绵\", \"局\", \"淮\", \"丝\", \"鳌\", \"麽\", \"哦\", \"如\", \"烘\", \"闹\", \"猫\", \"砖\", \"钮\", \"痰\", \"帽\", \"籍\", \"难\", \"列\", \"顶\", \"钟\", \"举\", \"慎\", \"仲\", \"旦\", \"隧\", \"辛\", \"雯\", \"缄\", \"酒\", \"驶\", \"鼻\", \"悟\", \"缸\", \"几\", \"犀\", \"薩\", \"冽\", \"憔\", \"位\", \"未\", \"围\", \"摊\", \"圭\", \"瞄\", \"直\", \"菱\", \"巅\", \"丘\", \"歪\", \"镇\", \"犰\", \"偷\", \"涩\", \"恕\", \"歩\", \"槿\", \"衅\", \"织\", \"支\", \"傲\", \"仪\", \"闻\", \"交\", \"T\", \"庙\", \"梭\", \"修\", \"暗\", \"潜\", \"频\", \"+\", \"守\", \"尔\", \"瞠\", \"软\", \"靛\", \"憾\", \"私\", \"稀\", \"朱\", \"迈\", \"札\", \"校\", \"遐\", \"裔\", \"稣\", \"泌\", \"焙\", \"漪\", \"擤\", \"早\", \"報\", \"害\", \"慰\", \"限\", \"圆\", \"紊\", \"崽\", \"庸\", \"阴\", \"妓\", \"驴\", \"王\", \"飚\", \"磕\", \"抗\", \"淇\", \"息\", \"潇\", \"伟\", \"贞\", \"锐\", \"赞\", \"证\", \"怂\", \"亨\", \"埠\", \"昌\", \"篱\", \"练\", \"眠\", \"鹌\", \"揉\", \"碍\", \"去\", \"讽\", \"圳\", \"果\", \"廉\", \"雾\", \"措\", \"淄\", \"谍\", \"芹\", \"撅\", \"摞\", \"税\", \"妊\", \"烫\", \"涨\", \"怪\", \"课\", \"吕\", \"昧\", \"崩\", \"知\", \"融\", \"愚\", \"假\", \"唤\", \"拽\", \"侍\", \"幽\", \"滋\", \"猾\", \"畔\", \"仑\", \"A\", \"孪\", \"飓\", \"落\", \"任\", \"甸\", \"印\", \"芃\", \"瀑\", \"甲\", \"曹\", \"岸\", \"庐\", \"赶\", \"胃\", \"骑\", \"萨\", \"犹\", \"誓\", \"阐\", \"杨\", \"做\", \"薰\", \"伉\", \"由\", \"翁\", \"郝\", \"昊\", \"韩\", \"励\", \"庇\", \"昕\", \"呼\", \"青\", \"磺\", \"波\", \"焚\", \"棣\", \"丛\", \"于\", \"腾\", \"嘭\", \"罪\", \"喃\", \"懈\", \"麓\", \"寰\", \"璃\", \"夏\", \"怎\", \"棘\", \"配\", \"听\", \"晒\", \"汁\", \"恤\", \"策\", \"奎\", \"腕\", \"葆\", \"驿\", \"橄\", \"氧\", \"嫉\", \"舌\", \"蓦\", \"蓬\", \"占\", \"⑥\", \"悄\", \"闭\", \"唱\", \"酋\", \"步\", \"搂\", \"纤\", \"审\", \"尸\", \"揪\", \"敛\", \"界\", \"吭\", \"芥\", \"菊\", \"毡\", \"嚷\", \"]\", \"戢\", \"莞\", \"戮\", \"衍\", \"兄\", \"宸\", \"〔\", \"诵\", \"V\", \"膜\", \"责\", \"郭\", \"绰\", \"兽\", \"欲\", \"阔\", \"呦\", \"寇\", \"胎\", \"胰\", \"镑\", \"驮\", \"竣\", \"珀\", \"倩\", \"货\", \"疹\", \"刺\", \"茵\", \"拆\", \"\", \"咬\", \"满\", \"咪\", \"患\", \"嫩\", \"梨\", \"旧\", \"丫\", \"谀\", \"窘\", \"吮\", \"艾\", \"彪\", \"汗\", \"幕\", \"6\", \"器\", \"⒁\", \"互\", \"债\", \"寒\", \"两\", \"秉\", \"绉\", \"弈\", \"瞎\", \"杖\", \"锯\", \"窿\", \"皆\", \"转\", \"喇\", \"谋\", \"鸡\", \"彤\", \"侣\", \"似\", \"扔\", \"温\", \"噴\", \"写\", \"蕤\", \"垣\", \"衡\", \"况\", \"吓\", \"晴\", \"崇\", \"匿\", \"童\", \"嚣\", \"⒂\", \"朦\", \"─\", \"纳\", \"辈\", \"ヨ\", \"h\", \"专\", \"俄\", \"咨\", \"词\", \"愿\", \"历\", \"颂\", \"米\", \"升\", \"容\", \"灿\", \"魄\", \"超\", \"痊\", \"抛\", \"胁\", \"纾\", \"悯\", \"答\", \"膝\", \"焯\", \"淤\", \"剥\", \"艇\", \"裳\", \"从\", \"扫\", \"喽\", \"疮\", \"幻\", \"屋\", \"帆\", \"烛\", \"呛\", \"鞠\", \"⑨\", \"〉\", \"莹\", \"裙\", \"當\", \"谷\", \"飘\", \"扒\", \"倡\", \"酷\", \"麟\", \"药\", \"肥\", \"翕\", \"掳\", \"邓\", \"睡\", \"纵\", \"若\", \"诈\", \"蟋\", \"愣\", \"臂\", \"污\", \"逢\", \"扶\", \"嘻\", \"镜\", \"宴\", \"龄\", \"屁\", \"样\", \"漓\", \"逞\", \"浴\", \"峻\", \"逶\", \"熊\", \"疤\", \"動\", \"粪\", \"输\", \"礼\", \"克\", \"砸\", \"缓\", \"傥\", \"泱\", \"著\", \"吉\", \"C\", \"扁\", \"漱\", \"儿\", \"滢\", \"忌\", \"刚\", \"迁\", \"酥\", \"靶\", \"篓\", \"铜\", \"参\", \"楂\", \"攀\", \"盾\", \"夥\", \"矢\", \"捏\", \"俏\", \"⑦\", \"牙\", \"棱\", \"接\", \"犁\", \"楼\", \"并\", \"殆\", \"窍\", \"俺\", \"对\", \"⒌\", \"变\", \"猛\", \"蛮\", \"倚\", \"甚\", \"票\", \"诨\", \"靖\", \"摒\", \"燕\", \"~\", \"徒\", \"癜\", \"徇\", \"褚\", \"乖\", \"隋\", \"嫌\", \"襄\", \"忽\", \"雄\", \"嘿\", \"冻\", \"浠\", \"抚\", \"撐\", \"抬\", \"辰\", \"另\", \"津\", \"抑\", \"倍\", \"据\", \"耳\", \"俨\", \"之\", \"溜\", \"领\", \"瑥\", \"押\", \"膊\", \"曙\", \"久\", \"孱\", \"衫\", \"厦\", \"贼\", \"煞\", \"郡\", \"箱\", \"养\", \"及\", \"兮\", \"臭\", \"爽\", \"笆\", \"邀\", \"戒\", \"贩\", \"邱\", \"氢\", \"痹\", \"覆\", \"往\", \"请\", \"眶\", \"额\", \"脾\", \"快\", \"栖\", \"较\", \"矿\", \"後\", \"阻\", \"碗\", \"蹈\", \"坠\", \"攒\", \"篷\", \"跟\", \"崛\", \"嘱\", \"操\", \"牡\", \"积\", \"梵\", \"锌\", \"眉\", \"佘\", \"姐\", \"惠\", \"湾\", \"汇\", \"韬\", \"旺\", \"s\", \"副\", \"疲\", \"濒\", \"俱\", \"允\", \"设\", \"罢\", \"泣\", \"蘸\", \"言\", \"烃\", \"冉\", \"栅\", \"婴\", \"泪\", \"影\", \"茱\", \"父\", \"B\", \"秤\", \"尽\", \"1\", \"陶\", \"戚\", \"⑤\", \"口\", \"师\", \"诸\", \"捺\", \"努\", \"期\", \"适\", \"喘\", \"岂\", \"驭\", \"亮\", \"姿\", \"伺\", \"奥\", \"侄\", \"伪\", \"曲\", \"阀\", \"〃\", \"畿\", \"补\", \"谭\", \"诲\", \"稍\", \"喊\", \"壶\", \"茅\", \"菁\", \"遣\", \"架\", \"耕\", \"惬\", \"达\", \"旅\", \"郊\", \"婊\", \"酸\", \"蝌\", \"惕\", \"肺\", \"玉\", \"谊\", \"卻\", \"谁\", \"铄\", \"洼\", \"痒\", \"泡\", \"想\", \"萌\", \"黑\", \"挚\", \"Y\", \"麻\", \"垂\", \"农\", \"弱\", \"蛋\", \"除\", \"沛\", \"空\", \"脱\", \"ズ\", \"异\", \"赫\", \"脚\", \"淘\", \"疸\", \"看\", \"先\", \"帖\", \"酣\", \"栩\", \"é\", \"矫\", \"邢\", \"陷\", \"细\", \"碴\", \"款\", \"屿\", \"纲\", \"盖\", \"凌\", \"桢\", \"营\", \"喧\", \"繁\", \"黎\", \"蟑\", \"蘑\", \"宛\", \"闲\", \"簿\", \"⑿\", \"跻\", \"翔\", \"笋\", \"瓢\", \"徨\", \"哇\", \"士\", \"虹\", \"泰\", \"他\", \"铺\", \"奸\", \"翘\", \"瑑\", \"網\", \"红\", \"巍\", \"强\", \"猖\", \"∶\", \"吨\", \"乒\", \"辨\", \"氏\", \"饲\", \"隐\", \"罕\", \"揍\", \"翩\", \"换\", \"畑\", \"丑\", \"嫁\", \"荐\", \"邂\", \"闺\", \"挫\", \"邮\", \"援\", \"稿\", \"河\", \"泼\", \"鼓\", \"岁\", \"恋\", \"鹏\", \"暂\", \"聘\", \"甬\", \"為\", \"e\", \"烤\", \"谜\", \"僻\", \"舀\", \"差\", \"顷\", \"破\", \"芋\", \"租\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/ar": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1422976,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"…\", \"\", \"\", \"ﷺ\", \"\", \"\", \"
\", \"�\", \"ﻹ\", \"\", \"ﻻ\", \"ﻷ\", \"½\", \"″\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/de": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 680512,
"_n_chars": 1784021,
"_n_oov_chars": 497,
"oov_ratio": 0.00027858416464828607,
"_oov_charset": "[\"…\", \"\", \"\", \"¹\", \"²\", \"´\", \"�\", \"™\", \"½\", \" \", \"¼\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/en": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 280108,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"…\", \"\", \"⑦\", \"‑\", \"③\", \"⑧\", \"´\", \"�\", \"⑩\", \"⑤\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/es": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 585804,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"º\", \"²\", \"´\", \"\", \"ª\", \"″\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/fa": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1142057,
"_n_chars": 1145876,
"_n_oov_chars": 7649,
"oov_ratio": 0.006675242347339502,
"_oov_charset": "[\"…\", \"\", \"\", \"ﮧ\", \"\", \"\", \"�\", \"\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/fr": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 540430,
"_n_chars": 1484970,
"_n_oov_chars": 839,
"oov_ratio": 0.0005649945790150643,
"_oov_charset": "[\"…\", \"µ\", \"²\", \"´\", \"�\", \"™\", \"℃\", \"″\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/ja": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 591656,
"_n_chars": 603065,
"_n_oov_chars": 3351,
"oov_ratio": 0.0055566149585865535,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"\\b\", \"|\", \"ハ\", \"]\", \"�\", \"\", \"ィ\", \"F\", \"-\", \"②\", \"S\", \"Q\", \"$\", \"R\", \">\", \"①\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"n\", \"T\", \"X\", \"、\", \"g\", \"`\", \"/\", \"@\", \"s\", \"M\", \"「\", \"\\u001b\", \"´\", \"‼\", \"P\", \"<\", \"+\", \"H\", \"I\", \"a\", \"h\", \"コ\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \" ̄\", \"w\", \"l\", \"d\", \";\", \")\", \"[\", \"Ⅱ\", \"W\", \"y\", \"b\", \"℃\", \"ヨ\", \"」\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"テ\", \"゚\", \"J\", \"*\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \".\", \"C\", \"ウ\", \"ア\", \"‥\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"t\", \"m\", \"リ\", \"L\", \"ー\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"\\", \"⑧\", \"A\", \"&\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/ko": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 639258,
"_n_chars": 655190,
"_n_oov_chars": 1330,
"oov_ratio": 0.002029945511988889,
"_oov_charset": "[\"%\", \"⑥\", \"Ⅳ\", \"㉣\", \"立\", \"|\", \"樂\", \"ㅈ\", \"�\", \"ㅟ\", \"ㅋ\", \"ㅍ\", \"㎡\", \"ㅎ\", \"\", \"ㆍ\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \"①\", \"ㅜ\", \"ㄹ\", \"\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"v\", \"識\", \"ㅆ\", \"s\", \"@\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"Ⅰ\", \"ㅅ\", \"⑤\", \"ㄱ\", \"累\", \"樂\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"ㅕ\", \"ㅛ\", \"ㅏ\", \"龍\", \"㉰\", \"Ⅱ\", \"ㅓ\", \"⑨\", \"℃\", \"」\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"ㅐ\", \"⑵\", \"ㅔ\", \"良\", \"ㅚ\", \"*\", \"㎍\", \"理\", \"梁\", \"Ⅲ\", \"陸\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"ㅝ\", \"¹\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"ㅖ\", \"⑦\", \"\", \"金\", \"ⅱ\", \"Ⅹ\", \"⑧\", \"ㅊ\", \"女\", \"Ⅵ\", \"ㅢ\"]",
"lossless": false
},
"baichuan-inc/Baichuan-7B @ cc100/zh-Hans": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 626117,
"_n_chars": 927311,
"_n_oov_chars": 24162,
"oov_ratio": 0.026055983375588124,
"_oov_charset": "[\"…\", \"%\", \".\", \"⑸\", \"⑥\", \""\", \"⒋\", \"_\", \"⑷\", \"③\", \"d\", \"C\", \"p\", \"・\", \"⑶\", \"\\b\", \"n\", \" \", \";\", \"T\", \")\", \"[\", \"⒁\", \"/\", \"t\", \"]\", \"�\", \"\\u0006\", \"⑨\", \"s\", \"℃\", \"\\u0005\", \"\", \"⑦\", \"\\u0007\", \"-\", \"i\", \"②\", \" \", \"o\", \"⑩\", \"⑴\", \"⑤\", \"V\", \"+\", \"⒌\", \"⒃\", \"e\", \"⒀\", \"⒂\", \"①\", \"A\", \"⑧\", \"a\", \"&\", \"\", \"h\", \"r\", \"D\", \"⑿\", \"(\", \"N\", \"④\"]",
"lossless": false
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/ar": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 2813283,
"_n_tokens": 1337285,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/de": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1814876,
"_n_tokens": 628063,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/en": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1124813,
"_n_tokens": 269011,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/es": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1664455,
"_n_tokens": 551326,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/fa": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 2054052,
"_n_tokens": 1052077,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/fr": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1540504,
"_n_tokens": 512313,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/ja": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1774770,
"_n_tokens": 554936,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/ko": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1524839,
"_n_tokens": 623358,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/zh-Hans": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 2633047,
"_n_tokens": 541464,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/ar": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 2813283,
"_n_tokens": 427489,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/de": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1814876,
"_n_tokens": 541170,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/en": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1124813,
"_n_tokens": 257405,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/es": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1664455,
"_n_tokens": 350793,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/fa": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 2054052,
"_n_tokens": 434406,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/fr": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1540504,
"_n_tokens": 321639,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/ja": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1774770,
"_n_tokens": 523592,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/ko": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1524839,
"_n_tokens": 742111,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"bigscience/bloom @ cc100/zh-Hans": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 2633047,
"_n_tokens": 573008,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"ckiplab/gpt2-base-chinese @ cc100/ar": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 2813283,
"_n_tokens": 597677,
"_n_chars": 1560987,
"_n_oov_chars": 308846,
"oov_ratio": 0.19785302504120791,
"_oov_charset": "[\"﴾\", \"😀\", \"–\", \"ِ\", \"إ\", \"”\", \"R\", \"ـ\", \"�\", \"V\", \"J\", \"\", \"ھ\", \"چ\", \"C\", \"\", \"٩\", \"à\", \"ُ\", \"\", \"ک\", \"؛\", \"W\", \"ث\", \"ق\", \"\", \"ﻻ\", \"ز\", \"ﻷ\", \"ج\", \"…\", \"
\", \"ف\", \"‘\", \"ص\", \"U\", \"ﷺ\", \"ۚ\", \"’\", \"â\", \"٪\", \"I\", \"😊\", \"ٱ\", \"،\", \"٣\", \"۸\", \"B\", \"E\", \"Z\", \"T\", \"ۗ\", \"ی\", \"½\", \"ذ\", \"ح\", \"۲\", \"M\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"﴿\", \"L\", \"ئ\", \"P\", \"ْ\", \"Х\", \"ί\", \"ٌ\", \"“\", \"۰\", \"خ\", \"H\", \"٠\", \"ۖ\", \"ؤ\", \"١\", \"ض\", \"Y\", \"أ\", \"َ\", \"¡\", \"٨\", \"؟\", \"K\", \"é\", \"ۤ\", \"ﻹ\", \"آ\", \"ظ\", \"🙂\", \"X\", \"⤴\", \"ء\", \"F\", \"S\", \"۷\", \"ή\", \"D\", \"ٹ\", \"A\", \"ٰ\", \"N\", \"ى\", \"G\", \"—\", \"غ\", \"٢\", \"Q\", \"ö\", \"٦\", \"\", \" \", \"O\", \"ط\", \"پ\", \"ً\", \"ٍ\", \"ّ\", \"ä\", \"٧\", \"↩\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/de": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1814876,
"_n_tokens": 766497,
"_n_chars": 1784021,
"_n_oov_chars": 112920,
"oov_ratio": 0.06329521905852005,
"_oov_charset": "[\"😀\", \"û\", \"–\", \"è\", \"č\", \"”\", \"R\", \"�\", \"ė\", \"V\", \"🙁\", \"J\", \"\", \"ó\", \"C\", \"¿\", \"🙄\", \"á\", \"‐\", \"ā\", \"ń\", \"ć\", \"à\", \"W\", \"\", \"İ\", \"̈\", \"ô\", \"…\", \"😉\", \"‘\", \"U\", \"Ü\", \"’\", \"â\", \"I\", \"Á\", \"Ö\", \"B\", \"E\", \"Z\", \"´\", \"T\", \"\", \"½\", \"M\", \"š\", \"ç\", \"L\", \"Ø\", \"Ä\", \"P\", \"ί\", \"œ\", \"“\", \"H\", \"≠\", \"ư\", \" \", \"Y\", \"`\", \"\", \"ï\", \"😃\", \"‽\", \"K\", \"➔\", \"é\", \"😈\", \"🙂\", \"X\", \"F\", \"S\", \"ü\", \"¬\", \"D\", \"ớ\", \"😆\", \"A\", \"😢\", \"N\", \"å\", \"\", \"G\", \"Ã\", \"—\", \"Q\", \"É\", \"ö\", \"¶\", \"\", \"😦\", \"Ÿ\", \"O\", \"\", \"‚\", \"ú\", \"ä\", \"↩\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/en": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1124813,
"_n_tokens": 372641,
"_n_chars": 1121360,
"_n_oov_chars": 32716,
"oov_ratio": 0.02917528715131626,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"😉\", \"‘\", \"“\", \"\", \"–\", \"è\", \"H\", \"U\", \"G\", \"—\", \"¦\", \"”\", \"‑\", \"R\", \"Y\", \"’\", \"Q\", \"😥\", \"�\", \"¡\", \"ï\", \"ñ\", \"I\", \"\", \"V\", \"J\", \"\", \"\", \"K\", \"ó\", \"B\", \"E\", \"é\", \"Z\", \"C\", \"´\", \"T\", \"O\", \"🙂\", \"X\", \"M\", \"F\", \"S\", \"W\", \"D\", \"L\", \"\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/es": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1664455,
"_n_tokens": 683390,
"_n_chars": 1630297,
"_n_oov_chars": 71320,
"oov_ratio": 0.043746630215230724,
"_oov_charset": "[\"A\", \"…\", \"😀\", \"▷\", \"Ú\", \"N\", \"P\", \"😉\", \"Ñ\", \"‘\", \"М\", \"“\", \"\", \"–\", \"è\", \"H\", \"U\", \"G\", \"—\", \"👏\", \"”\", \"í\", \"―\", \"R\", \"Y\", \"Ó\", \"Q\", \"’\", \"É\", \"ö\", \"\", \"¡\", \"ñ\", \"I\", \"ª\", \"️\", \"Á\", \"V\", \"🙁\", \"J\", \"K\", \"ó\", \"✓\", \"é\", \"E\", \"B\", \"´\", \"C\", \"Z\", \"😦\", \"T\", \"O\", \"á\", \"¿\", \"X\", \"🙂\", \"ò\", \"ý\", \"M\", \"à\", \"F\", \"S\", \"ú\", \"ü\", \"W\", \"D\", \"\", \"\", \"L\", \"Í\", \"\", \"ô\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/fa": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 2054052,
"_n_tokens": 386174,
"_n_chars": 1145876,
"_n_oov_chars": 272812,
"oov_ratio": 0.2380816074339632,
"_oov_charset": "[\"۹\", \"–\", \"ۆ\", \"ِ\", \"إ\", \"”\", \"R\", \"ـ\", \"�\", \"V\", \"J\", \"\", \"ھ\", \"چ\", \"C\", \"ב\", \"٩\", \"ُ\", \"\", \"ک\", \"؛\", \"۶\", \"۴\", \"W\", \"ث\", \"ق\", \"\", \"ز\", \"ج\", \"ט\", \"…\", \"ف\", \"‘\", \"۔\", \"ژ\", \"\", \"ص\", \"U\", \"ۀ\", \"ے\", \"’\", \"ڪ\", \"٪\", \"۳\", \"I\", \"️\", \"،\", \"٣\", \"۸\", \"B\", \"E\", \"Z\", \"T\", \"ی\", \"ذ\", \"ح\", \"۲\", \"M\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"L\", \"٫\", \"ئ\", \"P\", \"ْ\", \"ٌ\", \"“\", \"۰\", \"خ\", \"H\", \"٠\", \"ٴ\", \"ؤ\", \"Y\", \"ض\", \"١\", \"أ\", \"َ\", \"\", \"٨\", \"؟\", \"K\", \"ٔ\", \"آ\", \"ظ\", \"X\", \"▐\", \"ء\", \"F\", \"S\", \"۷\", \"D\", \"A\", \"N\", \"ى\", \"۵\", \"G\", \"غ\", \"۱\", \"٢\", \"Q\", \"◄\", \"گ\", \"\", \"ּ\", \" \", \"O\", \"ط\", \"پ\", \"ً\", \"ٍ\", \"ﮧ\", \"ّ\", \"٧\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/fr": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1540504,
"_n_tokens": 616442,
"_n_chars": 1484970,
"_n_oov_chars": 74085,
"oov_ratio": 0.049889896765591225,
"_oov_charset": "[\"A\", \"…\", \"😀\", \"Ê\", \"N\", \"P\", \"😉\", \"̂\", \"û\", \"♕\", \"
\", \"ù\", \"̧\", \"‘\", \"œ\", \"Ç\", \"“\", \"–\", \"è\", \"H\", \"ğ\", \"U\", \"G\", \"—\", \"🤔\", \"Â\", \"”\", \"í\", \"―\", \"È\", \"R\", \"Y\", \"’\", \"Q\", \"î\", \"â\", \"É\", \"�\", \"\", \"ï\", \"ê\", \"I\", \"ë\", \"V\", \"J\", \"K\", \"Î\", \"B\", \"é\", \"E\", \"Z\", \"C\", \"´\", \"ã\", \"T\", \"O\", \"🙂\", \"‐\", \"X\", \"M\", \"à\", \"Ô\", \"F\", \"S\", \"ü\", \"ç\", \"W\", \"ä\", \"À\", \"D\", \"L\", \"\", \"ô\", \"́\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/ja": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1774770,
"_n_tokens": 483085,
"_n_chars": 603065,
"_n_oov_chars": 53110,
"oov_ratio": 0.08806679213683434,
"_oov_charset": "[\"⑪\", \"戯\", \"G\", \"繊\", \"だ\", \"鋭\", \"–\", \"\\b\", \"摂\", \"俵\", \"ハ\", \"◯\", \"”\", \"噛\", \"😭\", \"R\", \"欝\", \"が\", \"�\", \"騒\", \"錬\", \"喩\", \"V\", \"勲\", \"J\", \"訃\", \"\", \"犠\", \"惣\", \"轢\", \"F\", \"ィ\", \"プ\", \"⇔\", \"暦\", \"C\", \"繍\", \"S\", \"‐\", \"痩\", \"鶏\", \"😌\", \"Q\", \"ド\", \"斉\", \"R\", \"囁\", \"W\", \"曽\", \"パ\", \"\", \"逡\", \"ご\", \"〟\", \"ガ\", \"砕\", \"罠\", \"ゼ\", \"̈\", \"で\", \"…\", \"レ\", \"ぎ\", \"▷\", \"ゥ\", \"縦\", \"ㅂ\", \"ゎ\", \"ピ\", \"〆\", \"ぱ\", \"ぽ\", \"頬\", \"げ\", \"桟\", \"呑\", \"U\", \"捗\", \"U\", \"ぞ\", \"T\", \"ゴ\", \"X\", \"’\", \"讃\", \"ベ\", \"粋\", \"\", \"髭\", \"ゲ\", \"謳\", \"Д\", \"M\", \"デ\", \"I\", \"😊\", \"縞\", \"猟\", \"ボ\", \"じ\", \"\\u001b\", \"捜\", \"B\", \"E\", \"醤\", \"Z\", \"´\", \"‼\", \"T\", \"P\", \"疎\", \"づ\", \"拝\", \"M\", \"殻\", \"躾\", \"遡\", \"ペ\", \"纒\", \"H\", \"辿\", \"蝋\", \"I\", \"ブ\", \"呟\", \"懐\", \"グ\", \"✧\", \"L\", \"渕\", \"コ\", \"㎞\", \"拠\", \"́\", \"拶\", \"E\", \"陥\", \"匂\", \"壌\", \"P\", \"∇\", \"ぷ\", \"ぶ\", \"ぐ\", \"枠\", \"掻\", \"韮\", \"“\", \"顕\", \"︎\", \"ダ\", \"H\", \"袴\", \"び\", \"暁\", \"ぜ\", \"ゞ\", \"―\", \"漑\", \"Ⅱ\", \"゚\", \"Y\", \"`\", \"麹\", \"W\", \"渓\", \"ズ\", \"峠\", \"̀\", \"バ\", \"ヨ\", \"⻑\", \"渇\", \"ぴ\", \"覗\", \"瘻\", \"K\", \"剰\", \"ポ\", \"ヘ\", \" \", \"メ\", \"挿\", \"艶\", \"穏\", \"鞄\", \"ヵ\", \"ど\", \"噂\", \"Ⅶ\", \"X\", \"ぼ\", \"贔\", \"謡\", \"ば\", \"ぅ\", \"兎\", \"屓\", \"揺\", \"テ\", \"﨑\", \"F\", \"J\", \"S\", \"黙\", \"D\", \"ロ\", \"藁\", \"Z\", \"D\", \"N\", \"贋\", \"A\", \"艸\", \"😢\", \"ギ\", \"N\", \"娯\", \"ざ\", \"酔\", \"缶\", \"◡\", \"鋲\", \"釈\", \"C\", \"ウ\", \"飴\", \"G\", \"ア\", \"—\", \"ゾ\", \"賛\", \"K\", \"Y\", \"B\", \"Q\", \"醸\", \"讐\", \"ず\", \"ぉ\", \"梱\", \"🌙\", \"妬\", \"鉢\", \"彡\", \"ヴ\", \"ジ\", \"繰\", \"リ\", \"゙\", \"奨\", \"詈\", \"L\", \"O\", \"簗\", \"舘\", \"V\", \"蛍\", \"汚\", \"廻\", \"Ⅹ\", \"筈\", \"ビ\", \"ザ\", \"べ\", \"饉\", \"鉱\", \"A\", \"澪\", \"巣\", \"ヾ\", \"砦\", \"カ\", \"O\", \"💦\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/ko": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1524839,
"_n_tokens": 1035974,
"_n_chars": 655190,
"_n_oov_chars": 441054,
"oov_ratio": 0.6731696149208627,
"_oov_charset": "[\"먼\", \"ᴇ\", \"셔\", \"버\", \"증\", \"량\", \"웅\", \"석\", \"옆\", \"깽\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"C\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"댈\", \"녀\", \"남\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"챙\", \"필\", \"呪\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"콘\", \"홈\", \"험\", \"분\", \"직\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"콥\", \"쬐\", \"듬\", \"쫓\", \"봄\", \"ㅣ\", \"교\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"육\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"▒\", \"♧\", \"점\", \"똑\", \"것\", \"새\", \"곰\", \"룹\", \"🚨\", \"🗺\", \"㎍\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"틀\", \"봉\", \"왠\", \"섦\", \"겁\", \"낀\", \"혁\", \"판\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"롱\", \"얏\", \"팍\", \"힉\", \"댔\", \"쌍\", \"높\", \"쾅\", \"굽\", \"더\", \"줏\", \"보\", \"긍\", \"쌈\", \"폿\", \"닳\", \"닷\", \"젝\", \"겨\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"츠\", \"텔\", \"💣\", \"🔹\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"챗\", \"\", \"궜\", \"낳\", \"꺽\", \"맥\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"융\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"웍\", \"K\", \"퀸\", \"뀔\", \"면\", \"X\", \"끄\", \"할\", \"홋\", \"뗀\", \"툼\", \"흐\", \"룩\", \"ㅇ\", \"문\", \"슷\", \"不\", \"왓\", \"믹\", \"탐\", \"엎\", \"계\", \"퀘\", \"라\", \"◐\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"맵\", \"킹\", \"광\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"틋\", \"헛\", \"머\", \"염\", \"겔\", \"째\", \"밌\", \"콩\", \"♤\", \"쉬\", \"놨\", \"궈\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"\", \"월\", \"U\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"E\", \"귤\", \"쏠\", \"릭\", \"헌\", \"🙋\", \"앗\", \"코\", \"L\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"외\", \"노\", \"쥐\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"삣\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"훼\", \"척\", \"쵸\", \"🍟\", \"ㅙ\", \"재\", \"충\", \"왔\", \"떳\", \"떻\", \"채\", \"삘\", \"얽\", \"웬\", \"찌\", \"➍\", \"주\", \"푸\", \"맺\", \"🏫\", \"찮\", \"템\", \"立\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"◀\", \"펼\", \"◈\", \"휠\", \"류\", \"냐\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"잇\", \"뇌\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"▣\", \"칼\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"ㄱ\", \"닮\", \"싼\", \"동\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"춰\", \"뇨\", \"훔\", \"차\", \"꾀\", \"갇\", \"챨\", \"돼\", \"네\", \"S\", \"헤\", \"D\", \"껑\", \"샹\", \"퀵\", \"푹\", \"튀\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"렇\", \"ㅝ\", \"테\", \"핍\", \"헨\", \"창\", \"🍔\", \"곳\", \"포\", \"걱\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"궐\", \"릉\", \"힜\", \"퓰\", \"쳤\", \"꿈\", \"ã\", \"술\", \"꼭\", \"향\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"뻤\", \"땐\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"투\", \"ᴍ\", \"Ⅰ\", \"응\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"깨\", \"잘\", \"롤\", \"화\", \"넵\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"캘\", \"폰\", \"곤\", \"🥁\", \"개\", \"윗\", \"ʏ\", \"축\", \"Q\", \"듀\", \"봅\", \"◦\", \"밟\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"협\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"💦\", \"올\", \"취\", \"켰\", \"틱\", \"”\", \"흰\", \"민\", \"�\", \"쌀\", \"흗\", \"예\", \"밍\", \"캉\", \"넛\", \"돗\", \"숏\", \"걀\", \"득\", \"🌵\", \"밭\", \"팠\", \"쁜\", \"륜\", \"균\", \"💕\", \"덜\", \"쪄\", \"️\", \"🤗\", \"긋\", \"력\", \"ㅅ\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"🍰\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"헬\", \"졸\", \"엣\", \"칠\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"N\", \"넥\", \"냥\", \"—\", \"젠\", \"뻑\", \"닙\", \"탱\", \"뜩\", \"씩\", \"있\", \"믐\", \"들\", \"켄\", \"았\", \"뮐\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"잔\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"ㅎ\", \"빅\", \"쿨\", \"뒷\", \"쨍\", \"🙆\", \"쾨\", \"침\", \"🚿\", \"요\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"ㄴ\", \"윤\", \"짧\", \"년\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"얍\", \"🏻\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"Z\", \"듣\", \"찔\", \"켓\", \"열\", \"즌\", \"태\", \"樂\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"습\", \"럭\", \"H\", \"랙\", \"길\", \"탬\", \"잤\", \" \", \"줌\", \"딱\", \"장\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"과\", \"꿕\", \"였\", \"G\", \"위\", \"숙\", \"횡\", \"쎄\", \"둡\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"넘\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"관\", \"뜻\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"J\", \"촌\", \"뮌\", \"빌\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"W\", \"ㄹ\", \"꼬\", \"핏\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"쒀\", \"공\", \"🙇\", \"토\", \"죄\", \"골\", \"쁘\", \"빔\", \"뾱\", \"ç\", \"준\", \"슴\", \"쩍\", \"얄\", \"퓨\", \"뚝\", \"킥\", \"벽\", \"➋\", \"데\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"짱\", \"펙\", \"댁\", \"슬\", \"쁨\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"靑\", \"내\", \"陸\", \"줍\", \"톱\", \"온\", \"킁\", \"을\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"끔\", \"뀐\", \"덟\", \"합\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"🍭\", \"펠\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"덧\", \"띈\", \"혈\", \"썅\", \"훠\", \"탄\", \"두\", \"꽂\", \"…\", \"쏘\", \"궁\", \"‘\", \"팽\", \"톡\", \"🦄\", \"져\", \"칫\", \"I\", \"돈\", \"탕\", \"삶\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"쓴\", \"벳\", \"틈\", \"빕\", \"옷\", \"턴\", \"❍\", \"폼\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"멋\", \"삿\", \"틔\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"F\", \"썹\", \"➏\", \"놈\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"좌\", \"쿠\", \"떠\", \"낮\", \"굉\", \"터\", \"🤟\", \"닥\", \"략\", \"딸\", \"ɪ\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"툴\", \"램\", \"앎\", \"M\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"찢\", \"뺀\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"에\", \"좋\", \"O\", \"벤\", \"뚜\", \"택\", \"운\", \"뛸\", \"얼\", \"벙\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"고\", \"했\", \"퍽\", \"뮬\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"켜\", \"꽝\", \"😱\", \"왜\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"깡\", \"숍\", \"컵\", \"얻\", \"닐\", \"🤕\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"옮\", \"펩\", \"맑\", \"혀\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"캣\", \"鎭\", \"`\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"쯔\", \"결\", \"엇\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"표\", \"몹\", \"\", \"담\", \"뽑\", \"희\", \"픽\", \"랫\", \"생\", \"확\", \"번\", \"Ⅹ\", \"며\", \"힌\", \"텝\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"킬\", \"씽\", \"😭\", \"R\", \"맬\", \"기\", \"팡\", \"핥\", \"및\", \"맨\", \"큰\", \"륨\", \"훈\", \"렛\", \"펑\", \"효\", \"볕\", \"흙\", \"각\", \"체\", \"링\", \"벼\", \"륵\", \"콰\", \"槪\", \"꿰\", \"탑\", \"빤\", \"타\", \"국\", \"많\", \"卽\", \"낸\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"샴\", \"P\", \"쫑\", \"읽\", \"앞\", \"늬\", \"츈\", \"픈\", \"―\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"ᴛ\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"히\", \"씌\", \"욜\", \"풀\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"샬\", \"덤\", \"멍\", \"튄\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"⑹\", \"곁\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"멘\", \"👏\", \"감\", \"識\", \"텨\", \"😊\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"모\", \"빴\", \"켈\", \"릿\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"럿\", \"엽\", \"숟\", \"브\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"쿵\", \"\", \"췄\", \"질\", \"햇\", \"춘\", \"쿼\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"홍\", \"시\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"껴\", \"곱\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"료\", \"형\", \"뮤\", \"랐\", \"족\", \"울\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"T\", \"닌\", \"累\", \"후\", \"늑\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"웨\", \"휙\", \"당\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"푼\", \"워\", \"💰\", \"싯\", \"A\", \"먹\", \"🍞\", \"굴\", \"뭔\", \"핑\", \"받\", \"찍\", \"숲\", \"피\", \"듐\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"☎\", \"가\", \" \", \"널\", \"콤\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"😣\", \"정\", \"꼴\", \"쭙\", \"–\", \"떴\", \"규\", \"군\", \"줬\", \"樂\", \"앱\", \"V\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"루\", \"ㅞ\", \"뻐\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"밤\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"❏\", \"잼\", \"쭈\", \"컸\", \"쫄\", \"몸\", \"“\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"\", \"란\", \"몽\", \"넓\", \"혐\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"💅\", \"됬\", \"멀\", \"든\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"유\", \"서\", \"누\", \"삐\", \"쿰\", \"된\", \"처\", \"💥\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"’\", \"휩\", \"훑\", \"황\", \"역\", \"웠\", \"셰\", \"렬\", \"B\", \"눕\", \"씻\", \"익\", \"찼\", \"얇\", \"팀\", \"펄\", \"뷔\", \"진\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"룸\", \"뉴\", \"跏\", \"괌\", \"팔\", \"Y\", \"샐\", \"독\", \"꿍\", \"춥\", \"㉿\", \"얹\", \"자\", \"끼\", \"땠\", \"ㅐ\", \"린\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"뿜\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"뎅\", \"넨\", \"ʟ\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"ckiplab/gpt2-base-chinese @ cc100/zh-Hans": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 2633047,
"_n_tokens": 879506,
"_n_chars": 927311,
"_n_oov_chars": 34029,
"oov_ratio": 0.0366964265494532,
"_oov_charset": "[\"浠\", \"ù\", \"牖\", \"–\", \"\\b\", \"鄯\", \"瑥\", \"篢\", \"”\", \"龇\", \"R\", \"逑\", \"î\", \"黩\", \"�\", \"戢\", \"旆\", \"\", \"V\", \"J\", \"\", \"\\u0000\", \"\", \"C\", \"韫\", \"á\", \"à\", \"穰\", \"犟\", \"ὐ\", \"W\", \"\", \"…\", \"浞\", \"‘\", \"黢\", \"U\", \"狳\", \"\", \"T\", \"倨\", \"⒁\", \"绉\", \"’\", \"\", \"I\", \"屣\", \"犰\", \"阽\", \"瑢\", \"镏\", \"疴\", \"B\", \"E\", \"Z\", \"岣\", \"T\", \"鸩\", \"\", \"M\", \"⒃\", \"⒂\", \"瑒\", \"ç\", \"L\", \"Ø\", \"旳\", \"擤\", \"P\", \"馕\", \"“\", \"韪\", \"H\", \"鲎\", \" \", \"―\", \"Y\", \"`\", \"ズ\", \"ê\", \"ě\", \"K\", \"溘\", \"é\", \" \", \"X\", \"F\", \"⒀\", \"S\", \"D\", \"D\", \"⑿\", \"N\", \"翕\", \"A\", \"N\", \"耩\", \"C\", \"G\", \"瑑\", \"—\", \"瑧\", \"Q\", \"锒\", \"ㄓ\", \"\\u0006\", \"猡\", \"\", \"\\u0005\", \"瑨\", \"\\u0007\", \"鼯\", \"O\", \"啐\", \"V\", \"⒌\", \"诨\", \"讦\", \"ό\", \"A\", \"炝\", \"黧\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/ar": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 2813283,
"_n_tokens": 601762,
"_n_chars": 1560987,
"_n_oov_chars": 308495,
"oov_ratio": 0.1976281673069667,
"_oov_charset": "[\"﴾\", \"😀\", \"–\", \"ِ\", \"إ\", \"”\", \"R\", \"ـ\", \"�\", \"V\", \"J\", \"\", \"ھ\", \"چ\", \"©\", \"C\", \"\", \"٩\", \"à\", \"ُ\", \"\", \"ک\", \"؛\", \"↩\", \"W\", \"ث\", \"ق\", \"\", \"ﻻ\", \"ز\", \"ﻷ\", \"ج\", \"…\", \"
\", \"ف\", \"ص\", \"U\", \"ﷺ\", \"ۚ\", \"’\", \"â\", \"٪\", \"I\", \"😊\", \"ٱ\", \"،\", \"٣\", \"۸\", \"B\", \"E\", \"Z\", \"T\", \"ۗ\", \"ی\", \"½\", \"ذ\", \"ح\", \"۲\", \"M\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"﴿\", \"L\", \"ئ\", \"P\", \"ْ\", \"Х\", \"ί\", \"ٌ\", \"▪\", \"۰\", \"خ\", \"H\", \"٠\", \"ۖ\", \"ؤ\", \"١\", \"ض\", \"Y\", \"أ\", \"َ\", \"¡\", \"٨\", \"؟\", \"K\", \"é\", \"ۤ\", \"ﻹ\", \"آ\", \"ظ\", \"🙂\", \"X\", \"⤴\", \"ء\", \"F\", \"S\", \"۷\", \"ή\", \"D\", \"ٹ\", \"A\", \"ٰ\", \"N\", \"ى\", \"G\", \"—\", \"غ\", \"٢\", \"Q\", \"ö\", \"٦\", \"\", \" \", \"O\", \"ط\", \"پ\", \"ً\", \"ٍ\", \"▫\", \"ّ\", \"♥\", \"ä\", \"٧\", \"®\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/de": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1814876,
"_n_tokens": 895612,
"_n_chars": 1784021,
"_n_oov_chars": 112169,
"oov_ratio": 0.06287425988819638,
"_oov_charset": "[\"😀\", \"û\", \"–\", \"è\", \"č\", \"”\", \"R\", \"�\", \"ė\", \"V\", \"🙁\", \"J\", \"\", \"ó\", \"©\", \"C\", \"¿\", \"🙄\", \"á\", \"‐\", \"ā\", \"ń\", \"ć\", \"à\", \"W\", \"\", \"İ\", \"̈\", \"ô\", \"…\", \"😉\", \"U\", \"Ü\", \"’\", \"☺\", \"â\", \"I\", \"Á\", \"♦\", \"Ö\", \"B\", \"E\", \"Z\", \"´\", \"T\", \"\", \"½\", \"M\", \"š\", \"ç\", \"L\", \"Ø\", \"Ä\", \"P\", \"ί\", \"œ\", \"™\", \"H\", \"≠\", \"ư\", \" \", \"Y\", \"`\", \"\", \"ï\", \"😃\", \"‽\", \"K\", \"➔\", \"é\", \"😈\", \"🙂\", \"X\", \"F\", \"S\", \"ü\", \"¬\", \"D\", \"ớ\", \"😆\", \"A\", \"😢\", \"N\", \"❤\", \"å\", \"\", \"G\", \"Ã\", \"—\", \"Q\", \"É\", \"ö\", \"¶\", \"\", \"😦\", \"Ÿ\", \"😂\", \"O\", \"\", \"‚\", \"♥\", \"ú\", \"ä\", \"↩\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/en": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1124813,
"_n_tokens": 563058,
"_n_chars": 1121360,
"_n_oov_chars": 32541,
"oov_ratio": 0.029019226653349505,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"😉\", \"\", \"–\", \"è\", \"H\", \"U\", \"G\", \"—\", \"¦\", \"”\", \"‑\", \"R\", \"Y\", \"’\", \"Q\", \"😥\", \"�\", \"¡\", \"ï\", \"ñ\", \"I\", \"\", \"V\", \"J\", \"\", \"\", \"K\", \"ó\", \"B\", \"E\", \"é\", \"Z\", \"C\", \"´\", \"T\", \"O\", \"🙂\", \"X\", \"M\", \"F\", \"S\", \"W\", \"D\", \"L\", \"\", \"®\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/es": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1664455,
"_n_tokens": 846564,
"_n_chars": 1630297,
"_n_oov_chars": 70604,
"oov_ratio": 0.0433074464346067,
"_oov_charset": "[\"A\", \"…\", \"😀\", \"▷\", \"Ú\", \"N\", \"P\", \"😉\", \"❤\", \"😦\", \"Ñ\", \"М\", \"\", \"–\", \"è\", \"H\", \"U\", \"G\", \"—\", \"👏\", \"”\", \"í\", \"―\", \"R\", \"Y\", \"Ó\", \"Q\", \"’\", \"É\", \"ö\", \"\", \"¡\", \"ñ\", \"I\", \"ª\", \"️\", \"Á\", \"V\", \"✖\", \"🙁\", \"J\", \"K\", \"ó\", \"✓\", \"©\", \"é\", \"E\", \"B\", \"´\", \"C\", \"Z\", \"✔\", \"T\", \"O\", \"á\", \"¿\", \"X\", \"🙂\", \"ò\", \"ý\", \"M\", \"à\", \"F\", \"S\", \"ú\", \"ü\", \"W\", \"D\", \"\", \"👍\", \"L\", \"Í\", \"\", \"\", \"®\", \"ô\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/fa": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 2054052,
"_n_tokens": 387763,
"_n_chars": 1145876,
"_n_oov_chars": 272804,
"oov_ratio": 0.2380746258757492,
"_oov_charset": "[\"۹\", \"–\", \"ۆ\", \"ِ\", \"إ\", \"”\", \"R\", \"ـ\", \"�\", \"V\", \"J\", \"\", \"ھ\", \"چ\", \"©\", \"C\", \"ב\", \"٩\", \"ُ\", \"\", \"ک\", \"؛\", \"۶\", \"۴\", \"W\", \"ث\", \"ق\", \"\", \"ز\", \"ج\", \"ט\", \"…\", \"ف\", \"۔\", \"ژ\", \"\", \"ص\", \"U\", \"ۀ\", \"ے\", \"’\", \"ڪ\", \"٪\", \"۳\", \"I\", \"️\", \"،\", \"٣\", \"۸\", \"B\", \"E\", \"Z\", \"T\", \"ی\", \"ذ\", \"ح\", \"۲\", \"M\", \"ك\", \"٥\", \"ش\", \"٤\", \"\", \"L\", \"٫\", \"ئ\", \"P\", \"ْ\", \"ٌ\", \"۰\", \"خ\", \"H\", \"٠\", \"ٴ\", \"ؤ\", \"Y\", \"ض\", \"١\", \"أ\", \"َ\", \"\", \"٨\", \"؟\", \"K\", \"ٔ\", \"آ\", \"ظ\", \"X\", \"▐\", \"ء\", \"F\", \"S\", \"۷\", \"D\", \"A\", \"N\", \"ى\", \"❤\", \"۵\", \"G\", \"غ\", \"۱\", \"٢\", \"Q\", \"◄\", \"گ\", \"\", \"ּ\", \" \", \"O\", \"ط\", \"پ\", \"ً\", \"ٍ\", \"ﮧ\", \"ّ\", \"♥\", \"٧\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/fr": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1540504,
"_n_tokens": 767363,
"_n_chars": 1484970,
"_n_oov_chars": 74057,
"oov_ratio": 0.0498710411658148,
"_oov_charset": "[\"A\", \"…\", \"😀\", \"Ê\", \"N\", \"P\", \"😉\", \"❤\", \"û\", \"♕\", \"
\", \"ù\", \"̂\", \"̧\", \"œ\", \"Ç\", \"–\", \"è\", \"H\", \"ğ\", \"♠\", \"U\", \"G\", \"—\", \"🤔\", \"Â\", \"”\", \"í\", \"―\", \"È\", \"R\", \"Y\", \"’\", \"Q\", \"î\", \"â\", \"É\", \"�\", \"\", \"ï\", \"ê\", \"I\", \"ë\", \"V\", \"J\", \"K\", \"Î\", \"B\", \"é\", \"E\", \"Z\", \"C\", \"´\", \"™\", \"T\", \"O\", \"🙂\", \"‐\", \"X\", \"ã\", \"M\", \"à\", \"Ô\", \"F\", \"S\", \"ü\", \"ç\", \"W\", \"ä\", \"À\", \"D\", \"L\", \"\", \"®\", \"ô\", \"́\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/ja": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1774770,
"_n_tokens": 319411,
"_n_chars": 603065,
"_n_oov_chars": 415300,
"oov_ratio": 0.6886488189498644,
"_oov_charset": "[\"臨\", \"償\", \"補\", \"馳\", \"ぬ\", \"懸\", \"緒\", \"鐘\", \"際\", \"樺\", \"摂\", \"\\b\", \"姦\", \"◯\", \"納\", \"嶽\", \"噛\", \"ろ\", \"監\", \"熱\", \"塵\", \"幣\", \"が\", \"閑\", \"倫\", \"麗\", \"ム\", \"況\", \"\", \"嘆\", \"ィ\", \"塊\", \"F\", \"⇔\", \"閉\", \"締\", \"C\", \"紋\", \"詩\", \"請\", \"S\", \"‐\", \"貴\", \"諏\", \"機\", \"餃\", \"う\", \"糞\", \"測\", \"て\", \"馬\", \"貨\", \"斉\", \"貢\", \"輝\", \"陣\", \"パ\", \"漬\", \"財\", \"係\", \"ガ\", \"釣\", \"窮\", \"諦\", \"診\", \"腎\", \"認\", \"…\", \"レ\", \"ぎ\", \"▷\", \"詳\", \"ゎ\", \"ぱ\", \"ぽ\", \"頬\", \"桟\", \"託\", \"偽\", \"n\", \"T\", \"ゴ\", \"X\", \"ホ\", \"ケ\", \"課\", \"奪\", \"g\", \"靄\", \"髭\", \"輿\", \"M\", \"I\", \"飽\", \"濫\", \"😊\", \"換\", \"ぁ\", \"猟\", \"き\", \"ボ\", \"\\u001b\", \"´\", \"‼\", \"✨\", \"P\", \"づ\", \"儲\", \"腸\", \"灘\", \"憲\", \"ち\", \"園\", \"斬\", \"遡\", \"H\", \"賃\", \"か\", \"堅\", \"載\", \"恥\", \"減\", \"競\", \"I\", \"呟\", \"凱\", \"コ\", \"郵\", \"に\", \"́\", \"拶\", \"f\", \"陥\", \"軌\", \"離\", \"墾\", \"導\", \"ぶ\", \"複\", \"喚\", \"曇\", \"講\", \"へ\", \"練\", \"Ⅱ\", \"職\", \"彌\", \"麹\", \"ォ\", \"無\", \"y\", \"倉\", \"銀\", \"b\", \"ト\", \"⻑\", \"興\", \"る\", \"紛\", \"敗\", \"艶\", \"チ\", \"鞄\", \"ど\", \"遜\", \"Ⅶ\", \"ば\", \"ァ\", \"訟\", \"絡\", \"テ\", \"F\", \"霧\", \"標\", \"賭\", \"紡\", \"猶\", \"綱\", \"須\", \"セ\", \"電\", \"貫\", \"燭\", \"謀\", \"❤\", \"缶\", \"類\", \"◡\", \"誌\", \"誤\", \"揚\", \"問\", \"爾\", \"塚\", \"篤\", \"飴\", \"ア\", \"ソ\", \"見\", \"ゾ\", \"訓\", \"線\", \"ル\", \"買\", \"Y\", \"Q\", \"キ\", \"腫\", \"醸\", \"t\", \"誠\", \"駕\", \"ぉ\", \"業\", \"産\", \"m\", \"愛\", \"妬\", \"楓\", \"執\", \"責\", \"ョ\", \"繰\", \"譚\", \"ン\", \"識\", \"掛\", \"門\", \"貸\", \"L\", \"頭\", \"塗\", \"損\", \"議\", \"蛍\", \"轄\", \"ぇ\", \"ザ\", \"傾\", \"書\", \"嘩\", \"臥\", \"A\", \"韓\", \"這\", \"純\", \"籠\", \"終\", \"巣\", \"蓋\", \"鯖\", \"カ\", \"💦\", \"は\", \"i\", \"み\", \"頓\", \"欽\", \"ア\", \"ほ\", \"週\", \"僅\", \"悶\", \"滲\", \"決\", \"ラ\", \"較\", \"軍\", \"艦\", \"聖\", \"風\", \"淵\", \"”\", \"縛\", \"織\", \"欝\", \"彙\", \"復\", \"膿\", \"盤\", \"�\", \"呂\", \"紀\", \"綺\", \"騙\", \"尋\", \"闊\", \"資\", \"訃\", \"プ\", \"遺\", \"繍\", \"確\", \"ャ\", \"達\", \"鍋\", \"唄\", \"Q\", \"ド\", \"訂\", \"渦\", \"曽\", \"っ\", \"鍵\", \"獄\", \"\", \"蒔\", \"を\", \"纏\", \"頃\", \"編\", \"ゼ\", \"贅\", \"ミ\", \"鮮\", \"飛\", \"ピ\", \"馴\", \"薩\", \"餌\", \"薦\", \"鴻\", \"呑\", \"選\", \"捗\", \"慶\", \"そ\", \"賞\", \"フ\", \"喪\", \"衝\", \"頒\", \"讃\", \"墳\", \"ベ\", \"製\", \"粋\", \"ゲ\", \"謳\", \"磯\", \"デ\", \"緻\", \"紗\", \"輩\", \"誕\", \"餓\", \"闖\", \"じ\", \"ヒ\", \"鳥\", \"飯\", \"え\", \"組\", \"蘇\", \"創\", \"輪\", \"貿\", \"駐\", \"T\", \"鍛\", \"採\", \"つ\", \"計\", \"隊\", \"貶\", \"謂\", \"M\", \"ツ\", \"躾\", \"棄\", \"辿\", \"謬\", \"國\", \"橋\", \"連\", \"✧\", \"襲\", \"張\", \"㎞\", \"ゃ\", \"視\", \"憶\", \"階\", \"脈\", \"筆\", \"E\", \"報\", \"庫\", \"態\", \"ぐ\", \"枠\", \"韮\", \"ス\", \"d\", \"鉛\", \"開\", \"ダ\", \"た\", \"れ\", \"試\", \"ー\", \"び\", \"ぜ\", \"エ\", \"厭\", \"ワ\", \"飾\", \"ノ\", \"騰\", \"飲\", \"余\", \"バ\", \"渇\", \"時\", \"慣\", \"於\", \"ぴ\", \"賀\", \"場\", \"K\", \"剰\", \"談\", \"遼\", \"メ\", \"異\", \"贔\", \"細\", \"X\", \"屓\", \"揺\", \"の\", \"J\", \"黙\", \"輸\", \"養\", \"違\", \"棟\", \"ノ\", \"顔\", \"シ\", \"N\", \"銃\", \"帳\", \"贋\", \"A\", \"艸\", \"諾\", \"寧\", \"N\", \"紐\", \"い\", \"ギ\", \"ざ\", \"鳴\", \"釈\", \"脅\", \"欄\", \"婦\", \"曖\", \"環\", \"孫\", \"鎮\", \"—\", \"ヲ\", \"陰\", \"K\", \"潰\", \"ヘ\", \"潔\", \"ず\", \"讐\", \"梱\", \"鉢\", \"強\", \"銘\", \"礎\", \"穫\", \"給\", \"謄\", \"訣\", \"贈\", \"O\", \"軟\", \"級\", \"誹\", \"汚\", \"膚\", \"澤\", \"k\", \"筈\", \"ビ\", \"タ\", \"牽\", \"饉\", \"ィ\", \"還\", \"ま\", \"鉱\", \"債\", \"運\", \"貝\", \"澪\", \"砦\", \"憤\", \"範\", \"貼\", \"棲\", \"審\", \"戯\", \"ふ\", \"話\", \"譜\", \"く\", \"サ\", \"だ\", \"鋭\", \"適\", \"あ\", \"協\", \"–\", \"夢\", \"俵\", \"お\", \"語\", \"聞\", \"遙\", \"顧\", \"ね\", \"瘍\", \"ら\", \"錠\", \"ヽ\", \"綜\", \"謙\", \"謗\", \"喩\", \"と\", \"傷\", \"V\", \"ゅ\", \"惣\", \"額\", \"涼\", \"阪\", \"誘\", \"暦\", \"遠\", \"凍\", \"痩\", \"鶏\", \"維\", \"ゆ\", \"ッ\", \"R\", \"ゝ\", \"針\", \"擬\", \"カ\", \"ご\", \"〟\", \"趨\", \"砕\", \"罠\", \"録\", \"で\", \"難\", \"許\", \"預\", \"縦\", \"ㅂ\", \"絆\", \"ゥ\", \"湯\", \"勢\", \"滅\", \"顎\", \"U\", \"貯\", \"慮\", \"漢\", \"箋\", \"\", \"員\", \"購\", \"緩\", \"け\", \"ェ\", \"マ\", \"噴\", \"評\", \"E\", \"醤\", \"ク\", \"Z\", \"煩\", \"裏\", \"疎\", \"華\", \"誇\", \"飢\", \"貧\", \"輔\", \"ペ\", \"餅\", \"宮\", \"釘\", \"現\", \"ブ\", \"a\", \"懐\", \"h\", \"L\", \"わ\", \"題\", \"ヤ\", \"鈴\", \"築\", \"ヨ\", \"r\", \"掃\", \"該\", \"コ\", \"壌\", \"羅\", \"賠\", \"オ\", \"嗚\", \"w\", \"l\", \"ぷ\", \"掻\", \"療\", \"︎\", \"駿\", \"H\", \"務\", \"ゞ\", \"災\", \"飼\", \"漑\", \"`\", \"嚥\", \"結\", \"啓\", \"討\", \"島\", \"軸\", \"こ\", \"濃\", \"覗\", \"ヘ\", \"ポ\", \"侶\", \" \", \"擁\", \"o\", \"閲\", \"糧\", \"噂\", \"僕\", \"隕\", \"幹\", \"ぅ\", \"遊\", \"種\", \"賊\", \"・\", \"墜\", \"﨑\", \"貞\", \"紙\", \"綻\", \"Z\", \"動\", \"😢\", \"槍\", \"訴\", \"娯\", \"傑\", \"諸\", \"別\", \"著\", \"C\", \"潤\", \"G\", \"ウ\", \"さ\", \"驚\", \"B\", \"鏡\", \"冊\", \"併\", \"頂\", \"紅\", \"ひ\", \"🌙\", \"獲\", \"ニ\", \"緊\", \"傘\", \"頑\", \"ジ\", \"リ\", \"億\", \"跡\", \"奨\", \"陽\", \"緑\", \"賑\", \"詈\", \"疇\", \"設\", \"綾\", \"簗\", \"憑\", \"嘗\", \"嵐\", \"よ\", \"Ⅹ\", \"詮\", \"べ\", \"親\", \"憂\", \"頻\", \"應\", \"罵\", \"縫\", \"ヾ\", \"護\", \"®\", \"O\", \"漁\", \"側\", \"謎\", \"⑪\", \"領\", \"G\", \"繊\", \"壇\", \"質\", \"長\", \"記\", \"訪\", \"偉\", \"ハ\", \"車\", \"😭\", \"R\", \"も\", \"詞\", \"騒\", \"錬\", \"頷\", \"せ\", \"勲\", \"J\", \"穀\", \"節\", \"犠\", \"轢\", \"詰\", \"個\", \"間\", \"©\", \"鱈\", \"緯\", \"賢\", \"陸\", \"😌\", \"覆\", \"ん\", \"絶\", \"囁\", \"過\", \"W\", \"農\", \"撲\", \"逡\", \"ぃ\", \"幾\", \"龍\", \"̈\", \"躊\", \"規\", \"簡\", \"〆\", \"醜\", \"げ\", \"調\", \"め\", \"販\", \"U\", \"ぞ\", \"聾\", \"積\", \"殺\", \"錯\", \"費\", \"’\", \"訊\", \"撫\", \"儀\", \"ナ\", \"s\", \"モ\", \"Д\", \"縞\", \"雲\", \"師\", \"ヶ\", \"捨\", \"葉\", \"B\", \"順\", \"誰\", \"績\", \"ロ\", \"項\", \"拝\", \"勝\", \"瞭\", \"摯\", \"殻\", \"準\", \"蝋\", \"纒\", \"紹\", \"な\", \"ハ\", \"閣\", \"備\", \"軒\", \"渕\", \"グ\", \"極\", \"拠\", \"鎖\", \"徹\", \"ネ\", \"穢\", \"罰\", \"貪\", \"匂\", \"駒\", \"P\", \"し\", \"∇\", \"鵜\", \"り\", \"暢\", \"顕\", \"す\", \"樹\", \"則\", \"殲\", \"袴\", \"斂\", \"響\", \"後\", \"謝\", \"願\", \"暁\", \"礫\", \"―\", \"゚\", \"Y\", \"説\", \"W\", \"渓\", \"優\", \"ズ\", \"衆\", \"峠\", \"̀\", \"ヨ\", \"詐\", \"瘻\", \"ょ\", \"暫\", \"負\", \"鬱\", \"リ\", \"挿\", \"約\", \"穏\", \"捜\", \"論\", \"ヵ\", \"敵\", \"慄\", \"ぼ\", \"諺\", \"煙\", \"兎\", \"窪\", \"謡\", \"層\", \"テ\", \"ヌ\", \"懇\", \"S\", \"蓮\", \"並\", \"む\", \"陳\", \"D\", \"ロ\", \"藁\", \"閃\", \"D\", \"綴\", \"沖\", \"や\", \"懲\", \"軋\", \"鶴\", \"糾\", \"統\", \"酔\", \"魚\", \"訝\", \"鋲\", \"虜\", \"鈍\", \"ウ\", \"縮\", \"ユ\", \"網\", \"義\", \"岡\", \"イ\", \"賛\", \"詠\", \"綬\", \"絞\", \"絨\", \"佇\", \"揮\", \"劉\", \"術\", \"躍\", \"彡\", \"ヴ\", \"乾\", \"ゥ\", \"進\", \"貰\", \"゙\", \"メ\", \"劇\", \"楊\", \"詫\", \"フ\", \"東\", \"V\", \"舘\", \"廻\", \"習\", \"為\", \"e\", \"奮\", \"偵\", \"レ\", \"衛\", \"館\", \"ュ\", \"構\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/ko": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1524839,
"_n_tokens": 206812,
"_n_chars": 655190,
"_n_oov_chars": 484068,
"oov_ratio": 0.7388208000732612,
"_oov_charset": "[\"먼\", \"ᴇ\", \"셔\", \"버\", \"증\", \"량\", \"禮\", \"鐘\", \"웅\", \"樺\", \"석\", \"옆\", \"깽\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"C\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"機\", \"댈\", \"녀\", \"남\", \"係\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"챙\", \"필\", \"呪\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"v\", \"콘\", \"經\", \"홈\", \"험\", \"분\", \"직\", \"廟\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"콥\", \"쬐\", \"듬\", \"쫓\", \"봄\", \"ㅣ\", \"교\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"육\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"▒\", \"♧\", \"점\", \"똑\", \"說\", \"것\", \"새\", \"곰\", \"룹\", \"🚨\", \"🗺\", \"標\", \"㎍\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"틀\", \"藝\", \"봉\", \"왠\", \"섦\", \"겁\", \"낀\", \"혁\", \"판\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"吳\", \"關\", \"롱\", \"얏\", \"팍\", \"힉\", \"댔\", \"は\", \"쌍\", \"높\", \"쾅\", \"굽\", \"더\", \"줏\", \"보\", \"淨\", \"긍\", \"쌈\", \"폿\", \"紀\", \"닳\", \"닷\", \"資\", \"젝\", \"겨\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"츠\", \"텔\", \"💣\", \"🔹\", \"↔\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"そ\", \"챗\", \"\", \"궜\", \"榮\", \"낳\", \"꺽\", \"맥\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"융\", \"國\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"贖\", \"飾\", \"웍\", \"K\", \"퀸\", \"뀔\", \"면\", \"X\", \"諒\", \"끄\", \"할\", \"홋\", \"뗀\", \"툼\", \"흐\", \"룩\", \"ㅇ\", \"문\", \"슷\", \"不\", \"陰\", \"왓\", \"믹\", \"탐\", \"엎\", \"계\", \"퀘\", \"라\", \"◐\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"맵\", \"킹\", \"광\", \"語\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"틋\", \"헛\", \"머\", \"염\", \"겔\", \"째\", \"밌\", \"콩\", \"♤\", \"쉬\", \"놨\", \"궈\", \"濁\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"滅\", \"\", \"월\", \"U\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"E\", \"귤\", \"쏠\", \"릭\", \"華\", \"헌\", \"🙋\", \"앗\", \"코\", \"L\", \"題\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"외\", \"노\", \"쥐\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"結\", \"삣\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"種\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"훼\", \"척\", \"쵸\", \"🍟\", \"驚\", \"ㅙ\", \"재\", \"충\", \"왔\", \"떳\", \"떻\", \"채\", \"삘\", \"얽\", \"웬\", \"찌\", \"®\", \"➍\", \"주\", \"푸\", \"長\", \"맺\", \"🏫\", \"찮\", \"템\", \"立\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"◀\", \"펼\", \"◈\", \"휠\", \"류\", \"냐\", \"©\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"잇\", \"뇌\", \"獻\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"▣\", \"칼\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"ㄱ\", \"닮\", \"俠\", \"♀\", \"싼\", \"동\", \"極\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"춰\", \"뇨\", \"훔\", \"차\", \"꾀\", \"갇\", \"챨\", \"돼\", \"네\", \"S\", \"헤\", \"陳\", \"D\", \"團\", \"껑\", \"샹\", \"퀵\", \"푹\", \"魚\", \"튀\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"렇\", \"ㅝ\", \"테\", \"術\", \"핍\", \"헨\", \"창\", \"🍔\", \"곳\", \"포\", \"걱\", \"發\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"烏\", \"譯\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"궐\", \"릉\", \"힜\", \"氣\", \"퓰\", \"쳤\", \"꿈\", \"ã\", \"술\", \"꼭\", \"향\", \"て\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"뻤\", \"땐\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"투\", \"ᴍ\", \"Ⅰ\", \"載\", \"응\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"깨\", \"잘\", \"롤\", \"堯\", \"화\", \"넵\", \"銀\", \"賣\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"캘\", \"폰\", \"곤\", \"❤\", \"類\", \"🥁\", \"개\", \"윗\", \"壽\", \"ʏ\", \"축\", \"Q\", \"듀\", \"봅\", \"業\", \"獨\", \"◦\", \"밟\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"협\", \"書\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"💦\", \"올\", \"취\", \"軍\", \"켰\", \"틱\", \"”\", \"흰\", \"민\", \"�\", \"쌀\", \"흗\", \"예\", \"濟\", \"밍\", \"캉\", \"넛\", \"돗\", \"숏\", \"걀\", \"득\", \"🌵\", \"밭\", \"팠\", \"選\", \"쁜\", \"륜\", \"균\", \"💕\", \"덜\", \"쪄\", \"️\", \"🤗\", \"對\", \"긋\", \"력\", \"ㅅ\", \"駐\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"🍰\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"헬\", \"졸\", \"엣\", \"칠\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"N\", \"넥\", \"냥\", \"—\", \"젠\", \"뻑\", \"닙\", \"탱\", \"뜩\", \"씩\", \"있\", \"믐\", \"들\", \"켄\", \"았\", \"뮐\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"♥\", \"잔\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"適\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"ㅎ\", \"빅\", \"쿨\", \"뒷\", \"쨍\", \"🙆\", \"쾨\", \"침\", \"🚿\", \"요\", \"蟄\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"ㄴ\", \"윤\", \"짧\", \"년\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"員\", \"얍\", \"🏻\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"Z\", \"듣\", \"찔\", \"켓\", \"열\", \"즌\", \"태\", \"宮\", \"樂\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"습\", \"럭\", \"H\", \"랙\", \"길\", \"탬\", \"잤\", \" \", \"줌\", \"딱\", \"장\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"과\", \"꿕\", \"였\", \"G\", \"위\", \"숙\", \"횡\", \"쎄\", \"둡\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"陽\", \"雙\", \"넘\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"관\", \"뜻\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"J\", \"節\", \"촌\", \"뮌\", \"빌\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"W\", \"ㄹ\", \"꼬\", \"龍\", \"핏\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"쒀\", \"공\", \"🙇\", \"토\", \"臺\", \"죄\", \"골\", \"쁘\", \"빔\", \"뾱\", \"ç\", \"준\", \"슴\", \"罰\", \"쩍\", \"얄\", \"퓨\", \"뚝\", \"峴\", \"킥\", \"벽\", \"➋\", \"데\", \"價\", \"謝\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"論\", \"짱\", \"펙\", \"댁\", \"슬\", \"쁨\", \"曆\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"靑\", \"내\", \"陸\", \"줍\", \"詔\", \"會\", \"톱\", \"온\", \"▶\", \"將\", \"킁\", \"을\", \"😂\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"끔\", \"뀐\", \"덟\", \"합\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"韜\", \"🍭\", \"펠\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"紋\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"덧\", \"띈\", \"혈\", \"썅\", \"훠\", \"탄\", \"窮\", \"두\", \"꽂\", \"…\", \"쏘\", \"궁\", \"팽\", \"톡\", \"🦄\", \"緞\", \"져\", \"實\", \"칫\", \"I\", \"돈\", \"換\", \"탕\", \"삶\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"學\", \"쓴\", \"벳\", \"틈\", \"빕\", \"옷\", \"👍\", \"턴\", \"❍\", \"폼\", \"離\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"無\", \"멋\", \"삿\", \"틔\", \"✈\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"誡\", \"F\", \"썹\", \"➏\", \"놈\", \"燭\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"愛\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"門\", \"좌\", \"쿠\", \"떠\", \"頭\", \"낮\", \"臥\", \"굉\", \"터\", \"🤟\", \"닥\", \"략\", \"딸\", \"ɪ\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"歲\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"鮮\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"劍\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"貿\", \"툴\", \"램\", \"앎\", \"M\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"時\", \"찢\", \"뺀\", \"瀧\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"에\", \"좋\", \"O\", \"벤\", \"뚜\", \"택\", \"운\", \"뛸\", \"얼\", \"벙\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"協\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"體\", \"고\", \"했\", \"퍽\", \"뮬\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"켜\", \"꽝\", \"😱\", \"왜\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"깡\", \"숍\", \"컵\", \"얻\", \"닐\", \"🤕\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"옮\", \"펩\", \"맑\", \"혀\", \"現\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"캣\", \"鎭\", \"`\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"紙\", \"쯔\", \"壞\", \"결\", \"엇\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"黃\", \"표\", \"몹\", \"\", \"담\", \"뽑\", \"✔\", \"희\", \"픽\", \"랫\", \"생\", \"확\", \"번\", \"Ⅹ\", \"며\", \"힌\", \"텝\", \"應\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"킬\", \"씽\", \"😭\", \"R\", \"맬\", \"기\", \"팡\", \"핥\", \"穀\", \"및\", \"맨\", \"큰\", \"륨\", \"間\", \"훈\", \"렛\", \"펑\", \"효\", \"農\", \"볕\", \"흙\", \"각\", \"체\", \"링\", \"參\", \"벼\", \"륵\", \"專\", \"殺\", \"콰\", \"槪\", \"꿰\", \"탑\", \"觸\", \"빤\", \"타\", \"師\", \"국\", \"變\", \"많\", \"卽\", \"낸\", \"☀\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"齋\", \"샴\", \"P\", \"し\", \"쫑\", \"읽\", \"앞\", \"늬\", \"す\", \"츈\", \"픈\", \"―\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"ᴛ\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"히\", \"씌\", \"욜\", \"풀\", \"詠\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"衛\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"際\", \"魯\", \"샬\", \"덤\", \"멍\", \"튄\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"⑹\", \"곁\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"멘\", \"👏\", \"감\", \"課\", \"識\", \"텨\", \"😊\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"모\", \"빴\", \"켈\", \"릿\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"럿\", \"엽\", \"숟\", \"브\", \"內\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"쿵\", \"\", \"췄\", \"藥\", \"질\", \"햇\", \"춘\", \"쿼\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"貸\", \"홍\", \"시\", \"韓\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"껴\", \"곱\", \"聖\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"료\", \"형\", \"뮤\", \"랐\", \"족\", \"울\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"T\", \"닌\", \"累\", \"후\", \"늑\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"웨\", \"휙\", \"당\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"푼\", \"워\", \"💰\", \"싯\", \"A\", \"먹\", \"🍞\", \"い\", \"굴\", \"뭔\", \"핑\", \"받\", \"찍\", \"숲\", \"피\", \"듐\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"☎\", \"가\", \" \", \"널\", \"콤\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"😣\", \"정\", \"꼴\", \"쭙\", \"–\", \"떴\", \"규\", \"군\", \"줬\", \"樂\", \"앱\", \"V\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"루\", \"ㅞ\", \"뻐\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"勢\", \"밤\", \"漢\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"❏\", \"잼\", \"쭈\", \"컸\", \"쫄\", \"몸\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"\", \"란\", \"몽\", \"넓\", \"혐\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"・\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"動\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"💅\", \"됬\", \"멀\", \"든\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"유\", \"서\", \"누\", \"삐\", \"쿰\", \"된\", \"처\", \"♣\", \"💥\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"數\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"覆\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"’\", \"휩\", \"훑\", \"황\", \"역\", \"s\", \"웠\", \"셰\", \"렬\", \"雲\", \"B\", \"눕\", \"씻\", \"익\", \"軒\", \"찼\", \"얇\", \"팀\", \"펄\", \"뷔\", \"진\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"樹\", \"後\", \"룸\", \"뉴\", \"跏\", \"괌\", \"팔\", \"Y\", \"샐\", \"독\", \"꿍\", \"춥\", \"㉿\", \"얹\", \"자\", \"끼\", \"땠\", \"ㅐ\", \"린\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"뿜\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"뎅\", \"넨\", \"東\", \"ʟ\", \"燦\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"clue/roberta_chinese_clue_tiny @ cc100/zh-Hans": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 2633047,
"_n_tokens": 887144,
"_n_chars": 927311,
"_n_oov_chars": 31257,
"oov_ratio": 0.03370713816616001,
"_oov_charset": "[\"浠\", \"撐\", \"ù\", \"牖\", \"–\", \"\\b\", \"鄯\", \"瑥\", \"篢\", \"”\", \"龇\", \"R\", \"彙\", \"逑\", \"î\", \"黩\", \"�\", \"戢\", \"旆\", \"\", \"據\", \"V\", \"資\", \"J\", \"\", \"\\u0000\", \"\", \"麽\", \"個\", \"©\", \"阪\", \"C\", \"韫\", \"á\", \"確\", \"覆\", \"à\", \"穰\", \"犟\", \"ὐ\", \"W\", \"\", \"…\", \"浞\", \"漲\", \"藉\", \"薩\", \"p\", \"娛\", \"託\", \"號\", \"n\", \"選\", \"U\", \"狳\", \"\", \"T\", \"黢\", \"倨\", \"⒁\", \"绉\", \"慮\", \"’\", \"\", \"亂\", \"員\", \"s\", \"I\", \"屣\", \"犰\", \"阽\", \"瑢\", \"镏\", \"疴\", \"噴\", \"B\", \"E\", \"Z\", \"岣\", \"T\", \"採\", \"鸩\", \"\", \"M\", \"⒃\", \"⒂\", \"瑒\", \"ç\", \"a\", \"h\", \"L\", \"r\", \"ヨ\", \"Ø\", \"旳\", \"擤\", \"報\", \"P\", \"馕\", \"d\", \"▪\", \"價\", \"權\", \"卻\", \"H\", \"韪\", \"後\", \" \", \"鲎\", \"へ\", \"―\", \"Y\", \"`\", \"ズ\", \"ノ\", \"余\", \"ト\", \"賣\", \"當\", \"ê\", \"時\", \"ě\", \"於\", \"K\", \"溘\", \"é\", \" \", \"o\", \"內\", \"X\", \"・\", \"の\", \"F\", \"⒀\", \"標\", \"S\", \"並\", \"D\", \"D\", \"⑿\", \"N\", \"シ\", \"翕\", \"動\", \"A\", \"電\", \"N\", \"別\", \"著\", \"耩\", \"C\", \"G\", \"瑑\", \"—\", \"瑧\", \"網\", \"ソ\", \"イ\", \"Q\", \"t\", \"锒\", \"ㄓ\", \"併\", \"\\u0006\", \"猡\", \"\", \"\\u0005\", \"瑨\", \"強\", \"\\u0007\", \"乾\", \"劑\", \"鼯\", \"灑\", \"壓\", \"門\", \"メ\", \"O\", \"損\", \"啐\", \"V\", \"⒌\", \"發\", \"為\", \"诨\", \"e\", \"讦\", \"ό\", \"A\", \"運\", \"炝\", \"黧\", \"i\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/ar": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 2813283,
"_n_tokens": 2066944,
"_n_chars": 1560987,
"_n_oov_chars": 202,
"oov_ratio": 0.00012940530574565964,
"_oov_charset": "[\"…\", \"ﷺ\", \"ﻹ\", \"ﻻ\", \"ﻷ\", \"½\", \"″\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/de": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1814876,
"_n_tokens": 845425,
"_n_chars": 1784021,
"_n_oov_chars": 457,
"oov_ratio": 0.0002561629039120055,
"_oov_charset": "[\"…\", \"¹\", \"²\", \"´\", \"™\", \"½\", \" \", \"¼\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/en": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1124813,
"_n_tokens": 391092,
"_n_chars": 1121360,
"_n_oov_chars": 59,
"oov_ratio": 5.261468217164871e-05,
"_oov_charset": "[\"…\", \"⑦\", \"‑\", \"③\", \"⑧\", \"´\", \"⑩\", \"⑤\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/es": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1664455,
"_n_tokens": 759244,
"_n_chars": 1630297,
"_n_oov_chars": 528,
"oov_ratio": 0.0003238673689517922,
"_oov_charset": "[\"…\", \"º\", \"²\", \"´\", \"ª\", \"″\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/fa": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 2054052,
"_n_tokens": 1588140,
"_n_chars": 1145876,
"_n_oov_chars": 605,
"oov_ratio": 0.0005279803399320694,
"_oov_charset": "[\"…\", \"ﮧ\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/fr": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1540504,
"_n_tokens": 686144,
"_n_chars": 1484970,
"_n_oov_chars": 833,
"oov_ratio": 0.0005609540933486872,
"_oov_charset": "[\"…\", \"µ\", \"²\", \"´\", \"™\", \"℃\", \"″\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/ja": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1774770,
"_n_tokens": 253868,
"_n_chars": 603065,
"_n_oov_chars": 6917,
"oov_ratio": 0.011469742067604653,
"_oov_charset": "[\"%\", \"⑪\", \"G\", \"|\", \"ハ\", \"]\", \"7\", \"ィ\", \"8\", \"F\", \"-\", \"②\", \"S\", \",\", \"Q\", \":\", \"$\", \"R\", \">\", \"①\", \"″\", \"…\", \"レ\", \"ゥ\", \"ㅂ\", \"_\", \"③\", \"゙\", \"・\", \"U\", \"6\", \"n\", \"T\", \"X\", \"、\", \"3\", \"g\", \"`\", \"/\", \"@\", \"s\", \"M\", \"「\", \"¥\", \"´\", \"‼\", \"1\", \"P\", \"<\", \"+\", \"9\", \"H\", \"5\", \"I\", \"a\", \"h\", \"コ\", \"r\", \"㎞\", \"E\", \"④\", \"f\", \"0\", \" ̄\", \"w\", \"l\", \"d\", \";\", \")\", \"[\", \"Ⅱ\", \"W\", \"y\", \"b\", \"℃\", \"ヨ\", \"」\", \"ヘ\", \" \", \"o\", \"メ\", \"⑩\", \"Ⅶ\", \"テ\", \"゚\", \"J\", \"*\", \"ロ\", \"Z\", \"D\", \"ノ\", \"(\", \"N\", \".\", \"C\", \"ウ\", \"2\", \"ア\", \"‥\", \"。\", \"K\", \"=\", \"Y\", \"B\", \"t\", \"!\", \"m\", \"リ\", \"?\", \"L\", \"ー\", \"フ\", \"V\", \"^\", \"Ⅹ\", \"k\", \"e\", \"4\", \"\\", \"⑧\", \"A\", \"&\", \"~\", \"カ\", \"O\", \"i\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/ko": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1524839,
"_n_tokens": 1379975,
"_n_chars": 655190,
"_n_oov_chars": 1311,
"oov_ratio": 0.0020009462903890474,
"_oov_charset": "[\"%\", \"⑥\", \"Ⅳ\", \"㉣\", \"立\", \"|\", \"樂\", \"ㅈ\", \"ㅟ\", \"ㅋ\", \"ㅍ\", \"㎡\", \"ㅎ\", \"ㆍ\", \"Ⅸ\", \"ⅰ\", \"②\", \"²\", \"⑴\", \"⑹\", \"Ⅷ\", \"⁴\", \"ㅞ\", \":\", \"①\", \"ㅜ\", \"ㄹ\", \"…\", \"ⓔ\", \"ㅗ\", \"ㄴ\", \"㎥\", \"③\", \"ㅡ\", \"流\", \"ㄷ\", \"⑶\", \"v\", \"識\", \"ㅆ\", \"s\", \"@\", \"Ⅴ\", \"「\", \"ㅁ\", \"靈\", \"ㅠ\", \"㏊\", \"Ⅰ\", \"ㅅ\", \"⑤\", \"ㄱ\", \"累\", \"樂\", \"ㅣ\", \"㎞\", \"④\", \"⑸\", \"ㅕ\", \"ㅛ\", \"ㅏ\", \"龍\", \"㉰\", \"Ⅱ\", \"ㅓ\", \"⑨\", \"℃\", \"」\", \"ㅑ\", \"․\", \"ㅒ\", \" \", \"ⅳ\", \"Ⅶ\", \"ㅐ\", \"⑵\", \"ㅔ\", \"良\", \"ㅚ\", \"*\", \"㎍\", \"理\", \"梁\", \"Ⅲ\", \"陸\", \"ㅇ\", \"‥\", \"ⅲ\", \"不\", \"ⓒ\", \"ㅝ\", \"¹\", \"㉠\", \"㈜\", \"ㅘ\", \"ㅙ\", \"ㅖ\", \"⑦\", \"?\", \"金\", \"ⅱ\", \"Ⅹ\", \"⑧\", \"ㅊ\", \"女\", \"Ⅵ\", \"ㅢ\"]",
"lossless": false
},
"cyberagent/open-calm-7b @ cc100/zh-Hans": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 2633047,
"_n_tokens": 1073991,
"_n_chars": 927311,
"_n_oov_chars": 49167,
"oov_ratio": 0.05302104687639853,
"_oov_charset": "[\"…\", \"%\", \".\", \"⑸\", \"⑥\", \""\", \"⒋\", \"_\", \"0\", \"⑷\", \"③\", \"d\", \"C\", \"p\", \"・\", \"2\", \"⑶\", \"n\", \"6\", \" \", \";\", \"T\", \")\", \"[\", \"⒁\", \"3\", \"/\", \"t\", \"]\", \"!\", \"⑨\", \"s\", \"℃\", \"7\", \"\\u0000\", \"⑦\", \"?\", \"-\", \"8\", \"i\", \"②\", \" \", \"o\", \"⑩\", \"⑴\", \"1\", \"⑤\", \",\", \"V\", \"+\", \"⒌\", \"9\", \":\", \"⒃\", \"e\", \"4\", \"⒀\", \"5\", \"⒂\", \"①\", \"A\", \"⑧\", \"a\", \"&\", \"~\", \"h\", \"r\", \"D\", \"⑿\", \"(\", \"N\", \"④\"]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/ar": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 2813283,
"_n_tokens": 1105640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/de": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1814876,
"_n_tokens": 500870,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/en": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1124813,
"_n_tokens": 254985,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/es": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1664455,
"_n_tokens": 433875,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/fa": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 2054052,
"_n_tokens": 818067,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/fr": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1540504,
"_n_tokens": 412685,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/ja": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1774770,
"_n_tokens": 630348,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/ko": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1524839,
"_n_tokens": 652277,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"databricks/dbrx-instruct @ cc100/zh-Hans": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 2633047,
"_n_tokens": 1084939,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/ar": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 2813283,
"_n_tokens": 309525,
"_n_chars": 1560987,
"_n_oov_chars": 1353707,
"oov_ratio": 0.86721221893584,
"_oov_charset": "[\"﴾\", \"😀\", \"ة\", \"ِ\", \"إ\", \"R\", \"ن\", \"ـ\", \"�\", \"V\", \"J\", \"\", \"ھ\", \"چ\", \"█\", \"C\", \"\", \"٩\", \"à\", \"\", \"ُ\", \"ک\", \"ت\", \"؛\", \"W\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ﻻ\", \"ﻷ\", \"ج\", \"″\", \"…\", \"
\", \"ف\", \"ص\", \"U\", \"ﷺ\", \"ۚ\", \"â\", \"ع\", \"٪\", \"I\", \"😊\", \"ٱ\", \"τ\", \"،\", \"٣\", \"۸\", \"س\", \"B\", \"E\", \"Z\", \"T\", \"ۗ\", \"ی\", \"½\", \"ذ\", \"ه\", \"ح\", \"M\", \"ك\", \"۲\", \"٥\", \"ش\", \"٤\", \"\", \"﴿\", \"L\", \"ئ\", \"P\", \"ا\", \"ْ\", \"Х\", \"ί\", \"ٌ\", \"▪\", \"۰\", \"خ\", \"H\", \"٠\", \"ۖ\", \"ؤ\", \"١\", \"ض\", \"Y\", \"أ\", \"َ\", \"κ\", \"٨\", \"؟\", \"ي\", \"ل\", \"η\", \"K\", \"é\", \"ۤ\", \"ﻹ\", \"آ\", \"ظ\", \"🙂\", \"X\", \"⤴\", \"ء\", \"←\", \"F\", \"S\", \"ب\", \"۷\", \"ή\", \"D\", \"ٹ\", \"A\", \"›\", \"ٰ\", \"N\", \"ى\", \"ر\", \"G\", \"غ\", \"‹\", \"٢\", \"Q\", \"ö\", \"٦\", \"\", \" \", \"O\", \"ط\", \"م\", \"پ\", \"ً\", \"χ\", \"ٍ\", \"▫\", \"ّ\", \"♥\", \"ä\", \"و\", \"٧\", \"↩\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/de": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1814876,
"_n_tokens": 382494,
"_n_chars": 1784021,
"_n_oov_chars": 111497,
"oov_ratio": 0.06249758270782687,
"_oov_charset": "[\"😀\", \"û\", \"è\", \"č\", \"R\", \"�\", \"ė\", \"▼\", \"V\", \"🙁\", \"J\", \"\", \"ó\", \"²\", \"C\", \"¿\", \"🙄\", \"á\", \"‐\", \"ā\", \"ń\", \"ć\", \"à\", \"W\", \"\", \"İ\", \"̈\", \"ô\", \"…\", \"😉\", \"U\", \"Ü\", \"☺\", \"â\", \"I\", \"Á\", \"τ\", \"♦\", \"Ö\", \"B\", \"E\", \"Z\", \"´\", \"T\", \"\", \"ε\", \"½\", \"M\", \"š\", \"ç\", \"L\", \"Ø\", \"£\", \"¼\", \"Ä\", \"P\", \"ί\", \"œ\", \"™\", \"H\", \"≠\", \"ư\", \" \", \"Y\", \"\", \"ï\", \"😃\", \"‽\", \"K\", \"➔\", \"é\", \"😈\", \"🙂\", \"X\", \"F\", \"S\", \"ü\", \"¬\", \"D\", \"ớ\", \"😆\", \"A\", \"›\", \"😢\", \"N\", \"❤\", \"å\", \"\", \"G\", \"Ã\", \"‹\", \"↑\", \"Q\", \"¹\", \"É\", \"ö\", \"ς\", \"¶\", \"★\", \"\", \"😦\", \"Ÿ\", \"😂\", \"O\", \"\", \"♥\", \"ú\", \"ä\", \"♡\", \"↩\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/en": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1124813,
"_n_tokens": 326111,
"_n_chars": 1121360,
"_n_oov_chars": 31165,
"oov_ratio": 0.027792145252193763,
"_oov_charset": "[\"A\", \"…\", \"N\", \"P\", \"😉\", \"③\", \"\", \"è\", \"H\", \"U\", \"G\", \"¦\", \"‑\", \"R\", \"Y\", \"Q\", \"😥\", \"�\", \"ï\", \"ñ\", \"I\", \"\", \"V\", \"J\", \"\", \"⑦\", \"K\", \"\", \"ó\", \"B\", \"E\", \"é\", \"Z\", \"C\", \"⑩\", \"´\", \"T\", \"O\", \"🙂\", \"X\", \"⑤\", \"M\", \"F\", \"S\", \"⑧\", \"W\", \"D\", \"L\", \"\", \"£\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/es": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1664455,
"_n_tokens": 547112,
"_n_chars": 1630297,
"_n_oov_chars": 69539,
"oov_ratio": 0.04265419123018689,
"_oov_charset": "[\"A\", \"…\", \"😀\", \"▷\", \"✪\", \"Ú\", \"N\", \"P\", \"😉\", \"❤\", \"😦\", \"Ñ\", \"М\", \"\", \"è\", \"H\", \"U\", \"G\", \"👏\", \"í\", \"―\", \"R\", \"Y\", \"º\", \"Ó\", \"Q\", \"É\", \"ö\", \"\", \"✔\", \"ñ\", \"I\", \"ª\", \"️\", \"Á\", \"V\", \"✖\", \"🙁\", \"J\", \"K\", \"ó\", \"✓\", \"é\", \"E\", \"B\", \"´\", \"C\", \"Z\", \"²\", \"T\", \"O\", \"á\", \"¿\", \"X\", \"🙂\", \"ò\", \"ý\", \"M\", \"à\", \"←\", \"F\", \"S\", \"ú\", \"ü\", \"W\", \"′\", \"D\", \"\", \"👍\", \"L\", \"Í\", \"\", \"\", \"ô\", \"″\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/fa": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 2054052,
"_n_tokens": 254012,
"_n_chars": 1145876,
"_n_oov_chars": 1020489,
"oov_ratio": 0.8905754200279961,
"_oov_charset": "[\"۹\", \"ة\", \"ۆ\", \"ِ\", \"إ\", \"R\", \"ن\", \"ـ\", \"�\", \"V\", \"J\", \"\", \"ھ\", \"چ\", \"C\", \"ב\", \"٩\", \"\", \"ُ\", \"ک\", \"ت\", \"؛\", \"۶\", \"۴\", \"W\", \"ث\", \"ق\", \"\", \"د\", \"ز\", \"ج\", \"ט\", \"…\", \"ف\", \"۔\", \"ژ\", \"\", \"ص\", \"U\", \"ۀ\", \"ے\", \"ڪ\", \"ع\", \"٪\", \"۳\", \"I\", \"️\", \"،\", \"٣\", \"۸\", \"س\", \"B\", \"E\", \"Z\", \"T\", \"ی\", \"ذ\", \"ه\", \"ح\", \"M\", \"ك\", \"۲\", \"٥\", \"ش\", \"٤\", \"\", \"L\", \"٫\", \"ئ\", \"P\", \"ا\", \"ْ\", \"ٌ\", \"۰\", \"●\", \"خ\", \"H\", \"٠\", \"ٴ\", \"ؤ\", \"Y\", \"ض\", \"١\", \"أ\", \"َ\", \"\", \"٨\", \"؟\", \"ل\", \"ي\", \"K\", \"ٔ\", \"آ\", \"ظ\", \"X\", \"▐\", \"ء\", \"F\", \"S\", \"ب\", \"۷\", \"D\", \"A\", \"›\", \"N\", \"ى\", \"❤\", \"ر\", \"۵\", \"G\", \"غ\", \"۱\", \"٢\", \"Q\", \"★\", \"◄\", \"گ\", \"\", \"ּ\", \" \", \"O\", \"ط\", \"م\", \"پ\", \"ً\", \"✿\", \"ﮧ\", \"ٍ\", \"ّ\", \"♥\", \"و\", \"٧\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/fr": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1540504,
"_n_tokens": 496764,
"_n_chars": 1484970,
"_n_oov_chars": 67832,
"oov_ratio": 0.04567903728694856,
"_oov_charset": "[\"😀\", \"̧\", \"̂\", \"û\", \"ù\", \"è\", \"R\", \"î\", \"�\", \"V\", \"J\", \"²\", \"ã\", \"C\", \"‐\", \"à\", \"W\", \"À\", \"\", \"ô\", \"″\", \"…\", \"😉\", \"♕\", \"Ç\", \"♠\", \"U\", \"â\", \"I\", \"B\", \"E\", \"Z\", \"´\", \"T\", \"M\", \"ç\", \"L\", \"́\", \"P\", \"
\", \"œ\", \"™\", \"H\", \"🤔\", \"Â\", \"í\", \"―\", \"Y\", \"\", \"ï\", \"ê\", \"℃\", \"K\", \"é\", \"🙂\", \"X\", \"←\", \"F\", \"S\", \"ü\", \"D\", \"A\", \"Ê\", \"N\", \"❤\", \"ğ\", \"G\", \"È\", \"Q\", \"É\", \"ë\", \"★\", \"Î\", \"O\", \"Ô\", \"µ\", \"ä\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/ja": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1774770,
"_n_tokens": 317535,
"_n_chars": 603065,
"_n_oov_chars": 589191,
"oov_ratio": 0.97699418802285,
"_oov_charset": "[\"%\", \"臨\", \"償\", \"共\", \"馳\", \"敏\", \"緒\", \"墓\", \"称\", \"鐘\", \"樺\", \"\\b\", \"ろ\", \"熱\", \"株\", \"欠\", \"幣\", \"祐\", \"倫\", \"洋\", \"雑\", \"巧\", \"価\", \"⇔\", \"C\", \"滞\", \"咎\", \"徘\", \"機\", \"隈\", \"地\", \"原\", \"斉\", \"馬\", \"珠\", \"星\", \"昂\", \"陣\", \"拗\", \"甘\", \"漬\", \"係\", \"ガ\", \"嫡\", \"枝\", \"席\", \"加\", \"六\", \"ぱ\", \"用\", \"解\", \"T\", \"叩\", \"ホ\", \"/\", \"肘\", \"丹\", \"M\", \"濫\", \"済\", \"ボ\", \"啜\", \"括\", \"申\", \"‼\", \"P\", \"供\", \"探\", \"賃\", \"恥\", \"高\", \"減\", \"I\", \"呟\", \"峨\", \"コ\", \"的\", \"微\", \"に\", \"拶\", \"璧\", \"穂\", \"紫\", \"軌\", \"需\", \"外\", \"浄\", \"旋\", \"墾\", \"噤\", \"窒\", \"斧\", \"献\", \"倉\", \"痺\", \"◎\", \"ト\", \"鬼\", \"九\", \"埋\", \"役\", \"埃\", \"粉\", \"チ\", \"遜\", \"弓\", \"戻\", \"唆\", \"金\", \"遂\", \"武\", \"標\", \"雅\", \"日\", \"賭\", \"困\", \"猶\", \"糖\", \"セ\", \"船\", \"乗\", \"泄\", \"◡\", \"机\", \"衰\", \"穴\", \"円\", \"蔓\", \"⇒\", \"坂\", \"飴\", \"。\", \"線\", \"買\", \"キ\", \"毛\", \"勧\", \"眩\", \"t\", \"域\", \"幅\", \"都\", \"唐\", \"首\", \"虫\", \"執\", \"責\", \"福\", \"箭\", \"致\", \"枕\", \"丿\", \"卵\", \"L\", \"梯\", \"損\", \"轄\", \"漂\", \"主\", \"這\", \"精\", \"純\", \"死\", \"再\", \"常\", \"江\", \"カ\", \"は\", \"縄\", \"妹\", \"応\", \"頓\", \"拍\", \"『\", \"多\", \"蓄\", \"滲\", \"催\", \"較\", \"特\", \"演\", \"磨\", \"淵\", \"塔\", \"☆\", \"織\", \"復\", \"却\", \"不\", \"酵\", \"角\", \"岳\", \"紀\", \"綺\", \"騙\", \"赤\", \"資\", \"仕\", \"育\", \"』\", \"筋\", \"プ\", \"逃\", \"鉄\", \"茨\", \"尊\", \"達\", \"皿\", \"栽\", \"上\", \"庁\", \"瞳\", \"味\", \"畜\", \"蒔\", \"獄\", \"頃\", \"ゼ\", \"藤\", \"゙\", \"本\", \"耶\", \"捗\", \"慶\", \"そ\", \"管\", \"3\", \"墳\", \"ベ\", \"粋\", \"善\", \"謳\", \"対\", \"「\", \"輩\", \"誕\", \"丈\", \"餓\", \"飯\", \"組\", \"隆\", \"採\", \"琢\", \"ε\", \"縁\", \"尿\", \"ツ\", \"呆\", \"國\", \"橋\", \"稲\", \"元\", \"覧\", \"点\", \"張\", \"侮\", \"喰\", \"尾\", \"鉛\", \"暇\", \"試\", \"功\", \"泊\", \"奏\", \"虎\", \"建\", \"横\", \"了\", \"眼\", \"火\", \"渡\", \"ワ\", \"飾\", \"余\", \"祭\", \"沈\", \"寓\", \"慣\", \"関\", \"賀\", \"場\", \"K\", \"冨\", \"豆\", \"炒\", \"遼\", \"メ\", \"神\", \"礁\", \"乱\", \"粧\", \"X\", \"稚\", \"揺\", \"の\", \"棚\", \"J\", \"辣\", \"違\", \"届\", \"抜\", \"友\", \"辞\", \"銃\", \"寧\", \"棒\", \"拘\", \"付\", \"脅\", \"臣\", \"姓\", \"旨\", \"桁\", \"亡\", \"陰\", \"乞\", \"K\", \"侵\", \"真\", \"ず\", \"耐\", \"帝\", \"礎\", \"阜\", \"鹿\", \"食\", \"胆\", \"軟\", \"誹\", \"床\", \"汚\", \"暖\", \"^\", \"タ\", \"栗\", \"躇\", \"希\", \"饉\", \"還\", \"寄\", \"澪\", \"奔\", \"貝\", \"畳\", \"速\", \"裂\", \"焼\", \"妙\", \"話\", \"光\", \"病\", \"天\", \"曝\", \"截\", \"伽\", \"台\", \"俵\", \"虐\", \"語\", \"荘\", \"遙\", \"舐\", \"錠\", \"拉\", \"座\", \"梁\", \"汰\", \"怨\", \"②\", \"継\", \"鶏\", \"袋\", \"更\", \":\", \"担\", \"替\", \"R\", \"カ\", \"」\", \"〟\", \"拷\", \"抱\", \"難\", \"劣\", \"ㅂ\", \"避\", \"逮\", \"滅\", \"登\", \"研\", \"脆\", \"寡\", \"U\", \"商\", \"薄\", \"践\", \"慮\", \"酬\", \"添\", \"宿\", \"唸\", \"蝶\", \"循\", \"専\", \"梅\", \"片\", \"算\", \"兼\", \"示\", \"兆\", \"妨\", \"マ\", \"介\", \"評\", \"E\", \"象\", \"股\", \"疎\", \"攻\", \"改\", \"華\", \"9\", \"爆\", \"撤\", \"斗\", \"犬\", \"足\", \"今\", \"壊\", \"次\", \"題\", \"L\", \"鈴\", \"r\", \"コ\", \"荷\", \"或\", \"念\", \"欧\", \"●\", \"擦\", \"篇\", \"潟\", \"ゞ\", \"漑\", \"単\", \"慌\", \"婚\", \"糸\", \"捐\", \"盲\", \"結\", \"啓\", \"推\", \"℃\", \"侶\", \"和\", \"握\", \"戦\", \"楚\", \"隕\", \"ぅ\", \"種\", \"黄\", \"散\", \"在\", \"恨\", \"Z\", \"抹\", \"端\", \"政\", \"訴\", \"反\", \"累\", \"恩\", \"令\", \"戴\", \"浸\", \"愉\", \"驚\", \"ひ\", \"弊\", \"🌙\", \"獲\", \"撮\", \"填\", \"通\", \"家\", \"腐\", \"ジ\", \"》\", \"件\", \"浮\", \"自\", \"逼\", \"督\", \"君\", \"肢\", \"堪\", \"《\", \"延\", \"よ\", \"詮\", \"従\", \"親\", \"感\", \"送\", \"縫\", \"ヾ\", \"急\", \"側\", \"否\", \"毎\", \"質\", \"長\", \"素\", \"巨\", \"大\", \"末\", \"経\", \"奉\", \"宣\", \"能\", \"車\", \"猿\", \"等\", \"も\", \"消\", \"律\", \"覇\", \"察\", \"๑\", \"固\", \"羞\", \"惜\", \"月\", \"詰\", \"丸\", \"戸\", \"召\", \"番\", \"塾\", \"裕\", \"陸\", \"拭\", \"笠\", \"赦\", \"境\", \"木\", \"堡\", \"茶\", \"密\", \"簡\", \"_\", \"〆\", \"阿\", \"瓶\", \"敬\", \"げ\", \"姜\", \"号\", \"ぞ\", \"干\", \"訊\", \"儀\", \"モ\", \"即\", \"判\", \"権\", \"滴\", \"ヶ\", \"煮\", \"黒\", \"周\", \"制\", \"勝\", \"摯\", \"杞\", \"紹\", \"な\", \"◇\", \"ハ\", \"渕\", \"グ\", \"極\", \"遍\", \"何\", \"拠\", \"鎖\", \"匂\", \"隼\", \"憧\", \"旗\", \"板\", \"踊\", \"∇\", \"暢\", \"揄\", \"撃\", \"響\", \"翻\", \"俯\", \"培\", \"岐\", \"゚\", \"突\", \"掘\", \"̀\", \"哲\", \"栄\", \"十\", \"舎\", \"荒\", \"芸\", \"詐\", \"狼\", \"葬\", \"仙\", \"彿\", \"伏\", \"リ\", \"肝\", \"捜\", \"謡\", \"兎\", \"¥\", \"層\", \"装\", \"浦\", \"斎\", \"S\", \"履\", \"陳\", \"松\", \"D\", \"ロ\", \"藁\", \"綴\", \"や\", \"公\", \"使\", \"譲\", \"鶴\", \"忙\", \"酔\", \"魚\", \"勉\", \"淡\", \"浜\", \"ウ\", \"妻\", \"ユ\", \"那\", \"賛\", \"某\", \"絞\", \"絨\", \"覚\", \"坐\", \"掌\", \"性\", \"普\", \"留\", \"♫\", \"術\", \"捕\", \"救\", \"※\", \"彡\", \"苗\", \"迫\", \"宝\", \"伴\", \"初\", \"授\", \"淫\", \"摩\", \"楊\", \"フ\", \"残\", \"習\", \"4\", \"泉\", \"勘\", \"圏\", \"痴\", \"井\", \"庄\", \"幡\", \"秒\", \"菅\", \"画\", \"ュ\", \"構\", \"砂\", \"徴\", \"嗅\", \"醍\", \"碌\", \"姦\", \"派\", \"|\", \"納\", \"噛\", \"好\", \"美\", \"寿\", \"麗\", \"永\", \"麦\", \"ム\", \"況\", \"豊\", \"雨\", \"ィ\", \"塊\", \"喫\", \"洪\", \"肌\", \"珂\", \"会\", \"椒\", \"諏\", \"宇\", \"う\", \"測\", \"液\", \"て\", \"匠\", \"貢\", \"分\", \"剃\", \"〝\", \"パ\", \"諦\", \"認\", \"要\", \"降\", \"庶\", \"詳\", \"ゎ\", \"同\", \"圃\", \"桟\", \"偽\", \"祀\", \"n\", \"恰\", \"裾\", \"故\", \"魂\", \"疾\", \"刀\", \"輿\", \"飽\", \"寺\", \"誉\", \"ぁ\", \"¥\", \"附\", \"俗\", \"嵩\", \"漠\", \"〜\", \"舞\", \"章\", \"被\", \"均\", \"危\", \"灘\", \"既\", \"嬢\", \"載\", \"科\", \"遵\", \"凱\", \"向\", \"郵\", \"怖\", \"彰\", \"f\", \"婿\", \"邸\", \"導\", \"萼\", \"ぶ\", \"複\", \"滓\", \"卓\", \"合\", \"距\", \"講\", \"へ\", \"「\", \"区\", \"浅\", \"y\", \"富\", \"銀\", \"宏\", \"舟\", \"廃\", \"⻑\", \"臓\", \"る\", \"肩\", \"琴\", \"薬\", \"巻\", \"牧\", \"鞄\", \"ど\", \"Ⅶ\", \"回\", \"凡\", \"ァ\", \"訟\", \"絡\", \"便\", \"霧\", \"芝\", \"牛\", \"殴\", \"些\", \"郎\", \"俸\", \"〕\", \"怒\", \"❤\", \"類\", \"児\", \"問\", \"篤\", \"ソ\", \"訓\", \"愕\", \"又\", \"亀\", \"Q\", \"尺\", \"誠\", \"勿\", \"ぉ\", \"業\", \"産\", \"m\", \"圧\", \"置\", \"鑑\", \"逆\", \"恣\", \"?\", \"匙\", \"易\", \"発\", \"屹\", \"蛍\", \"勇\", \"炉\", \"捉\", \"拡\", \"系\", \"腺\", \"書\", \"籠\", \"終\", \"半\", \"祉\", \"叱\", \"i\", \"💦\", \"釜\", \"槽\", \"切\", \"野\", \"李\", \"僅\", \"決\", \"軍\", \"縛\", \"欝\", \"膿\", \"盤\", \"�\", \"陛\", \"景\", \"嗜\", \"尋\", \"墟\", \"訃\", \"核\", \"惚\", \"吐\", \"欺\", \"毒\", \"確\", \"丁\", \"字\", \"Q\", \"出\", \"渦\", \"っ\", \"鍵\", \"腱\", \"就\", \"編\", \"峰\", \"序\", \"完\", \"飛\", \"扉\", \"馴\", \"持\", \"薦\", \"選\", \"道\", \"胸\", \"フ\", \"衝\", \"敷\", \"擢\", \"@\", \"ゲ\", \"紗\", \"串\", \"得\", \"尻\", \"闖\", \"ヒ\", \"泳\", \"眺\", \"凛\", \"表\", \"駐\", \"音\", \"弁\", \"潮\", \"鞘\", \"掬\", \"暑\", \"連\", \"勤\", \"依\", \"襲\", \"忍\", \"昇\", \"E\", \"意\", \"属\", \"我\", \"湖\", \"態\", \"d\", \"欣\", \"池\", \"開\", \"少\", \"た\", \"ー\", \"ぜ\", \"迅\", \"医\", \"濯\", \"ノ\", \"成\", \"バ\", \"渇\", \"妃\", \"於\", \"剰\", \"談\", \"委\", \"第\", \"皇\", \"頼\", \"嘘\", \"孤\", \"蔑\", \"喉\", \"凄\", \"曰\", \"壁\", \"仔\", \"*\", \"排\", \"辱\", \"黙\", \"党\", \"旬\", \"七\", \"薪\", \"髪\", \"棟\", \"浩\", \"秋\", \"艸\", \"N\", \"瞑\", \"釈\", \"滝\", \"2\", \"曖\", \"族\", \"孫\", \"証\", \"瓦\", \"佐\", \"‥\", \"曜\", \"民\", \"随\", \"宜\", \"展\", \"偏\", \"★\", \"鉢\", \"屈\", \"殖\", \"強\", \"穫\", \"新\", \"所\", \"淹\", \"訣\", \"謄\", \"妄\", \"一\", \"疫\", \"烙\", \"兵\", \"沿\", \"幌\", \"ィ\", \"挨\", \"山\", \"運\", \"砦\", \"範\", \"審\", \"短\", \"健\", \"適\", \"滑\", \"捲\", \"障\", \"埼\", \"聞\", \"吸\", \"顧\", \"沸\", \"ね\", \"ヽ\", \"祥\", \"と\", \"ゅ\", \"冬\", \"宅\", \"胞\", \"惣\", \"額\", \"活\", \"射\", \"染\", \"立\", \"魔\", \"拓\", \"痩\", \"面\", \"堤\", \"才\", \"維\", \"○\", \"倒\", \"針\", \"朗\", \"瞬\", \"咽\", \"ご\", \"趨\", \"砕\", \"材\", \"利\", \"雀\", \"ゥ\", \"絆\", \"然\", \"邦\", \"集\", \"安\", \"笛\", \"羽\", \"様\", \"乃\", \"竹\", \"顎\", \"洗\", \"犯\", \"貯\", \"昆\", \"総\", \"箋\", \"生\", \"炭\", \"冒\", \"員\", \"購\", \"寸\", \"緩\", \"僚\", \"涙\", \"根\", \"媒\", \"ェ\", \"魅\", \"Z\", \"径\", \"僭\", \"壮\", \"剣\", \"菌\", \"芳\", \"売\", \"誇\", \"伊\", \"志\", \"飢\", \"慨\", \"宮\", \"釘\", \"稜\", \"懐\", \"革\", \"数\", \"ヤ\", \"披\", \"堆\", \"羅\", \"彼\", \"古\", \"相\", \"w\", \"掻\", \"漏\", \"H\", \"乳\", \"務\", \"刻\", \"郷\", \"只\", \"免\", \"以\", \"嚥\", \"蒸\", \"垠\", \"討\", \"島\", \"灯\", \"こ\", \"悠\", \"腑\", \"逸\", \"情\", \" \", \"擁\", \"嘲\", \"徐\", \"閲\", \"♪\", \"糧\", \"司\", \"瑞\", \"蒙\", \"幹\", \"己\", \"賊\", \"奈\", \"良\", \"居\", \"菓\", \"栓\", \"般\", \"仁\", \"綻\", \"享\", \"浪\", \"弥\", \"厄\", \"諸\", \"爪\", \"崖\", \"腹\", \"英\", \"告\", \"潤\", \"万\", \"G\", \"昏\", \"命\", \"格\", \"挙\", \"水\", \"↑\", \"B\", \"併\", \"底\", \"冗\", \"拾\", \"塞\", \"厨\", \"陽\", \"氷\", \"府\", \"綾\", \"簗\", \"弄\", \"嘗\", \"休\", \"走\", \"署\", \"振\", \"頻\", \"寂\", \"拳\", \"雪\", \"起\", \"謎\", \"G\", \"々\", \"秘\", \"訪\", \"至\", \"込\", \"条\", \"康\", \"投\", \"汲\", \"詞\", \"▼\", \"、\", \"港\", \"勲\", \"J\", \"県\", \"節\", \"枚\", \"犠\", \"杼\", \"左\", \"拙\", \"榴\", \"梓\", \"鱈\", \"荻\", \"緯\", \",\", \"霊\", \"葵\", \"保\", \"杯\", \"昔\", \"ん\", \"絶\", \"$\", \"囁\", \"W\", \"匹\", \"晶\", \"没\", \"撲\", \"逡\", \"幾\", \"草\", \"龍\", \"̈\", \"狂\", \"規\", \"灰\", \"漫\", \"め\", \"暴\", \"妥\", \"脇\", \"乙\", \"扱\", \"攫\", \"撫\", \"指\", \"ナ\", \"迎\", \"模\", \"函\", \"惹\", \"夷\", \"史\", \"朝\", \"白\", \"拝\", \"思\", \"娘\", \"準\", \"考\", \"城\", \"5\", \"涯\", \"盗\", \"貪\", \"徹\", \"穢\", \"罰\", \"④\", \"堵\", \"雇\", \"歴\", \"駒\", \"疑\", \"季\", \" ̄\", \"り\", \"堰\", \"顕\", \"毅\", \"袴\", \"謝\", \";\", \"求\", \"膨\", \"[\", \"灌\", \"優\", \"踏\", \"ヨ\", \"柔\", \"触\", \"ょ\", \"含\", \"。\", \"穏\", \"論\", \"露\", \"敵\", \"笑\", \"盆\", \"海\", \"挟\", \"且\", \"懇\", \"最\", \"哀\", \"住\", \"並\", \"む\", \"琉\", \"D\", \"椅\", \"沖\", \"閃\", \"銭\", \"懲\", \"軋\", \"宙\", \"唯\", \"糾\", \"鋲\", \"鈍\", \"転\", \"隅\", \"世\", \"院\", \"岡\", \"析\", \"斜\", \"静\", \"萎\", \"塩\", \"泥\", \"企\", \"国\", \"ゥ\", \"乾\", \"正\", \"益\", \"叉\", \"林\", \"比\", \"硝\", \"慢\", \"叫\", \"劇\", \"照\", \"詫\", \"午\", \"抵\", \"狩\", \"三\", \"巷\", \"珪\", \"労\", \"手\", \"揶\", \"媛\", \"凝\", \"◯\", \"嶽\", \"途\", \"背\", \"脳\", \"監\", \"塵\", \"閑\", \"将\", \"乏\", \"7\", \"\", \"止\", \"8\", \"-\", \"聴\", \"閉\", \"紋\", \"S\", \"苦\", \"者\", \"卑\", \"貌\", \"餃\", \"溢\", \"翌\", \"弟\", \"貨\", \"透\", \"俳\", \"赴\", \"①\", \"契\", \"釣\", \"拒\", \"窮\", \"嬉\", \"△\", \"診\", \"搬\", \"来\", \"…\", \"粗\", \"ぎ\", \"ぽ\", \"失\", \"洞\", \"法\", \"傍\", \"莫\", \"ゴ\", \"充\", \"奪\", \"腔\", \"恒\", \"茫\", \"袈\", \"形\", \"I\", \"烈\", \"噌\", \"焦\", \"換\", \"猟\", \"き\", \"携\", \"婆\", \"駆\", \"五\", \"料\", \"踪\", \"物\", \"喋\", \"訳\", \"腸\", \"姥\", \"園\", \"H\", \"か\", \"巡\", \"競\", \"造\", \"沙\", \"房\", \"́\", \"冷\", \"智\", \"娠\", \"烹\", \"玄\", \"離\", \"淳\", \"図\", \"曇\", \"甥\", \"〇\", \"捩\", \"重\", \"彌\", \"停\", \"麹\", \"無\", \"琵\", \"興\", \"霞\", \"腰\", \"森\", \"募\", \"怠\", \"敗\", \"艶\", \"威\", \"彷\", \"ば\", \"癖\", \"信\", \"托\", \"F\", \"源\", \"炎\", \"伸\", \"紡\", \"川\", \"女\", \"春\", \"須\", \"燥\", \"彫\", \"電\", \"貫\", \"燭\", \"誤\", \"揚\", \"折\", \"注\", \"爾\", \"袖\", \"見\", \"ゾ\", \"ル\", \"句\", \"竜\", \"腫\", \"醸\", \"枢\", \"駕\", \"碓\", \"愛\", \"睦\", \"斐\", \"繰\", \"寝\", \"悔\", \"ン\", \"掛\", \"室\", \"門\", \"臆\", \"ー\", \"煎\", \"頭\", \"湘\", \"槃\", \"ぇ\", \"臥\", \"A\", \"蓋\", \"震\", \"駄\", \"博\", \"み\", \"厳\", \"欽\", \"孝\", \"ほ\", \"週\", \"悪\", \"控\", \"悶\", \"ラ\", \"風\", \"祖\", \"流\", \"闘\", \"彙\", \"迷\", \"徳\", \"心\", \"両\", \"衿\", \"遺\", \"惨\", \"鍋\", \"唄\", \"ド\", \"訂\", \"跨\", \"を\", \"奴\", \"纏\", \"撒\", \"団\", \"贅\", \"店\", \"鮮\", \"沢\", \"胚\", \"餌\", \"・\", \"耗\", \"呑\", \"氾\", \"激\", \"招\", \"頒\", \"讃\", \"磯\", \"悍\", \"囚\", \"吟\", \"教\", \"鳥\", \"創\", \"昨\", \"与\", \"輪\", \"貿\", \"俊\", \"千\", \"つ\", \"計\", \"貶\", \"粒\", \"M\", \"洒\", \"辿\", \"狙\", \"薙\", \"ゃ\", \"脈\", \"階\", \"筆\", \"崔\", \"痛\", \"服\", \"朴\", \"迭\", \"韮\", \"び\", \"治\", \"エ\", \"例\", \"杏\", \"飲\", \"窃\", \"作\", \"時\", \"実\", \"ぴ\", \"低\", \"祈\", \"裟\", \"凶\", \"崎\", \"移\", \"声\", \"贔\", \"細\", \"狐\", \"琳\", \"←\", \"仰\", \"゚\", \"検\", \"輸\", \"攘\", \"顔\", \"N\", \"究\", \"贋\", \"母\", \"断\", \"ギ\", \"紐\", \"遇\", \"州\", \"田\", \"嶋\", \"非\", \"欄\", \"略\", \"恵\", \"環\", \"婦\", \"予\", \"莽\", \"ヲ\", \"航\", \"=\", \"潰\", \"ヘ\", \"苑\", \"逐\", \"裸\", \"肉\", \"囲\", \"虚\", \"叭\", \"満\", \"O\", \"級\", \"里\", \"混\", \"澤\", \"放\", \"牽\", \"椿\", \"鉱\", \"奇\", \"و\", \"引\", \"】\", \"望\", \"譜\", \"打\", \"サ\", \"だ\", \"鋭\", \"筒\", \"協\", \"案\", \"刃\", \"惑\", \"斑\", \"粘\", \"択\", \"油\", \"魏\", \"ら\", \"市\", \"刷\", \"近\", \"阪\", \"誘\", \"暦\", \"量\", \"遠\", \"凍\", \"珍\", \"布\", \"封\", \"悲\", \"ゆ\", \"把\", \"桃\", \"批\", \"尼\", \"宋\", \"録\", \"桂\", \"蛇\", \"唇\", \"削\", \"具\", \"預\", \"祝\", \"③\", \"喜\", \"殊\", \"色\", \"皮\", \"隙\", \"借\", \"嵌\", \"追\", \"度\", \"祇\", \"硬\", \"恭\", \"偶\", \"彦\", \"柱\", \"ク\", \"隔\", \"菜\", \"揃\", \"裏\", \"禁\", \"着\", \"汎\", \"ω\", \"現\", \"ブ\", \"名\", \"a\", \"套\", \"わ\", \"掃\", \"率\", \"該\", \"裁\", \"嗚\", \"賠\", \"オ\", \"0\", \"廊\", \"l\", \"弾\", \"療\", \"駿\", \"程\", \"稼\", \"軽\", \"骨\", \"桑\", \"基\", \"濃\", \"覗\", \"杓\", \"因\", \"ヘ\", \"ポ\", \"二\", \"o\", \"摘\", \"噂\", \"妖\", \"清\", \"苛\", \"遭\", \"遊\", \"墜\", \"癌\", \"太\", \"彩\", \"搭\", \"衷\", \"紙\", \"券\", \"姑\", \"😢\", \"槍\", \"娯\", \"傑\", \"膏\", \"別\", \"徊\", \"箇\", \"右\", \"ウ\", \"路\", \"▽\", \"蹴\", \"冊\", \"頂\", \"深\", \"熟\", \"刊\", \"雷\", \"目\", \"ニ\", \"肯\", \"刑\", \"リ\", \"億\", \"観\", \"跡\", \"束\", \"賑\", \"琶\", \"各\", \"設\", \"人\", \"械\", \"羊\", \"堂\", \"Ⅹ\", \"楠\", \"梗\", \"読\", \"べ\", \"争\", \"磋\", \"⑧\", \"&\", \"♡\", \"應\", \"岬\", \"罵\", \"状\", \"漁\", \"醐\", \"辺\", \"省\", \"代\", \"記\", \"植\", \"偉\", \"像\", \"挑\", \"怯\", \"煽\", \"明\", \"😭\", \"R\", \"北\", \"花\", \"香\", \"男\", \"憎\", \"騒\", \"四\", \"症\", \"錬\", \"内\", \"中\", \"迦\", \"吠\", \"穀\", \"型\", \"個\", \"駅\", \"間\", \"也\", \"提\", \"始\", \"賢\", \"祠\", \"😌\", \"街\", \">\", \"蜂\", \"農\", \"蔵\", \"ぃ\", \"老\", \"跳\", \"垢\", \"土\", \"仮\", \"段\", \"痢\", \"値\", \"雰\", \"坊\", \"方\", \"積\", \"殺\", \"、\", \"渋\", \"助\", \"卒\", \"盛\", \"入\", \"Д\", \"縞\", \"央\", \"師\", \"捨\", \"葉\", \"峙\", \"施\", \"ロ\", \"項\", \"夕\", \"忠\", \"殻\", \"蝋\", \"広\", \"整\", \"備\", \"昼\", \"気\", \"尖\", \"P\", \"し\", \"す\", \"燃\", \"存\", \"暁\", \"槌\", \"―\", \"索\", \"坪\", \"説\", \"峠\", \"暮\", \"瘻\", \"暫\", \"負\", \"帰\", \"鬱\", \"約\", \"宗\", \"□\", \"町\", \"茂\", \"ヵ\", \"慄\", \"溶\", \"八\", \"匡\", \"杜\", \"諺\", \"煙\", \"窪\", \"テ\", \"防\", \"ヌ\", \"∀\", \"蔽\", \"堅\", \"払\", \"脂\", \"岩\", \"候\", \"云\", \"越\", \"伝\", \"統\", \"虜\", \"当\", \"佳\", \"堺\", \"咳\", \"待\", \"百\", \"涅\", \"詠\", \"綬\", \"揮\", \"劉\", \"褒\", \"躍\", \"慈\", \"ヴ\", \"趣\", \"貰\", \"狭\", \"栃\", \"舘\", \"V\", \"班\", \"斡\", \"衛\", \"館\", \"映\", \"巾\", \"補\", \"梳\", \"営\", \"澄\", \"ぬ\", \"懸\", \"際\", \"摂\", \"品\", \"牲\", \"撰\", \"盟\", \"が\", \"嘆\", \"F\", \"締\", \"詩\", \"請\", \"御\", \"南\", \"貴\", \"‐\", \"肪\", \"沼\", \"嵯\", \"糞\", \"輝\", \"血\", \"必\", \"獣\", \"典\", \"財\", \"夫\", \"腎\", \"レ\", \"▷\", \"窟\", \"殿\", \"冥\", \"幼\", \"頬\", \"受\", \"概\", \"託\", \"靴\", \"凪\", \"枯\", \"身\", \"X\", \"ケ\", \"課\", \"仏\", \"g\", \"力\", \"遅\", \"姉\", \"靄\", \"髭\", \"😊\", \"群\", \"厚\", \"到\", \"繋\", \"符\", \"\\u001b\", \"´\", \"播\", \"✨\", \"幸\", \"づ\", \"儲\", \"<\", \"憲\", \"ち\", \"客\", \"斬\", \"陵\", \"遡\", \"伯\", \"柄\", \"楽\", \"喝\", \"促\", \"行\", \"秩\", \"庭\", \"尚\", \"捧\", \"陥\", \"描\", \"吹\", \"惧\", \"昭\", \"豪\", \"喚\", \"練\", \"邪\", \"歌\", \"奢\", \"隣\", \"Ⅱ\", \"亭\", \"職\", \"ォ\", \"吾\", \"b\", \"痕\", \"壬\", \"退\", \"蠍\", \"灼\", \"小\", \"掴\", \"紛\", \"⑩\", \"唾\", \"僧\", \"齢\", \"テ\", \"浣\", \"媚\", \"部\", \"警\", \"綱\", \".\", \"割\", \"矛\", \"包\", \"晋\", \"【\", \"忘\", \"恐\", \"式\", \"謀\", \"缶\", \"独\", \"誌\", \"村\", \"衣\", \"塚\", \"ア\", \"Y\", \"版\", \"遥\", \"隠\", \"抽\", \"楓\", \"妬\", \"伐\", \"ョ\", \"譚\", \"識\", \"翼\", \"〈\", \"貸\", \"杉\", \"征\", \"塗\", \"双\", \"議\", \"叶\", \"子\", \"ザ\", \"傾\", \"湿\", \"嘩\", \"韓\", \"舗\", \"承\", \"巣\", \"鯖\", \"但\", \"旭\", \"夜\", \"返\", \"豚\", \"ア\", \"述\", \"剤\", \"艦\", \"歳\", \"秀\", \"聖\", \"西\", \"檀\", \"柏\", \"局\", \"呂\", \"闊\", \"平\", \"如\", \"繍\", \"猫\", \"ャ\", \"険\", \"濡\", \"取\", \"帽\", \"籍\", \"列\", \"曽\", \"慎\", \"仲\", \"\", \"旦\", \"辛\", \"″\", \"ミ\", \"理\", \"酒\", \"鼻\", \"悟\", \"ピ\", \"薩\", \"鴻\", \"位\", \"未\", \"↓\", \"賞\", \"湧\", \"喪\", \"`\", \"直\", \"製\", \"丘\", \"定\", \"歪\", \"緻\", \"デ\", \"歩\", \"じ\", \"支\", \"傲\", \"え\", \"蘇\", \"交\", \"T\", \"鍛\", \"修\", \"暗\", \"潜\", \"謂\", \"隊\", \"守\", \"+\", \"洩\", \"⌒\", \"躾\", \"棄\", \"謬\", \"私\", \"癒\", \"稀\", \"球\", \"✧\", \"札\", \"校\", \"咲\", \"㎞\", \"泌\", \"焙\", \"視\", \"憶\", \"報\", \"早\", \"害\", \"慰\", \"限\", \"庫\", \"ぐ\", \"枠\", \"ス\", \"ダ\", \"れ\", \"王\", \"抗\", \"息\", \"年\", \"厭\", \"続\", \"騰\", \"事\", \"」\", \"眠\", \"揉\", \"碍\", \"去\", \"異\", \"廉\", \"果\", \"措\", \"寮\", \"税\", \"妊\", \"屓\", \"帯\", \"怪\", \"昧\", \"絵\", \"養\", \"知\", \"晩\", \"融\", \"崩\", \"査\", \"幽\", \"ノ\", \"シ\", \"帳\", \"滋\", \"侍\", \"A\", \"諾\", \"丼\", \"落\", \"任\", \"鳴\", \"い\", \"ざ\", \"印\", \"甲\", \"曹\", \"岸\", \"技\", \"鎮\", \"胃\", \"誓\", \"做\", \"!\", \"潔\", \"讐\", \"梱\", \"由\", \"篠\", \"堀\", \"励\", \"庇\", \"官\", \"呼\", \"銘\", \"青\", \"波\", \"給\", \"渉\", \"贈\", \" \", \"罪\", \"膚\", \"k\", \"筈\", \"ビ\", \"麓\", \"姫\", \"夏\", \"ま\", \"晒\", \"配\", \"債\", \"汁\", \"策\", \"憤\", \"腕\", \"貼\", \"棲\", \"嫉\", \"舌\", \"ふ\", \"戯\", \"占\", \"く\", \"唱\", \"あ\", \"夢\", \"界\", \"お\", \"菊\", \"瘍\", \"社\", \"]\", \"綜\", \"謙\", \"謗\", \"喩\", \"兄\", \"膜\", \"〔\", \"傷\", \"V\", \"増\", \"郭\", \"涼\", \"欲\", \"麺\", \"寇\", \"胎\", \"有\", \"ッ\", \"ゝ\", \"疹\", \"刺\", \"擬\", \"罠\", \"で\", \"許\", \"縦\", \"患\", \"梨\", \"旧\", \"湯\", \"勢\", \"6\", \"汗\", \"幕\", \"器\", \"互\", \"寒\", \"漢\", \"杖\", \"\", \"皆\", \"け\", \"喇\", \"似\", \"温\", \"噴\", \"写\", \"醤\", \"煩\", \"羨\", \"亜\", \"垣\", \"衡\", \"体\", \"晴\", \"桜\", \"貧\", \"輔\", \"ペ\", \"童\", \"匿\", \"餅\", \"─\", \"h\", \"ヨ\", \"築\", \"俄\", \"米\", \"升\", \"壌\", \"容\", \"超\", \"ぷ\", \"︎\", \"答\", \"膝\", \"鎌\", \"剥\", \"災\", \"飼\", \"幻\", \"屋\", \"帆\", \"〉\", \"軸\", \"谷\", \"倭\", \"酷\", \"肥\", \"僕\", \"睡\", \"若\", \"・\", \"﨑\", \"歓\", \"逢\", \"貞\", \"宴\", \"(\", \"動\", \"浴\", \"熊\", \"憩\", \"礼\", \"克\", \"著\", \"C\", \"吉\", \"漱\", \"忌\", \"寛\", \"さ\", \"鏡\", \"参\", \"盾\", \"紅\", \"矢\", \"捏\", \"緊\", \"傘\", \"頑\", \"牙\", \"奨\", \"瀬\", \"緑\", \"詈\", \"験\", \"接\", \"疇\", \"殆\", \"楼\", \"俺\", \"処\", \"憑\", \"猛\", \"嵐\", \"蛮\", \"甚\", \"票\", \"前\", \"憂\", \"~\", \"徒\", \"嫌\", \"護\", \"忽\", \"O\", \"雄\", \"歯\", \"⑪\", \"領\", \"繊\", \"壇\", \"辰\", \"津\", \"抑\", \"全\", \"愚\", \"倍\", \"耳\", \"据\", \"溜\", \"之\", \"ハ\", \"押\", \"変\", \"久\", \"頷\", \"せ\", \"郡\", \"箱\", \"轢\", \"収\", \"及\", \"遽\", \"臭\", \"爽\", \"戒\", \"覆\", \"往\", \"過\", \"快\", \"躊\", \"阻\", \"悩\", \"醜\", \"調\", \"販\", \"U\", \"操\", \"聾\", \"眉\", \"錯\", \"湾\", \"費\", \"旺\", \"s\", \"副\", \"疲\", \"允\", \"泣\", \"雲\", \"言\", \"可\", \"影\", \"父\", \"順\", \"B\", \"秤\", \"1\", \"尽\", \"陶\", \"戚\", \"誰\", \"口\", \"績\", \"瞭\", \"捺\", \"努\", \"期\", \"纒\", \"化\", \"亮\", \"姿\", \"閣\", \"伺\", \"奥\", \"曲\", \"軒\", \"学\", \"ネ\", \"遣\", \"架\", \"耕\", \"下\", \"旅\", \"鵜\", \"酸\", \"樹\", \"則\", \"殲\", \"斂\", \"肺\", \"後\", \"玉\", \"願\", \")\", \"想\", \"礫\", \"痒\", \"泡\", \"Y\", \"麻\", \"垂\", \"弱\", \"渓\", \"ズ\", \"除\", \"W\", \"脱\", \"衆\", \"空\", \"蛋\", \"梶\", \"脚\", \"看\", \"是\", \"先\", \"挿\", \"藻\", \"ぼ\", \"闇\", \"工\", \"凌\", \"蓮\", \"喧\", \"宛\", \"効\", \"繁\", \"簿\", \"翔\", \"瓢\", \"徨\", \"士\", \"虹\", \"訝\", \"泰\", \"他\", \"縮\", \"窓\", \"網\", \"義\", \"◆\", \"イ\", \"佇\", \"京\", \"氏\", \"畑\", \"進\", \"嫁\", \"゙\", \"挫\", \"援\", \"稿\", \"河\", \"メ\", \"鼓\", \"文\", \"恋\", \"東\", \"廻\", \"為\", \"働\", \"e\", \"\\", \"奮\", \"差\", \"レ\", \"偵\", \"破\", \"石\", \"掲\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/ko": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1524839,
"_n_tokens": 201519,
"_n_chars": 655190,
"_n_oov_chars": 483751,
"oov_ratio": 0.7383369709549902,
"_oov_charset": "[\"%\", \"먼\", \"ᴇ\", \"셔\", \"共\", \"버\", \"증\", \"량\", \"禮\", \"鐘\", \"웅\", \"樺\", \"석\", \"옆\", \"깽\", \"祐\", \"洋\", \"뭥\", \"빛\", \"옌\", \"젤\", \"샀\", \"뒤\", \"굵\", \"붐\", \"메\", \"²\", \"C\", \"잭\", \"ń\", \"Ⅷ\", \"엔\", \"機\", \"댈\", \"地\", \"原\", \"녀\", \"남\", \"星\", \"係\", \"괴\", \"곶\", \"뜹\", \"퀄\", \"즐\", \"六\", \"챙\", \"필\", \"呪\", \"압\", \"랭\", \"뉘\", \"근\", \"셀\", \"用\", \"v\", \"解\", \"콘\", \"經\", \"홈\", \"험\", \"분\", \"직\", \"廟\", \"펌\", \"햄\", \"낡\", \"탈\", \"컷\", \"앵\", \"똥\", \"놔\", \"申\", \"콥\", \"≪\", \"쬐\", \"듬\", \"高\", \"쫓\", \"的\", \"봄\", \"ㅣ\", \"교\", \"外\", \"구\", \"잊\", \"닿\", \"㉰\", \"절\", \"낫\", \"바\", \"븐\", \"◎\", \"육\", \"九\", \"례\", \"죽\", \"느\", \"옥\", \"겠\", \"▒\", \"♧\", \"점\", \"똑\", \"榜\", \"說\", \"것\", \"새\", \"곰\", \"룹\", \"琪\", \"金\", \"🚨\", \"🗺\", \"武\", \"標\", \"㎍\", \"日\", \"땡\", \"섣\", \"렁\", \"록\", \"묶\", \"조\", \"⇒\", \"틀\", \"藝\", \"봉\", \"왠\", \"섦\", \"毛\", \"겁\", \"唐\", \"낀\", \"福\", \"혁\", \"판\", \"致\", \"쨌\", \"◾\", \"뜨\", \"좁\", \"돋\", \"主\", \"吳\", \"關\", \"롱\", \"얏\", \"팍\", \"死\", \"江\", \"常\", \"힉\", \"댔\", \"は\", \"眞\", \"쌍\", \"『\", \"多\", \"높\", \"쾅\", \"굽\", \"特\", \"더\", \"줏\", \"보\", \"☆\", \"淨\", \"긍\", \"不\", \"쌈\", \"角\", \"폿\", \"紀\", \"닳\", \"닷\", \"資\", \"젝\", \"겨\", \"』\", \"아\", \"칵\", \"웰\", \"범\", \"약\", \"⁴\", \"발\", \"멕\", \"上\", \"츠\", \"텔\", \"💣\", \"🔹\", \"↔\", \"빙\", \"ᴄ\", \"혜\", \"망\", \"맡\", \"そ\", \"管\", \"챗\", \"\", \"궜\", \"榮\", \"낳\", \"꺽\", \"맥\", \"善\", \"「\", \"ㅁ\", \"죤\", \"둘\", \"쩔\", \"폄\", \"션\", \"눔\", \"죠\", \"쐬\", \"턱\", \"틸\", \"대\", \"상\", \"劫\", \"융\", \"國\", \"걷\", \"쐐\", \"믄\", \"신\", \"뒀\", \"贖\", \"火\", \"飾\", \"웍\", \"K\", \"퀸\", \"뀔\", \"神\", \"면\", \"X\", \"諒\", \"끄\", \"할\", \"홋\", \"뗀\", \"友\", \"툼\", \"흐\", \"拘\", \"룩\", \"ㅇ\", \"‧\", \"문\", \"슷\", \"不\", \"陰\", \"왓\", \"믹\", \"탐\", \"엎\", \"계\", \"帝\", \"퀘\", \"라\", \"◐\", \"食\", \"엠\", \"짙\", \"💸\", \"풍\", \"돔\", \"짠\", \"빠\", \"쌓\", \"쉰\", \"갚\", \"강\", \"도\", \"휴\", \"光\", \"病\", \"天\", \"맵\", \"킹\", \"광\", \"語\", \"끙\", \"쿤\", \"될\", \"낚\", \"엮\", \"락\", \"엡\", \"볍\", \"汰\", \"헛\", \"머\", \"틋\", \"②\", \"염\", \"겔\", \"째\", \"밌\", \":\", \"콩\", \"♤\", \"」\", \"쉬\", \"놨\", \"궈\", \"濁\", \"뺑\", \"튜\", \"반\", \"\", \"ㅡ\", \"滅\", \"\", \"월\", \"U\", \"商\", \"薄\", \"옐\", \"띄\", \"업\", \"띠\", \"곧\", \"둠\", \"Ⅴ\", \"냈\", \"랄\", \"같\", \"E\", \"귤\", \"쏠\", \"릭\", \"改\", \"華\", \"헌\", \"🙋\", \"斗\", \"犬\", \"앗\", \"코\", \"L\", \"題\", \"次\", \"뭘\", \"듈\", \"끊\", \"겪\", \"ㅕ\", \"똘\", \"박\", \"●\", \"외\", \"노\", \"쥐\", \"婚\", \"배\", \"늘\", \"뿐\", \"콜\", \"좇\", \"結\", \"℃\", \"삣\", \"和\", \"촛\", \"객\", \"쏜\", \"께\", \"딜\", \"꾸\", \"징\", \"뢰\", \"種\", \"껏\", \"셸\", \"찜\", \"웹\", \"梁\", \"탰\", \"흉\", \"넹\", \"政\", \"反\", \"훼\", \"척\", \"쵸\", \"🍟\", \"驚\", \"弊\", \"ㅙ\", \"재\", \"家\", \"》\", \"충\", \"왔\", \"自\", \"떳\", \"떻\", \"君\", \"채\", \"삘\", \"《\", \"얽\", \"웬\", \"찌\", \"➍\", \"否\", \"주\", \"푸\", \"長\", \"맺\", \"🏫\", \"찮\", \"템\", \"大\", \"奉\", \"立\", \"能\", \"칸\", \"씬\", \"난\", \"뱅\", \"ㅈ\", \"팎\", \"띤\", \"◀\", \"펼\", \"◈\", \"휠\", \"月\", \"류\", \"냐\", \"낄\", \"뫼\", \"나\", \"꽉\", \"케\", \"랍\", \"笠\", \"잇\", \"뇌\", \"獻\", \"拜\", \"값\", \"잃\", \"쳇\", \"맛\", \"㎥\", \"쩡\", \"▣\", \"敬\", \"칼\", \"姜\", \"流\", \"쥔\", \"볶\", \"옹\", \"능\", \"팝\", \"👋\", \"덩\", \"👨\", \"캔\", \"악\", \"靈\", \"딩\", \"췌\", \"밥\", \"승\", \"制\", \"ㄱ\", \"닮\", \"俠\", \"◇\", \"♀\", \"싼\", \"弛\", \"동\", \"極\", \"何\", \"됨\", \"챌\", \"켤\", \"읍\", \"옴\", \"렀\", \"덮\", \"병\", \"옛\", \"헐\", \"설\", \"앓\", \"꿀\", \"녕\", \"어\", \"싶\", \"ㅓ\", \"날\", \"쑤\", \"폐\", \"귀\", \"十\", \"춰\", \"뇨\", \"훔\", \"차\", \"ⅳ\", \"꾀\", \"갇\", \"챨\", \"侯\", \"돼\", \"네\", \"S\", \"헤\", \"陳\", \"D\", \"團\", \"껑\", \"샹\", \"公\", \"퀵\", \"푹\", \"魚\", \"튀\", \"妻\", \"센\", \"경\", \"람\", \"겸\", \"렘\", \"某\", \"ⓒ\", \"렇\", \"ㅝ\", \"坐\", \"掌\", \"테\", \"性\", \"留\", \"術\", \"※\", \"핍\", \"헨\", \"初\", \"창\", \"🍔\", \"授\", \"곳\", \"摩\", \"포\", \"걱\", \"發\", \"밋\", \"간\", \"썬\", \"최\", \"싱\", \"烏\", \"譯\", \"젖\", \"블\", \"엄\", \"솟\", \"훗\", \"Ⅳ\", \"폈\", \"뵐\", \"성\", \"랑\", \"셜\", \"쟁\", \"|\", \"궐\", \"好\", \"릉\", \"힜\", \"氣\", \"美\", \"퓰\", \"▲\", \"쳤\", \"永\", \"꿈\", \"ã\", \"술\", \"꼭\", \"⑴\", \"향\", \"液\", \"て\", \"分\", \"겟\", \"흡\", \"믿\", \"ㅗ\", \"얕\", \"同\", \"⑶\", \"뻤\", \"땐\", \"故\", \"윌\", \"림\", \"한\", \"탓\", \"쩌\", \"ㅆ\", \"떤\", \"깔\", \"俗\", \"투\", \"拮\", \"ᴍ\", \"章\", \"Ⅰ\", \"被\", \"載\", \"科\", \"응\", \"向\", \"🍕\", \"걍\", \"홀\", \"샌\", \"카\", \"괜\", \"캇\", \"엑\", \"잖\", \"合\", \"깨\", \"잘\", \"「\", \"롤\", \"堯\", \"화\", \"넵\", \"銀\", \"賣\", \"묵\", \"너\", \"․\", \"훌\", \"수\", \"답\", \"Ⅶ\", \"찬\", \"回\", \"착\", \"핸\", \"낱\", \"뼘\", \"일\", \"ㅚ\", \"펴\", \"擒\", \"캘\", \"폰\", \"邑\", \"곤\", \"〕\", \"❤\", \"類\", \"🥁\", \"개\", \"윗\", \"壽\", \"ʏ\", \"尤\", \"축\", \"Q\", \"듀\", \"봅\", \"業\", \"獨\", \"◦\", \"밟\", \"?\", \"易\", \"래\", \"쇼\", \"뤘\", \"🤭\", \"켐\", \"系\", \"협\", \"書\", \"낼\", \"쟈\", \"려\", \"름\", \"Ⅵ\", \"祉\", \"💦\", \"올\", \"취\", \"野\", \"軍\", \"켰\", \"틱\", \"흰\", \"≤\", \"민\", \"�\", \"쌀\", \"흗\", \"예\", \"毒\", \"濟\", \"字\", \"出\", \"밍\", \"캉\", \"넛\", \"돗\", \"峰\", \"숏\", \"ⓔ\", \"걀\", \"序\", \"득\", \"🌵\", \"밭\", \"팠\", \"選\", \"道\", \"쁜\", \"륜\", \"@\", \"균\", \"💕\", \"덜\", \"쪄\", \"️\", \"🤗\", \"對\", \"긋\", \"력\", \"ㅅ\", \"駐\", \"밴\", \"지\", \"렌\", \"흥\", \"쓕\", \"젓\", \"롯\", \"궤\", \"겉\", \"핵\", \"뼈\", \"산\", \"⑸\", \"🍰\", \"意\", \"톨\", \"낌\", \"꽁\", \"잠\", \"벅\", \"훅\", \"놓\", \"현\", \"베\", \"🤔\", \"썩\", \"랜\", \"촨\", \"슨\", \"뱀\", \"멜\", \"뤼\", \"썸\", \"액\", \"皇\", \"헬\", \"第\", \"졸\", \"엣\", \"칠\", \"曰\", \"실\", \"짚\", \"갈\", \"릴\", \"추\", \"갔\", \"*\", \"七\", \"셌\", \"↕\", \"줘\", \"언\", \"듯\", \"끓\", \"낙\", \"秋\", \"N\", \"넥\", \"냥\", \"族\", \"‥\", \"젠\", \"뻑\", \"닙\", \"民\", \"탱\", \"뜩\", \"씩\", \"있\", \"★\", \"믐\", \"들\", \"켄\", \"新\", \"았\", \"所\", \"뮐\", \"一\", \"갱\", \"갭\", \"섯\", \"떼\", \"치\", \"♥\", \"잔\", \"山\", \"페\", \"첩\", \"걔\", \"헉\", \"헝\", \"適\", \"우\", \"촉\", \"렐\", \"백\", \"㉣\", \"툭\", \"살\", \"꽤\", \"셉\", \"봇\", \"쩐\", \"저\", \"㎡\", \"ㅎ\", \"빅\", \"쿨\", \"冬\", \"뒷\", \"射\", \"ⅰ\", \"쨍\", \"🙆\", \"立\", \"魔\", \"쾨\", \"面\", \"침\", \"🚿\", \"요\", \"才\", \"蟄\", \"○\", \"봐\", \"닝\", \"원\", \"짜\", \"억\", \"벚\", \"댐\", \"으\", \"몇\", \"利\", \"윤\", \"ㄴ\", \"짧\", \"然\", \"邦\", \"년\", \"安\", \"集\", \"乃\", \"竹\", \"촬\", \"굳\", \"녹\", \"즉\", \"큐\", \"員\", \"生\", \"얍\", \"🏻\", \"밸\", \"ㅠ\", \"환\", \"쫀\", \"뺐\", \"Z\", \"듣\", \"찔\", \"켓\", \"志\", \"열\", \"즌\", \"태\", \"宮\", \"樂\", \"革\", \"싣\", \"매\", \"활\", \"른\", \"층\", \"멈\", \"덴\", \"古\", \"相\", \"습\", \"럭\", \"H\", \"乳\", \"랙\", \"길\", \"탬\", \"잤\", \"情\", \" \", \"줌\", \"蒙\", \"♪\", \"딱\", \"장\", \"己\", \"良\", \"눈\", \"쎈\", \"⚀\", \"폴\", \"곡\", \"居\", \"仁\", \"과\", \"꿕\", \"英\", \"였\", \"G\", \"위\", \"숙\", \"⊙\", \"ⅲ\", \"命\", \"횡\", \"쎄\", \"둡\", \"水\", \"↑\", \"맷\", \"ㅘ\", \"뭉\", \"綃\", \"제\", \"녜\", \"陽\", \"雙\", \"넘\", \"氷\", \"뻔\", \"😗\", \"팟\", \"벨\", \"쭉\", \"ㅊ\", \"雪\", \"짬\", \"이\", \"쑥\", \"탁\", \"숫\", \"왼\", \"밖\", \"짐\", \"至\", \"끗\", \"흔\", \"탠\", \"〮\", \"음\", \"康\", \"投\", \"관\", \"뜻\", \"▼\", \"팬\", \"뿌\", \"땅\", \"돠\", \"프\", \"컴\", \"쏭\", \"J\", \"節\", \"촌\", \"뮌\", \"빌\", \"荻\", \"숯\", \"땀\", \"눌\", \"법\", \"앉\", \"힐\", \"퇴\", \"굿\", \"꿇\", \"졌\", \"끝\", \"W\", \"ㄹ\", \"꼬\", \"草\", \"龍\", \"핏\", \"德\", \"밝\", \"사\", \"복\", \"칭\", \"펀\", \"중\", \"乙\", \"쒀\", \"공\", \"🙇\", \"토\", \"史\", \"朝\", \"臺\", \"죄\", \"白\", \"골\", \"쁘\", \"思\", \"빔\", \"城\", \"뾱\", \"ç\", \"준\", \"슴\", \"罰\", \"쩍\", \"얄\", \"퓨\", \"④\", \"뚝\", \"峴\", \"킥\", \"벽\", \"➋\", \"데\", \"價\", \"謝\", \"求\", \"璿\", \"짢\", \"행\", \"령\", \"숨\", \"써\", \"빚\", \"삼\", \"ㅒ\", \"십\", \"。\", \"論\", \"짱\", \"펙\", \"海\", \"댁\", \"슬\", \"쁨\", \"哀\", \"曆\", \"셨\", \"접\", \"캐\", \"율\", \"북\", \"院\", \"世\", \"靑\", \"내\", \"陸\", \"줍\", \"析\", \"詔\", \"會\", \"톱\", \"온\", \"▶\", \"正\", \"將\", \"林\", \"킁\", \"을\", \"比\", \"😂\", \"ⅱ\", \"눴\", \"만\", \"씨\", \"딥\", \"쪼\", \"三\", \"끔\", \"뀐\", \"덟\", \"합\", \"手\", \"옳\", \"옵\", \"흩\", \"랩\", \"빼\", \"韜\", \"🍭\", \"펠\", \"途\", \"챔\", \"크\", \"렸\", \"첸\", \"\", \"紋\", \"\", \"끽\", \"딛\", \"늄\", \"ᴀ\", \"者\", \"덧\", \"띈\", \"혈\", \"弟\", \"썅\", \"①\", \"훠\", \"탄\", \"窮\", \"두\", \"△\", \"꽂\", \"…\", \"쏘\", \"궁\", \"洞\", \"法\", \"팽\", \"톡\", \"🦄\", \"緞\", \"져\", \"實\", \"칫\", \"I\", \"돈\", \"臀\", \"換\", \"탕\", \"趺\", \"五\", \"삶\", \"料\", \"납\", \"알\", \"방\", \"깁\", \"🦅\", \"學\", \"쓴\", \"벳\", \"틈\", \"빕\", \"巡\", \"옷\", \"👍\", \"턴\", \"❍\", \"房\", \"폼\", \"離\", \"∙\", \"ㅏ\", \"비\", \"냅\", \"떡\", \"마\", \"금\", \"의\", \"無\", \"멋\", \"삿\", \"틔\", \"✈\", \"쉽\", \"섞\", \"ㅑ\", \"🌳\", \"뜰\", \"섰\", \"픕\", \"딤\", \"ㅔ\", \"誡\", \"信\", \"F\", \"썹\", \"川\", \"女\", \"春\", \"➏\", \"놈\", \"燭\", \"송\", \"본\", \"첨\", \"소\", \"목\", \"거\", \"뱃\", \"또\", \"파\", \"를\", \"뛴\", \"敎\", \"맘\", \"뺏\", \"㈜\", \"쯤\", \"愛\", \"짝\", \"냠\", \"호\", \"킴\", \"떄\", \"다\", \"깅\", \"門\", \"좌\", \"쿠\", \"떠\", \"└\", \"頭\", \"낮\", \"臥\", \"굉\", \"터\", \"🤟\", \"닥\", \"孝\", \"략\", \"딸\", \"ɪ\", \"캡\", \"텍\", \"ㅟ\", \"찾\", \"徳\", \"心\", \"깊\", \"퀀\", \"춤\", \"웃\", \"덕\", \"읊\", \"욥\", \"냄\", \"璣\", \"르\", \"歲\", \"💡\", \"솔\", \"롬\", \"륭\", \"맴\", \"鮮\", \"뮈\", \"암\", \"쥰\", \"렴\", \"슐\", \"劍\", \"뻗\", \"팹\", \"빈\", \"품\", \"밑\", \"쌩\", \"ᴡ\", \"퉁\", \"텁\", \"천\", \"貿\", \"툴\", \"램\", \"앎\", \"M\", \"때\", \"럽\", \"꺾\", \"종\", \"톰\", \"첼\", \"님\", \"텅\", \"키\", \"治\", \"손\", \"책\", \"뜬\", \"측\", \"꼈\", \"영\", \"빨\", \"時\", \"찢\", \"뺀\", \"瀧\", \"◑\", \"밉\", \"낍\", \"철\", \"봤\", \"←\", \"깝\", \"렵\", \"털\", \"갉\", \"학\", \"캠\", \"혼\", \"튬\", \"릇\", \"둬\", \"쥬\", \"탭\", \"略\", \"커\", \"었\", \"함\", \"뤄\", \"튼\", \"흘\", \"뭐\", \"悧\", \"엉\", \"좀\", \"빗\", \"肉\", \"에\", \"좋\", \"O\", \"벤\", \"뚜\", \"택\", \"里\", \"운\", \"뛸\", \"얼\", \"】\", \"벙\", \"望\", \"섬\", \"킨\", \"획\", \"뿍\", \"통\", \"協\", \"레\", \"퍼\", \"힙\", \"닭\", \"ㅋ\", \"삽\", \"럼\", \"體\", \"고\", \"했\", \"퍽\", \"뮬\", \"布\", \"팁\", \"쁠\", \"싸\", \"꺄\", \"벗\", \"宋\", \"켜\", \"꽝\", \"😱\", \"왜\", \"③\", \"급\", \"싫\", \"힘\", \"앨\", \"ㄷ\", \"色\", \"깡\", \"皮\", \"숍\", \"컵\", \"얻\", \"닐\", \"🤕\", \"멤\", \"즙\", \"뵙\", \"던\", \"엿\", \"戊\", \"옮\", \"펩\", \"맑\", \"ω\", \"혀\", \"現\", \"💌\", \"잡\", \"렉\", \"작\", \"참\", \"몫\", \"쫗\", \"완\", \"렷\", \"킌\", \"검\", \"넣\", \"좆\", \"낯\", \"程\", \"캣\", \"鎭\", \"촘\", \"빵\", \"용\", \"눠\", \"눅\", \"폭\", \"픔\", \"팩\", \"앰\", \"웁\", \"🌿\", \"총\", \"무\", \"극\", \"플\", \"특\", \"여\", \"理\", \"휘\", \"紙\", \"쯔\", \"壞\", \"결\", \"엇\", \"›\", \"팜\", \"룬\", \"양\", \"쌉\", \"쪽\", \"트\", \"색\", \"듭\", \"큽\", \"엘\", \"뭇\", \"◼\", \"딧\", \"黃\", \"표\", \"몹\", \"目\", \"\", \"담\", \"뽑\", \"✔\", \"희\", \"픽\", \"人\", \"랫\", \"생\", \"확\", \"번\", \"堂\", \"Ⅹ\", \"며\", \"힌\", \"⑧\", \"♡\", \"應\", \"텝\", \"🍎\", \"켠\", \"꼽\", \"텐\", \"슈\", \"짤\", \"쓰\", \"하\", \"代\", \"像\", \"킬\", \"씽\", \"明\", \"😭\", \"R\", \"北\", \"맬\", \"男\", \"기\", \"中\", \"팡\", \"핥\", \"穀\", \"ㆍ\", \"및\", \"맨\", \"큰\", \"륨\", \"間\", \"戌\", \"훈\", \"始\", \"렛\", \"펑\", \"蜀\", \"효\", \"農\", \"∮\", \"볕\", \"흙\", \"土\", \"각\", \"체\", \"링\", \"參\", \"벼\", \"方\", \"륵\", \"專\", \"殺\", \"콰\", \"槪\", \"卒\", \"꿰\", \"탑\", \"觸\", \"빤\", \"타\", \"師\", \"峙\", \"국\", \"變\", \"많\", \"渴\", \"卽\", \"낸\", \"☀\", \"롸\", \"깜\", \"홑\", \"홉\", \"샷\", \"齋\", \"샴\", \"P\", \"し\", \"쫑\", \"읽\", \"앞\", \"늬\", \"す\", \"츈\", \"存\", \"픈\", \"―\", \"친\", \"왁\", \"클\", \"연\", \"맞\", \"뀌\", \"굶\", \"큼\", \"뎀\", \"댄\", \"巳\", \"□\", \"宗\", \"ᴛ\", \"八\", \"늙\", \"갓\", \"건\", \"숭\", \"명\", \"글\", \"왕\", \"야\", \"존\", \"갯\", \"百\", \"히\", \"씌\", \"욜\", \"풀\", \"詠\", \"풋\", \"짊\", \"게\", \"솥\", \"괄\", \"롭\", \"슝\", \"金\", \"못\", \"胡\", \"쾌\", \"돌\", \"껍\", \"부\", \"볼\", \"衛\", \"단\", \"흄\", \"앙\", \"막\", \"쟤\", \"났\", \"際\", \"魯\", \"샬\", \"덤\", \"屠\", \"盟\", \"멍\", \"튄\", \"∼\", \"뜯\", \"덥\", \"잎\", \"깐\", \"쓸\", \"인\", \"집\", \"뚫\", \"南\", \"御\", \"곁\", \"⑹\", \"±\", \"놀\", \"입\", \"벌\", \"ㅜ\", \"典\", \"그\", \"겹\", \"갤\", \"넷\", \"▷\", \"흠\", \"킷\", \"콕\", \"톤\", \"쇠\", \"릎\", \"식\", \"낭\", \"련\", \"허\", \"칩\", \"枯\", \"멘\", \"👏\", \"감\", \"課\", \"識\", \"텨\", \"😊\", \"群\", \"없\", \"㏊\", \"런\", \"되\", \"묻\", \"客\", \"모\", \"빴\", \"켈\", \"릿\", \"行\", \"둥\", \"츄\", \"뉜\", \"쿡\", \"텀\", \"훨\", \"쉼\", \"속\", \"밧\", \"격\", \"昭\", \"빳\", \"률\", \"넬\", \"Ⅱ\", \"亭\", \"럿\", \"엽\", \"숟\", \"브\", \"內\", \"녘\", \"뽐\", \"횟\", \"륙\", \"욱\", \"퍙\", \"팅\", \"➌\", \"튿\", \"묘\", \"部\", \"쿵\", \"警\", \"\", \"包\", \"췄\", \"【\", \"衣\", \"藥\", \"질\", \"햇\", \"춘\", \"쿼\", \"悖\", \"즈\", \"녁\", \"섭\", \"댓\", \"폍\", \"럴\", \"랴\", \"변\", \"선\", \"둑\", \"갑\", \"〈\", \"貸\", \"홍\", \"시\", \"子\", \"韓\", \"삭\", \"팥\", \"툰\", \"ᴏ\", \"랬\", \"⋅\", \"夜\", \"껴\", \"述\", \"곱\", \"聖\", \"견\", \"킵\", \"닛\", \"ㅍ\", \"쇄\", \"뿔\", \"맹\", \"平\", \"료\", \"형\", \"籍\", \"뮤\", \"랐\", \"족\", \"仲\", \"울\", \"理\", \"딘\", \"닫\", \"은\", \"초\", \"해\", \"꿔\", \"세\", \"↓\", \"直\", \"불\", \"뛰\", \"적\", \"녔\", \"붕\", \"🙌\", \"交\", \"T\", \"修\", \"닌\", \"守\", \"累\", \"후\", \"늑\", \"朱\", \"오\", \"썰\", \"말\", \"쉴\", \"㎞\", \"않\", \"욕\", \"룡\", \"飮\", \"샤\", \"잰\", \"팰\", \"편\", \"얘\", \"순\", \"王\", \"抗\", \"年\", \"웨\", \"휙\", \"당\", \"事\", \"亨\", \"」\", \"맙\", \"짓\", \"잦\", \"임\", \"윈\", \"섹\", \"핀\", \"논\", \"핫\", \"知\", \"푼\", \"假\", \"워\", \"💰\", \"싯\", \"A\", \"먹\", \"🍞\", \"い\", \"굴\", \"뭔\", \"甲\", \"핑\", \"받\", \"技\", \"찍\", \"숲\", \"피\", \"듐\", \"¹\", \"싹\", \"㉠\", \"숱\", \"왘\", \"닉\", \"ㅖ\", \"닦\", \"☎\", \"가\", \" \", \"널\", \"콤\", \"≫\", \"귈\", \"붙\", \"솨\", \"씹\", \"는\", \"띕\", \"껀\", \"⑥\", \"첫\", \"론\", \"잉\", \"씀\", \"젊\", \"蚩\", \"😣\", \"정\", \"꼴\", \"쭙\", \"떴\", \"☞\", \"界\", \"규\", \"군\", \"줬\", \"樂\", \"社\", \"戮\", \"兄\", \"앱\", \"〔\", \"V\", \"밀\", \"넌\", \"꽃\", \"퀴\", \"루\", \"ㅞ\", \"有\", \"뻐\", \"′\", \"끈\", \"\", \"깃\", \"청\", \"물\", \"곽\", \"勢\", \"밤\", \"漢\", \"릅\", \"냉\", \"슛\", \"앤\", \"와\", \"➎\", \"컨\", \"됩\", \"빡\", \"잣\", \"걸\", \"패\", \"衡\", \"童\", \"❏\", \"잼\", \"쭈\", \"米\", \"컸\", \"쫄\", \"몸\", \"︎\", \"떨\", \"龍\", \"권\", \"긴\", \"멸\", \"캄\", \"드\", \"줄\", \"\", \"란\", \"⑨\", \"몽\", \"넓\", \"〉\", \"혐\", \"谷\", \"펜\", \"봬\", \"윙\", \"따\", \"애\", \"솜\", \"➊\", \"돕\", \"샘\", \"・\", \"셋\", \"갖\", \"붉\", \"즘\", \"끌\", \"웖\", \"룰\", \"動\", \"미\", \"꿨\", \"흑\", \"등\", \"갛\", \"寛\", \"💅\", \"됬\", \"멀\", \"든\", \"⑦\", \"틴\", \"러\", \"뱉\", \"뷰\", \"썼\", \"튠\", \"벵\", \"전\", \"렜\", \"짖\", \"니\", \"女\", \"뜸\", \"雄\", \"유\", \"서\", \"누\", \"辰\", \"삐\", \"津\", \"全\", \"쿰\", \"之\", \"된\", \"처\", \"♣\", \"💥\", \"깥\", \"별\", \"쫒\", \"움\", \"쳐\", \"혹\", \"티\", \"쿄\", \"數\", \"Ⅸ\", \"⬇\", \"안\", \"겼\", \"항\", \"델\", \"뽀\", \"覆\", \"됐\", \"컬\", \"🏷\", \"긁\", \"칙\", \"심\", \"회\", \"잴\", \"평\", \"찰\", \"겐\", \"꺼\", \"스\", \"샵\", \"휩\", \"훑\", \"황\", \"역\", \"s\", \"副\", \"웠\", \"셰\", \"렬\", \"雲\", \"言\", \"可\", \"B\", \"눕\", \"⑤\", \"口\", \"씻\", \"化\", \"익\", \"軒\", \"찼\", \"얇\", \"팀\", \"£\", \"茅\", \"펄\", \"뷔\", \"耕\", \"진\", \"下\", \"짭\", \"딴\", \"붓\", \"ㅛ\", \"樹\", \"玉\", \"後\", \"룸\", \"뉴\", \"跏\", \"괌\", \"팔\", \"Y\", \"샐\", \"독\", \"꿍\", \"脱\", \"춥\", \"淘\", \"㉿\", \"얹\", \"자\", \"끼\", \"先\", \"땠\", \"ㅐ\", \"⑵\", \"린\", \"工\", \"셈\", \"늦\", \"므\", \"둔\", \"춧\", \"김\", \"엌\", \"Ⅲ\", \"출\", \"쏟\", \"농\", \"꾼\", \"◆\", \"뿜\", \"京\", \"디\", \"얀\", \"쉘\", \"로\", \"몰\", \"립\", \"딪\", \"까\", \"념\", \"文\", \"뎅\", \"넨\", \"東\", \"ʟ\", \"燦\", \"몬\", \"쏙\", \"ㅢ\", \"혔\", \"넉\", \"달\", \"리\"]",
"lossless": false
},
"dbmdz/bert-base-german-uncased @ cc100/zh-Hans": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 2633047,
"_n_tokens": 879155,
"_n_chars": 927311,
"_n_oov_chars": 870676,
"oov_ratio": 0.9389255600332574,
"_oov_charset": "[\"%\", \"调\", \"共\", \"骰\", \"饶\", \"痫\", \"芬\", \"瘠\", \"缝\", \"弗\", \"敏\", \"姚\", \"称\", \"\\b\", \"墓\", \"讥\", \"丙\", \"篢\", \"玛\", \"陪\", \"株\", \"饿\", \"欠\", \"其\", \"黩\", \"俭\", \"沧\", \"逑\", \"洋\", \"硫\", \"旆\", \"敞\", \"弘\", \"榭\", \"场\", \"曾\", \"糠\", \"挈\", \"巧\", \"诶\", \"码\", \"份\", \"岖\", \"C\", \"徘\", \"滞\", \"荣\", \"咎\", \"扇\", \"鲍\", \"逊\", \"地\", \"原\", \"凭\", \"睿\", \"袱\", \"籽\", \"珠\", \"揽\", \"星\", \"划\", \"昂\", \"拗\", \"娇\", \"甘\", \"醋\", \"浚\", \"诱\", \"枝\", \"姻\", \"芙\", \"曼\", \"馏\", \"唬\", \"席\", \"轩\", \"浞\", \"加\", \"六\", \"篝\", \"桥\", \"泽\", \"咖\", \"劈\", \"捍\", \"皱\", \"用\", \"解\", \"压\", \"闸\", \"叩\", \"淆\", \"T\", \"蝉\", \"豁\", \"饰\", \"喔\", \"/\", \"肘\", \"\", \"丹\", \"虽\", \"睐\", \"闫\", \"钞\", \"饮\", \"曳\", \"缔\", \"卤\", \"涤\", \"坚\", \"纬\", \"毙\", \"啜\", \"括\", \"钦\", \"蜡\", \"申\", \"疙\", \"蜥\", \"欸\", \"厥\", \"供\", \"卷\", \"夺\", \"鸩\", \"寥\", \"歉\", \"挲\", \"涮\", \"探\", \"挽\", \"高\", \"赖\", \"峨\", \"的\", \"种\", \"微\", \"璧\", \"紫\", \"找\", \"赢\", \"饽\", \"需\", \"外\", \"旋\", \"炫\", \"瑕\", \"冰\", \"窒\", \"勃\", \"侃\", \"值\", \"斧\", \"筷\", \"孜\", \"嵘\", \"献\", \"熄\", \"仓\", \"ト\", \"鬼\", \"撼\", \"九\", \"韧\", \"埋\", \"役\", \"轶\", \"迄\", \"埃\", \"陌\", \"刹\", \"够\", \"秆\", \"粉\", \"肛\", \"榜\", \"弓\", \"浇\", \"吃\", \"赠\", \"唆\", \"蒋\", \"该\", \"金\", \"简\", \"层\", \"琪\", \"武\", \"嫂\", \"溃\", \"遂\", \"雅\", \"谴\", \"谛\", \"日\", \"溯\", \"標\", \"孩\", \"困\", \"寨\", \"轨\", \"脯\", \"糖\", \"船\", \"剧\", \"牌\", \"泄\", \"乔\", \"渲\", \"柿\", \"机\", \"孽\", \"衰\", \"晾\", \"歇\", \"惰\", \"穴\", \"蔓\", \"哒\", \"豌\", \"长\", \"哨\", \"坂\", \"辜\", \"裘\", \"円\", \"绚\", \"恺\", \"总\", \"萦\", \"厌\", \"玫\", \"毛\", \"t\", \"擂\", \"眩\", \"吏\", \"腓\", \"睬\", \"幅\", \"域\", \"都\", \"阶\", \"谐\", \"佝\", \"塘\", \"粽\", \"唐\", \"首\", \"跪\", \"虫\", \"福\", \"箭\", \"\\u0007\", \"伦\", \"员\", \"致\", \"询\", \"枕\", \"瘾\", \"卵\", \"梯\", \"損\", \"忑\", \"漂\", \"主\", \"舶\", \"财\", \"垛\", \"酿\", \"精\", \"伤\", \"死\", \"江\", \"常\", \"再\", \"郜\", \"眨\", \"妹\", \"皈\", \"谢\", \"拍\", \"『\", \"多\", \"栏\", \"铩\", \"冀\", \"蓄\", \"颓\", \"菩\", \"飙\", \"焊\", \"催\", \"特\", \"演\", \"懵\", \"磨\", \"塔\", \"俩\", \"娑\", \"畴\", \"岳\", \"却\", \"不\", \"酵\", \"角\", \"蕾\", \"炖\", \"赤\", \"诠\", \"挪\", \"惺\", \"础\", \"远\", \"仕\", \"育\", \"掺\", \"』\", \"筋\", \"資\", \"谧\", \"怕\", \"逃\", \"萧\", \"吞\", \"戍\", \"茨\", \"嘛\", \"尊\", \"臊\", \"皿\", \"敢\", \"畸\", \"逛\", \"栽\", \"上\", \"瞳\", \"味\", \"鉴\", \"冯\", \"孕\", \"畜\", \"钢\", \"锄\", \"辽\", \"驳\", \"读\", \"藤\", \"剩\", \"藉\", \"栈\", \"簇\", \"庚\", \"本\", \"针\", \"耶\", \"溉\", \"颜\", \"汀\", \"管\", \"抢\", \"抖\", \"3\", \"浊\", \"盒\", \"彗\", \"善\", \"棺\", \"烊\", \"亿\", \"丈\", \"义\", \"缚\", \"蹲\", \"竿\", \"羚\", \"胳\", \"跋\", \"咸\", \"髓\", \"岣\", \"隆\", \"笨\", \"琢\", \"採\", \"尿\", \"\", \"鹭\", \"侦\", \"语\", \"赎\", \"旖\", \"呆\", \"荨\", \"劫\", \"曦\", \"呈\", \"玻\", \"元\", \"点\", \"呗\", \"侬\", \"侮\", \"锋\", \"桦\", \"兴\", \"舰\", \"祛\", \"尾\", \"嫖\", \"暇\", \"楔\", \"功\", \"泊\", \"奏\", \"虎\", \"建\", \"睁\", \"了\", \"眼\", \"晰\", \"横\", \"火\", \"渡\", \"疗\", \"茧\", \"盏\", \"枪\", \"叼\", \"吻\", \"余\", \"渊\", \"沈\", \"祭\", \"寓\", \"焉\", \"蓟\", \"嗪\", \"呕\", \"晨\", \"祟\", \"经\", \"K\", \"开\", \"豆\", \"犷\", \"炒\", \"楞\", \"樊\", \"挂\", \"汽\", \"传\", \"神\", \"礁\", \"芒\", \"乱\", \"X\", \"稚\", \"岱\", \"の\", \"卿\", \"棚\", \"辣\", \"稳\", \"届\", \"酪\", \"友\", \"辞\", \"册\", \"准\", \"棠\", \"棒\", \"险\", \"训\", \"车\", \"拘\", \"付\", \"毕\", \"邋\", \"涌\", \"臣\", \"姓\", \"旨\", \"馒\", \"坑\", \"亡\", \"乞\", \"吩\", \"撷\", \"靡\", \"瘙\", \"扎\", \"侵\", \"真\", \"裆\", \"韦\", \"衔\", \"扳\", \"肚\", \"呐\", \"挺\", \"耐\", \"挖\", \"帝\", \"佛\", \"此\", \"阜\", \"傻\", \"胆\", \"食\", \"鹿\", \"窜\", \"弦\", \"棋\", \"床\", \"荼\", \"买\", \"暖\", \"框\", \"吝\", \"辐\", \"栗\", \"躇\", \"希\", \"寄\", \"啬\", \"尹\", \"濮\", \"奔\", \"霓\", \"搅\", \"莱\", \"速\", \"裂\", \"收\", \"茏\", \"妙\", \"耸\", \"光\", \"炅\", \"病\", \"天\", \"曝\", \"截\", \"伽\", \"台\", \"铛\", \"钩\", \"显\", \"虐\", \"鄯\", \"汐\", \"樟\", \"噢\", \"舐\", \"鬣\", \"拉\", \"憋\", \"泻\", \"润\", \"座\", \"穿\", \"梁\", \"甜\", \"汰\", \"倏\", \"嗓\", \"怨\", \"呷\", \"②\", \"韫\", \"赚\", \"售\", \"窖\", \"瞻\", \"臻\", \"贡\", \"袋\", \"袒\", \"阵\", \"镭\", \"更\", \":\", \"擎\", \"犟\", \"担\", \"队\", \"替\", \"萄\", \"龙\", \"ὐ\", \"废\", \"」\", \"拷\", \"婪\", \"抱\", \"躁\", \"泾\", \"肤\", \"堕\", \"劣\", \"荤\", \"驻\", \"避\", \"逮\", \"咋\", \"登\", \"研\", \"脆\", \"寡\", \"U\", \"商\", \"忡\", \"薄\", \"践\", \"弯\", \"酬\", \"壑\", \"添\", \"宿\", \"慮\", \"蝶\", \"循\", \"薯\", \"挠\", \"柬\", \"蛛\", \"狄\", \"梅\", \"片\", \"兼\", \"算\", \"碱\", \"屣\", \"舅\", \"示\", \"宪\", \"兆\", \"绥\", \"咱\", \"妨\", \"蚪\", \"介\", \"砍\", \"E\", \"费\", \"象\", \"股\", \"懊\", \"攻\", \"锚\", \"改\", \"巢\", \"9\", \"爆\", \"擞\", \"篮\", \"仗\", \"撤\", \"塑\", \"斗\", \"晖\", \"竺\", \"构\", \"犬\", \"足\", \"今\", \"L\", \"次\", \"挥\", \"r\", \"抡\", \"殉\", \"芯\", \"嚎\", \"湛\", \"或\", \"荷\", \"橱\", \"念\", \"欧\", \"很\", \"芦\", \"嘉\", \"●\", \"俘\", \"篇\", \"擦\", \"丐\", \"炕\", \"邯\", \"效\", \"耍\", \"婚\", \"慌\", \"绅\", \"捐\", \"辙\", \"盲\", \"裴\", \"淖\", \"推\", \"妈\", \"℃\", \"饷\", \"猬\", \"尘\", \"谩\", \"ě\", \"悉\", \"和\", \"握\", \"鞍\", \"楚\", \"鹃\", \"棵\", \"脸\", \"赛\", \"撑\", \"柜\", \"涡\", \"姆\", \"黄\", \"散\", \"袭\", \"扭\", \"在\", \"啡\", \"恨\", \"帐\", \"抹\", \"端\", \"辫\", \"政\", \"妮\", \"帜\", \"鑫\", \"怜\", \"反\", \"拐\", \"颈\", \"晚\", \"禾\", \"坟\", \"饨\", \"累\", \"恩\", \"令\", \"戴\", \"济\", \"泯\", \"浸\", \"渎\", \"愉\", \"懒\", \"弊\", \"ς\", \"储\", \"填\", \"通\", \"家\", \"瑨\", \"腐\", \"杂\", \"》\", \"件\", \"浮\", \"自\", \"逼\", \"督\", \"茎\", \"君\", \"胶\", \"廖\", \"肢\", \"堪\", \"《\", \"延\", \"逻\", \"缠\", \"鹕\", \"默\", \"诞\", \"恶\", \"馆\", \"婶\", \"感\", \"刮\", \"帕\", \"送\", \"挤\", \"轻\", \"急\", \"稻\", \"沐\", \"诅\", \"县\", \"否\", \"奶\", \"恍\", \"惩\", \"矩\", \"毎\", \"铲\", \"洲\", \"狈\", \"脖\", \"巨\", \"连\", \"绎\", \"素\", \"大\", \"页\", \"末\", \"奉\", \"篡\", \"宣\", \"能\", \"姊\", \"郴\", \"等\", \"钻\", \"茉\", \"消\", \"律\", \"憨\", \"察\", \"澜\", \"遴\", \"哄\", \"桐\", \"固\", \"聆\", \"羞\", \"惜\", \"圾\", \"铝\", \"月\", \"召\", \"丸\", \"戸\", \"统\", \"番\", \"á\", \"裕\", \"肃\", \"孔\", \"拭\", \"逅\", \"蕉\", \"倾\", \"氰\", \"绒\", \"箔\", \"邕\", \"儒\", \"拜\", \"彭\", \"扪\", \"漉\", \"缜\", \"殷\", \"皙\", \"境\", \"堡\", \"木\", \"密\", \"韵\", \"茶\", \"_\", \"鲱\", \"忧\", \"徙\", \"蚂\", \"阿\", \"瓶\", \"敬\", \"眷\", \"姜\", \"赂\", \"号\", \"厕\", \"\", \"纱\", \"磁\", \"熬\", \"干\", \"冠\", \"捡\", \"龚\", \"卜\", \"滇\", \"即\", \"叹\", \"牟\", \"饵\", \"判\", \"阽\", \"绸\", \"惘\", \"滴\", \"煮\", \"鞭\", \"竟\", \"瑜\", \"躲\", \"顺\", \"挎\", \"周\", \"制\", \"弹\", \"疵\", \"撇\", \"蒜\", \"问\", \"带\", \"恪\", \"忐\", \"弛\", \"遍\", \"何\", \"凰\", \"鲨\", \"墒\", \"啼\", \"纪\", \"赡\", \"旗\", \"溺\", \"板\", \"憧\", \"踊\", \"罩\", \"韪\", \"袁\", \"褐\", \"腋\", \"翻\", \"俯\", \"培\", \"岐\", \"缩\", \"聪\", \"瓣\", \"突\", \"贸\", \"掘\", \"柳\", \"删\", \"嘈\", \"瓜\", \"馋\", \"哲\", \"十\", \"逍\", \"荒\", \"舎\", \"庞\", \"狼\", \"诺\", \"葬\", \"驰\", \"仙\", \"饼\", \"祢\", \"岔\", \"伏\", \"肝\", \"柘\", \"侯\", \"绽\", \"黯\", \"饱\", \"斌\", \"煌\", \"遮\", \"岑\", \"装\", \"浦\", \"势\", \"俚\", \"S\", \"骛\", \"履\", \"蔬\", \"松\", \"D\", \"〖\", \"拎\", \"粤\", \"公\", \"恙\", \"使\", \"这\", \"锻\", \"忙\", \"娱\", \"勉\", \"酌\", \"诚\", \"淡\", \"栋\", \"质\", \"妻\", \"那\", \"掏\", \"悼\", \"缮\", \"硕\", \"奖\", \"某\", \"腊\", \"坐\", \"讼\", \"掌\", \"藐\", \"璜\", \"价\", \"性\", \"留\", \"普\", \"\", \"捕\", \"涂\", \"※\", \"救\", \"垃\", \"苗\", \"迫\", \"鼯\", \"宝\", \"伴\", \"霄\", \"初\", \"矗\", \"涉\", \"躯\", \"授\", \"渗\", \"泸\", \"凿\", \"淫\", \"摩\", \"厢\", \"膳\", \"残\", \"牠\", \"發\", \"荆\", \"泉\", \"勘\", \"4\", \"畏\", \"痴\", \"井\", \"巴\", \"啦\", \"庄\", \"敌\", \"秒\", \"禧\", \"画\", \"抉\", \"瑄\", \"砂\", \"聋\", \"聚\", \"炳\", \"泵\", \"嗅\", \"醍\", \"奠\", \"碌\", \"牖\", \"派\", \"罐\", \"樯\", \"军\", \"骄\", \"脑\", \"糟\", \"好\", \"喂\", \"美\", \"宾\", \"寿\", \"赔\", \"鹤\", \"▲\", \"永\", \"麦\", \"贫\", \"雕\", \"嘟\", \"揣\", \"蜿\", \"雨\", \"拌\", \"盎\", \"忱\", \"芜\", \"洪\", \"衬\", \"筑\", \"肌\", \"会\", \"⑴\", \"稽\", \"矣\", \"呀\", \"椒\", \"肖\", \"攥\", \"宇\", \"液\", \"匠\", \"耘\", \"霉\", \"分\", \"〝\", \"绪\", \"让\", \"寅\", \"贝\", \"贬\", \"砺\", \"要\", \"降\", \"庶\", \"苹\", \"同\", \"烧\", \"闵\", \"⑶\", \"髻\", \"褪\", \"n\", \"祀\", \"恰\", \"熙\", \"峭\", \"艰\", \"故\", \"单\", \"讪\", \"璎\", \"魂\", \"疾\", \"瓷\", \"淋\", \"橡\", \"厘\", \"狠\", \"刀\", \"睫\", \"啃\", \"淑\", \"烟\", \"枉\", \"誉\", \"寺\", \"瑢\", \"挡\", \"涣\", \"侥\", \"詹\", \"螺\", \"凑\", \"缺\", \"败\", \"附\", \"俗\", \"漠\", \"舞\", \"章\", \"舛\", \"墉\", \"遗\", \"被\", \"均\", \"拦\", \"亥\", \"危\", \"尝\", \"椭\", \"鹅\", \"既\", \"瑒\", \"耙\", \"沓\", \"科\", \"遵\", \"蜴\", \"向\", \"蚤\", \"职\", \"恳\", \"怖\", \"旳\", \"晤\", \"呃\", \"舔\", \"彰\", \"瘤\", \"邬\", \"婿\", \"邸\", \"屑\", \"辟\", \"项\", \"滓\", \"萼\", \"卓\", \"合\", \"佩\", \"距\", \"碎\", \"孙\", \"へ\", \"燎\", \"区\", \"浅\", \"「\", \"兑\", \"豫\", \"慑\", \"袜\", \"拂\", \"赅\", \"富\", \"宏\", \"賣\", \"舟\", \"矮\", \"逾\", \"肩\", \"闯\", \"琴\", \"拯\", \"哭\", \"咚\", \"牧\", \"羁\", \"捞\", \"回\", \"帅\", \"赏\", \"轴\", \"凡\", \"仿\", \"便\", \"芝\", \"榄\", \"斯\", \"阱\", \"莺\", \"牛\", \"殴\", \"纹\", \"些\", \"飞\", \"郎\", \"朵\", \"邑\", \"权\", \"楷\", \"〕\", \"怒\", \"鼠\", \"签\", \"陡\", \"渺\", \"喷\", \"垮\", \"镉\", \"畅\", \"勾\", \"暨\", \"粟\", \"业\", \"尤\", \"ソ\", \"滨\", \"又\", \"侧\", \"赁\", \"愕\", \"Q\", \"尺\", \"动\", \"勿\", \"币\", \"产\", \"呵\", \"啊\", \"聊\", \"肠\", \"置\", \"恣\", \"逆\", \"铁\", \"?\", \"匙\", \"易\", \"寻\", \"瞩\", \"甄\", \"嘤\", \"谑\", \"颁\", \"睑\", \"掂\", \"屹\", \"晕\", \"啐\", \"减\", \"凳\", \"勇\", \"炉\", \"捉\", \"噶\", \"系\", \"腺\", \"蠢\", \"哎\", \"驼\", \"鸥\", \"琛\", \"岭\", \"龟\", \"半\", \"块\", \"厮\", \"祉\", \"姣\", \"i\", \"您\", \"釜\", \"醉\", \"备\", \"槽\", \"响\", \"叙\", \"切\", \"李\", \"野\", \"竭\", \"琐\", \"办\", \"榷\", \"岚\", \"榻\", \"现\", \"巩\", \"狡\", \"爰\", \"�\", \"陛\", \"景\", \"谣\", \"匾\", \"嗜\", \"铮\", \"惶\", \"墟\", \"湮\", \"核\", \"惚\", \"掰\", \"佟\", \"阎\", \"吐\", \"欺\", \"毒\", \"楣\", \"凯\", \"笼\", \"书\", \"丁\", \"亦\", \"確\", \"字\", \"出\", \"卫\", \"锂\", \"诃\", \"蓁\", \"甯\", \"离\", \"腱\", \"就\", \"聿\", \"跷\", \"峰\", \"涛\", \"痘\", \"亟\", \"序\", \"完\", \"扉\", \"极\", \"持\", \"偌\", \"踱\", \"戾\", \"掀\", \"選\", \"道\", \"胸\", \"纂\", \"狳\", \"霏\", \"茸\", \"茄\", \"敷\", \"灭\", \"瀛\", \"踝\", \"弑\", \"肋\", \"葛\", \"疏\", \"串\", \"得\", \"宁\", \"亳\", \"间\", \"董\", \"τ\", \"捂\", \"喱\", \"铨\", \"泳\", \"眺\", \"凛\", \"表\", \"遁\", \"拨\", \"吵\", \"哟\", \"音\", \"骏\", \"啪\", \"潮\", \"鞘\", \"怡\", \"掬\", \"鲤\", \"剂\", \"暑\", \"杆\", \"勤\", \"依\", \"忍\", \"瞟\", \"Ø\", \"昵\", \"⑸\", \"妤\", \"意\", \"跌\", \"宫\", \"择\", \"插\", \"珞\", \"属\", \"我\", \"湖\", \"绕\", \"斋\", \"淅\", \"翡\", \"d\", \"欣\", \"哉\", \"揭\", \"池\", \"鹜\", \"少\", \"渤\", \"惊\", \"戳\", \"伫\", \"拔\", \"虑\", \"迅\", \"潘\", \"医\", \"站\", \"砧\", \"采\", \"ノ\", \"伙\", \"成\", \"气\", \"讶\", \"妃\", \"於\", \"撸\", \"卉\", \"仄\", \"委\", \"皇\", \"第\", \"丢\", \"终\", \"舱\", \"湄\", \"嘘\", \"孤\", \"蔑\", \"喉\", \"凄\", \"壁\", \"摆\", \"躺\", \"岛\", \"严\", \"熏\", \"曰\", \"呜\", \"仔\", \"斛\", \"排\", \"旬\", \"薪\", \"党\", \"护\", \"七\", \"丽\", \"辱\", \"钓\", \"髦\", \"浩\", \"狱\", \"煜\", \"哈\", \"秋\", \"咒\", \"N\", \"裤\", \"2\", \"族\", \"挣\", \"瓦\", \"佐\", \"民\", \"随\", \"键\", \"宜\", \"汝\", \"展\", \"眯\", \"馁\", \"骆\", \"偏\", \"窄\", \"峡\", \"蜒\", \"骗\", \"尉\", \"殖\", \"★\", \"屈\", \"莎\", \"粮\", \"強\", \"掖\", \"新\", \"霆\", \"乘\", \"所\", \"淹\", \"毫\", \"奋\", \"蝗\", \"黛\", \"辩\", \"妄\", \"一\", \"游\", \"疫\", \"粥\", \"烙\", \"兵\", \"瞒\", \"蚓\", \"顽\", \"沿\", \"袍\", \"挨\", \"骅\", \"山\", \"霸\", \"運\", \"轮\", \"疼\", \"甩\", \"氛\", \"创\", \"短\", \"哺\", \"岗\", \"健\", \"滑\", \"嘎\", \"障\", \"嘣\", \"渍\", \"猥\", \"么\", \"递\", \"吸\", \"祥\", \"沸\", \"噪\", \"搡\", \"怔\", \"冬\", \"鳗\", \"宅\", \"胞\", \"莴\", \"\", \"活\", \"猪\", \"浑\", \"射\", \"萝\", \"盐\", \"染\", \"擅\", \"绍\", \"立\", \"拓\", \"魔\", \"脐\", \"拱\", \"堤\", \"面\", \"翰\", \"欢\", \"才\", \"薇\", \"○\", \"翠\", \"倒\", \"孰\", \"剔\", \"朗\", \"锁\", \"瞬\", \"咽\", \"材\", \"协\", \"利\", \"雀\", \"蔡\", \"狰\", \"辖\", \"然\", \"邦\", \"涕\", \"集\", \"安\", \"贿\", \"羽\", \"乃\", \"竹\", \"奘\", \"笛\", \"贮\", \"颌\", \"洗\", \"锥\", \"娥\", \"犯\", \"赋\", \"蓝\", \"擘\", \"昆\", \"鄂\", \"应\", \"钥\", \"咕\", \"氮\", \"生\", \"寸\", \"结\", \"冒\", \"炭\", \"焰\", \"員\", \"穆\", \"僚\", \"根\", \"峥\", \"夸\", \"媒\", \"刁\", \"鸟\", \"苍\", \"魅\", \"Z\", \"径\", \"亵\", \"壮\", \"爹\", \"兹\", \"菌\", \"芳\", \"伊\", \"屄\", \"志\", \"粼\", \"慨\", \"舆\", \"骼\", \"损\", \"炙\", \"丰\", \"革\", \"蜷\", \"淀\", \"谚\", \"蹄\", \"数\", \"僵\", \"藕\", \"隘\", \"披\", \"堆\", \"沏\", \"谬\", \"彼\", \"古\", \"相\", \"柠\", \"继\", \"决\", \"漏\", \"释\", \"H\", \"乳\", \"溅\", \"刻\", \"只\", \"癫\", \"免\", \"以\", \"习\", \"浓\", \"蒸\", \"躬\", \"垠\", \"荏\", \"桓\", \"灯\", \"坡\", \"絮\", \"谱\", \"叠\", \"脊\", \"悠\", \"锢\", \"擀\", \"碰\", \"腑\", \"妒\", \"扣\", \"情\", \"逸\", \"彻\", \"惫\", \" \", \"笔\", \"蒙\", \"徐\", \"瑞\", \"嘲\", \"酱\", \"司\", \"肾\", \"芽\", \"话\", \"己\", \"艺\", \"檐\", \"奈\", \"棉\", \"珉\", \"桌\", \"良\", \"辅\", \"居\", \"舒\", \"栓\", \"般\", \"淌\", \"仁\", \"享\", \"计\", \"佣\", \"娼\", \"虞\", \"浪\", \"撩\", \"晦\", \"刘\", \"炊\", \"弥\", \"趁\", \"聒\", \"挝\", \"厄\", \"⑷\", \"崖\", \"爪\", \"捅\", \"耩\", \"腹\", \"英\", \"告\", \"虔\", \"坯\", \"渠\", \"万\", \"G\", \"昏\", \"命\", \"格\", \"惭\", \"罔\", \"绞\", \"诫\", \"水\", \"↑\", \"啤\", \"併\", \"底\", \"拾\", \"塞\", \"厨\", \"订\", \"伞\", \"劑\", \"莲\", \"拟\", \"蹩\", \"涟\", \"壓\", \"府\", \"舍\", \"诊\", \"赐\", \"跤\", \"伍\", \"蝇\", \"弄\", \"邹\", \"暄\", \"休\", \"咯\", \"走\", \"署\", \"嗣\", \"嚼\", \"彬\", \"侠\", \"沟\", \"寂\", \"振\", \"圈\", \"咙\", \"沾\", \"拳\", \"雪\", \"浆\", \"说\", \"起\", \"秸\", \"热\", \"洛\", \"资\", \"譬\", \"铂\", \"秘\", \"至\", \"愧\", \"条\", \"唠\", \"鼎\", \"炬\", \"琅\", \"哪\", \"灵\", \"贴\", \"无\", \"仅\", \"康\", \"投\", \"鸠\", \"尴\", \"汲\", \"嗲\", \"、\", \"\", \"晗\", \"港\", \"J\", \"枚\", \"霖\", \"觉\", \"抨\", \"左\", \"筹\", \"拙\", \"澎\", \"榴\", \"荻\", \"凋\", \"肆\", \"估\", \",\", \"杯\", \"矶\", \"保\", \"缥\", \"葵\", \"霊\", \"昔\", \"讨\", \"蚀\", \"W\", \"谦\", \"朋\", \"匹\", \"栾\", \"晶\", \"没\", \"喆\", \"草\", \"兰\", \"闷\", \"德\", \"狂\", \"霾\", \"漫\", \"弃\", \"灰\", \"雁\", \"闾\", \"菇\", \"陋\", \"贾\", \"悬\", \"秽\", \"暴\", \"妥\", \"姗\", \"孵\", \"扑\", \"撞\", \"乙\", \"电\", \"爻\", \"攫\", \"每\", \"咐\", \"桔\", \"过\", \"指\", \"迎\", \"厂\", \"毗\", \"娄\", \"璇\", \"荧\", \"模\", \"熔\", \"剖\", \"函\", \"镐\", \"惹\", \"暧\", \"夷\", \"史\", \"朝\", \"纸\", \"骤\", \"白\", \"兜\", \"襟\", \"牒\", \"匀\", \"揖\", \"思\", \"娘\", \"⒃\", \"考\", \"城\", \"怵\", \"5\", \"涯\", \"戏\", \"ç\", \"埂\", \"苯\", \"诬\", \"砾\", \"盗\", \"剑\", \"驾\", \"啕\", \"④\", \"堵\", \"雇\", \"瘫\", \"组\", \"缉\", \"疑\", \"呢\", \"季\", \"惯\", \"扛\", \"门\", \"堰\", \"價\", \"娟\", \"毅\", \"權\", \"览\", \"澡\", \";\", \"求\", \"芷\", \"胫\", \"[\", \"膨\", \"灌\", \"涎\", \"灶\", \"踏\", \"苟\", \"柔\", \"盘\", \"炸\", \"诩\", \"触\", \"盯\", \"泛\", \"粕\", \"含\", \"邵\", \"稠\", \"滤\", \"镶\", \"拧\", \"沁\", \"。\", \"庆\", \"露\", \"笑\", \"盆\", \"晟\", \"海\", \"挟\", \"膛\", \"虾\", \"讯\", \"搐\", \"且\", \"卦\", \"最\", \"哀\", \"住\", \"並\", \"椅\", \"D\", \"琉\", \"访\", \"绛\", \"肮\", \"宙\", \"唯\", \"盹\", \"院\", \"世\", \"椰\", \"疯\", \"谎\", \"铃\", \"踹\", \"什\", \"析\", \"莉\", \"斜\", \"喻\", \"郅\", \"镀\", \"忿\", \"辉\", \"垒\", \"静\", \"萎\", \"虏\", \"迟\", \"企\", \"妆\", \"泥\", \"国\", \"皂\", \"轼\", \"正\", \"益\", \"佼\", \"糊\", \"叉\", \"乾\", \"林\", \"潦\", \"比\", \"懦\", \"狞\", \"慢\", \"娴\", \"叫\", \"照\", \"翅\", \"偎\", \"午\", \"懑\", \"抵\", \"蚌\", \"浏\", \"吱\", \"巷\", \"三\", \"狩\", \"杀\", \"涝\", \"逗\", \"手\", \"⒋\", \"搀\", \"浙\", \"蹿\", \"媛\", \"胖\", \"凝\", \"钉\", \"颇\", \"途\", \"背\", \"摧\", \"剽\", \"齿\", \"筛\", \"将\", \"监\", \"乏\", \"恼\", \"\", \"7\", \"郁\", \"止\", \"绊\", \"-\", \"8\", \"菲\", \"狗\", \"议\", \"娅\", \"摔\", \"者\", \"苦\", \"貌\", \"磊\", \"卑\", \"汩\", \"溢\", \"翌\", \"弟\", \"透\", \"赴\", \"识\", \"①\", \"契\", \"椎\", \"瞥\", \"拒\", \"贷\", \"嬉\", \"匈\", \"喀\", \"豹\", \"搬\", \"来\", \"圣\", \"…\", \"粗\", \"胺\", \"骁\", \"摄\", \"撕\", \"失\", \"洞\", \"法\", \"莫\", \"傍\", \"纯\", \"联\", \"违\", \"黢\", \"乐\", \"而\", \"充\", \"陕\", \"腔\", \"乌\", \"窥\", \"恒\", \"茫\", \"谓\", \"忪\", \"涵\", \"嗔\", \"扼\", \"形\", \"恢\", \"I\", \"烈\", \"紧\", \"噌\", \"焦\", \"头\", \"臀\", \"壹\", \"禄\", \"梧\", \"亚\", \"婆\", \"五\", \"携\", \"料\", \"踪\", \"烷\", \"胥\", \"物\", \"箍\", \"矍\", \"牢\", \"凉\", \"姥\", \"帘\", \"杭\", \"巡\", \"嗦\", \"哼\", \"敦\", \"络\", \"造\", \"题\", \"翊\", \"沙\", \"验\", \"房\", \"关\", \"冷\", \"智\", \"拼\", \"瞧\", \"烹\", \"冲\", \"剿\", \"玄\", \"娠\", \"穹\", \"淳\", \"铤\", \"腻\", \"滩\", \"遛\", \"蓉\", \"暹\", \"耦\", \"东\", \"玮\", \"枷\", \"桶\", \"澈\", \"祷\", \"重\", \"噼\", \"旎\", \"停\", \"凤\", \"零\", \"赘\", \"柯\", \"噬\", \"搏\", \"实\", \"倜\", \"蔷\", \"坏\", \"霞\", \"腰\", \"忆\", \"森\", \"锦\", \"窦\", \"簧\", \"嗨\", \"募\", \"怠\", \"锣\", \"铣\", \"屎\", \"威\", \"砥\", \"覃\", \"彷\", \"恿\", \"复\", \"滚\", \"狸\", \"癖\", \"汉\", \"信\", \"托\", \"贪\", \"F\", \"葩\", \"源\", \"炎\", \"罗\", \"伸\", \"拿\", \"勒\", \"遑\", \"川\", \"女\", \"愁\", \"匮\", \"春\", \"宠\", \"燥\", \"悚\", \"误\", \"電\", \"卖\", \"棂\", \"舵\", \"抄\", \"貂\", \"迤\", \"折\", \"注\", \"梢\", \"袖\", \"拖\", \"弩\", \"鹑\", \"屡\", \"锤\", \"戛\", \"陨\", \"腥\", \"竞\", \"谈\", \"句\", \"艘\", \"缭\", \"膀\", \"枢\", \"榆\", \"吗\", \"猡\", \"睦\", \"斐\", \"冈\", \"锏\", \"寝\", \"悔\", \"肴\", \"灑\", \"氨\", \"室\", \"渥\", \"汹\", \"門\", \"尬\", \"臆\", \"绷\", \"乍\", \"煤\", \"尧\", \"煎\", \"湘\", \"吴\", \"蔼\", \"摸\", \"槃\", \"诀\", \"羹\", \"赣\", \"踩\", \"漩\", \"临\", \"A\", \"葱\", \"震\", \"宵\", \"酝\", \"妍\", \"博\", \"圩\", \"优\", \"孝\", \"啸\", \"耻\", \"ù\", \"魇\", \"控\", \"敖\", \"甫\", \"骸\", \"祖\", \"钱\", \"龇\", \"流\", \"卢\", \"记\", \"鸽\", \"î\", \"迷\", \"毁\", \"彙\", \"臼\", \"唷\", \"徳\", \"瘩\", \"摇\", \"心\", \"斤\", \"據\", \"搜\", \"噩\", \"衿\", \"啥\", \"旁\", \"乡\", \"芮\", \"标\", \"乎\", \"谨\", \"哑\", \"蛙\", \"蛔\", \"阳\", \"虱\", \"惨\", \"缈\", \"团\", \"级\", \"见\", \"吊\", \"醇\", \"幢\", \"嘀\", \"跨\", \"扯\", \"载\", \"奴\", \"撒\", \"仇\", \"试\", \"店\", \"踞\", \"树\", \"黝\", \"胚\", \"囤\", \"滕\", \"p\", \"丧\", \"耗\", \"・\", \"爵\", \"蚯\", \"激\", \"埔\", \"倨\", \"吆\", \"招\", \"灾\", \"冤\", \"妞\", \"瞰\", \"夯\", \"糕\", \"译\", \"颖\", \"筝\", \"悍\", \"倦\", \"驱\", \"净\", \"帮\", \"朔\", \"囚\", \"沽\", \"吟\", \"教\", \"昨\", \"与\", \"胱\", \"俊\", \"阑\", \"郸\", \"千\", \"粒\", \"跑\", \"诣\", \"M\", \"洒\", \"煲\", \"穗\", \"筐\", \"你\", \"呻\", \"狙\", \"爱\", \"蕴\", \"仍\", \"户\", \"馨\", \"汪\", \"霭\", \"崔\", \"选\", \"痛\", \"服\", \"态\", \"朴\", \"罄\", \"玷\", \"迭\", \"馕\", \"拇\", \"她\", \"鳞\", \"吼\", \"荟\", \"治\", \"例\", \"荡\", \"姬\", \"扩\", \"杏\", \"抓\", \"跃\", \"罹\", \"锈\", \"吁\", \"郑\", \"仑\", \"窃\", \"作\", \"時\", \"墅\", \"宰\", \"低\", \"妇\", \"许\", \"贱\", \"凶\", \"祈\", \"崎\", \"蹊\", \"纷\", \"移\", \"岌\", \"汤\", \"声\", \"狐\", \"搞\", \"导\", \"琳\", \"偻\", \"←\", \"仰\", \"⒀\", \"按\", \"螂\", \"婷\", \"槐\", \"倪\", \"剁\", \"攘\", \"憬\", \"陆\", \"盼\", \"榨\", \"鳃\", \"N\", \"究\", \"佬\", \"母\", \"断\", \"杠\", \"靠\", \"遇\", \"钵\", \"州\", \"田\", \"柑\", \"萍\", \"咀\", \"非\", \"认\", \"销\", \"略\", \"予\", \"航\", \"约\", \"鞋\", \"苑\", \"琦\", \"逐\", \"敲\", \"负\", \"裸\", \"广\", \"讳\", \"勺\", \"肉\", \"桅\", \"屯\", \"增\", \"竖\", \"撬\", \"虚\", \"叔\", \"叭\", \"劝\", \"O\", \"臃\", \"里\", \"术\", \"爸\", \"混\", \"辆\", \"疚\", \"放\", \"奇\", \"引\", \"秃\", \"羡\", \"】\", \"罚\", \"望\", \"打\", \"戈\", \"粱\", \"倘\", \"鸣\", \"拢\", \"鼾\", \"惦\", \"瑰\", \"筒\", \"坝\", \"掉\", \"案\", \"绝\", \"洽\", \"刃\", \"玲\", \"唏\", \"它\", \"惑\", \"桩\", \"斑\", \"粘\", \"油\", \"魏\", \"沫\", \"炮\", \"市\", \"扰\", \"刷\", \"近\", \"环\", \"沦\", \"卸\", \"裹\", \"阂\", \"哮\", \"弧\", \"茁\", \"阪\", \"叨\", \"量\", \"珍\", \"辑\", \"绳\", \"布\", \"鹈\", \"封\", \"给\", \"悲\", \"趟\", \"缴\", \"潭\", \"烦\", \"把\", \"穰\", \"徽\", \"镳\", \"桃\", \"批\", \"烁\", \"讲\", \"尼\", \"坎\", \"宋\", \"汶\", \"桂\", \"蛇\", \"赵\", \"具\", \"削\", \"唇\", \"漆\", \"猎\", \"祝\", \"兢\", \"③\", \"喜\", \"颉\", \"殊\", \"色\", \"坦\", \"囊\", \"圜\", \"苣\", \"确\", \"皮\", \"隙\", \"怀\", \"傅\", \"壤\", \"瀚\", \"借\", \"沃\", \"嵌\", \"葫\", \"追\", \"度\", \"硬\", \"镏\", \"恭\", \"偶\", \"牺\", \"柱\", \"蒂\", \"彦\", \"棍\", \"菜\", \"隔\", \"硅\", \"犄\", \"踵\", \"禁\", \"趋\", \"沪\", \"勋\", \"拣\", \"着\", \"痪\", \"屏\", \"铎\", \"獗\", \"爬\", \"须\", \"厉\", \"笃\", \"名\", \"藏\", \"套\", \"墙\", \"a\", \"掩\", \"朽\", \"悦\", \"夹\", \"蟀\", \"率\", \"裁\", \"艋\", \"华\", \"纺\", \"0\", \"廊\", \"钰\", \"咧\", \"蜕\", \"瘦\", \"别\", \"为\", \"霍\", \"哗\", \"慧\", \"歧\", \"慕\", \"程\", \"蜃\", \"汛\", \"鲎\", \"贯\", \"杰\", \"骨\", \"芭\", \"桑\", \"逝\", \"墨\", \"基\", \"爷\", \"巫\", \"嗯\", \"卍\", \"邻\", \"掠\", \"检\", \"剪\", \"歼\", \"因\", \"坤\", \"二\", \"卧\", \"雏\", \"o\", \"惴\", \"摘\", \"苛\", \"清\", \"妖\", \"遭\", \"悴\", \"锲\", \"癌\", \"彩\", \"太\", \"则\", \"录\", \"搭\", \"衷\", \"顿\", \"麾\", \"屌\", \"沂\", \"券\", \"蜜\", \"纠\", \"狮\", \"姑\", \"谆\", \"颗\", \"惮\", \"击\", \"轿\", \"猴\", \"蛊\", \"徊\", \"膏\", \"別\", \"礴\", \"屉\", \"蹴\", \"右\", \"蹦\", \"路\", \"碟\", \"〗\", \"ㄓ\", \"\\u0006\", \"蟹\", \"深\", \"禅\", \"遢\", \"熟\", \"秦\", \"刊\", \"雷\", \"\\u0005\", \"目\", \"肯\", \"刑\", \"泠\", \"茜\", \"详\", \"束\", \"银\", \"琶\", \"各\", \"娶\", \"人\", \"械\", \"处\", \"琼\", \"娜\", \"堂\", \"羊\", \"佰\", \"靓\", \"楠\", \"梗\", \"争\", \"嗡\", \"颠\", \"肿\", \"磋\", \"璨\", \"&\", \"迩\", \"战\", \"沮\", \"⑧\", \"玩\", \"状\", \"规\", \"垫\", \"馍\", \"醐\", \"肓\", \"熹\", \"账\", \"斥\", \"范\", \"省\", \"代\", \"综\", \"植\", \"萃\", \"腿\", \"像\", \"挑\", \"怯\", \"煽\", \"明\", \"匕\", \"R\", \"北\", \"凹\", \"勖\", \"花\", \"香\", \"翱\", \"男\", \"馅\", \"黔\", \"孀\", \"哧\", \"四\", \"症\", \"内\", \"中\", \"仆\", \"迦\", \"猝\", \"媳\", \"渐\", \"奂\", \"缪\", \"型\", \"吠\", \"隶\", \"個\", \"也\", \"醛\", \"提\", \"始\", \"恃\", \"迪\", \"兔\", \"编\", \"咏\", \"蜀\", \"鹉\", \"运\", \"毯\", \"街\", \"劲\", \"廓\", \"鸦\", \"蜂\", \"坷\", \"奚\", \"羔\", \"老\", \"跳\", \"查\", \"垢\", \"婺\", \"土\", \"获\", \"诗\", \"乓\", \"苒\", \"耿\", \"沉\", \"段\", \"漲\", \"蚁\", \"赃\", \"俪\", \"娛\", \"瞅\", \"贵\", \"渣\", \"坊\", \"觑\", \"號\", \"檬\", \"方\", \"辄\", \"莘\", \"汕\", \"钧\", \"冶\", \"助\", \"亂\", \"盛\", \"入\", \"谅\", \"坞\", \"胜\", \"归\", \"姨\", \"央\", \"疴\", \"绑\", \"缘\", \"峙\", \"施\", \"壳\", \"扬\", \"渴\", \"晓\", \"柴\", \"炼\", \"夕\", \"忠\", \"惟\", \"壕\", \"整\", \"敝\", \"莅\", \"珊\", \"鹰\", \"滔\", \"务\", \"吧\", \"叮\", \"碳\", \"尖\", \"雳\", \"P\", \"肇\", \"洁\", \"蹭\", \"鬓\", \"抠\", \"蒿\", \"褂\", \"剐\", \"诉\", \"夭\", \"购\", \"燃\", \"宽\", \"缀\", \"存\", \"诙\", \"祸\", \"槌\", \"梦\", \"索\", \"坪\", \"―\", \"踢\", \"籁\", \"帷\", \"槛\", \"预\", \"旱\", \"缕\", \"绩\", \"ê\", \"暮\", \"柚\", \"纰\", \"骂\", \"锡\", \"掐\", \"颧\", \"溘\", \"涸\", \"雌\", \"进\", \"链\", \"巳\", \"宗\", \"町\", \"茂\", \"阅\", \"溶\", \"八\", \"渝\", \"杜\", \"迹\", \"图\", \"防\", \"亲\", \"薛\", \"觅\", \"聂\", \"抿\", \"橙\", \"蔽\", \"脂\", \"毋\", \"颊\", \"岩\", \"候\", \"云\", \"粹\", \"雍\", \"越\", \"扮\", \"当\", \"佳\", \"趴\", \"类\", \"耀\", \"百\", \"待\", \"荫\", \"咳\", \"馄\", \"踌\", \"铸\", \"艳\", \"樱\", \"阮\", \"禽\", \"瑧\", \"涅\", \"苇\", \"纽\", \"劾\", \"饥\", \"棕\", \"褒\", \"橘\", \"赌\", \"娩\", \"慈\", \"馈\", \"鸭\", \"趣\", \"咦\", \"报\", \"库\", \"碑\", \"狭\", \"捆\", \"黏\", \"绣\", \"滥\", \"鲁\", \"V\", \"烯\", \"绿\", \"胡\", \"班\", \"旷\", \"卡\", \"们\", \"讦\", \"ό\", \"纨\", \"炝\", \"维\", \"慷\", \"莓\", \"缅\", \"葡\", \"绘\", \"瑶\", \"映\", \"巾\", \"枣\", \"澄\", \"梳\", \"晃\", \"皑\", \"观\", \"锅\", \"魁\", \"俑\", \"评\", \"贺\", \"品\", \"牲\", \"顾\", \"众\", \"脉\", \"屠\", \"哥\", \"节\", \"启\", \"盟\", \"撰\", \"塌\", \"网\", \"烂\", \"颐\", \"胧\", \"厝\", \"\\u0000\", \"坛\", \"摹\", \"侈\", \"遏\", \"匆\", \"磅\", \"鲸\", \"寞\", \"颤\", \"惋\", \"南\", \"御\", \"餐\", \"穷\", \"肪\", \"沼\", \"à\", \"蚊\", \"轰\", \"续\", \"孟\", \"旌\", \"霜\", \"苏\", \"血\", \"必\", \"窗\", \"典\", \"偿\", \"夫\", \"猜\", \"骇\", \"溪\", \"蕃\", \"错\", \"镍\", \"刨\", \"殿\", \"跚\", \"窟\", \""\", \"氯\", \"湃\", \"斩\", \"冥\", \"受\", \"幼\", \"蹒\", \"概\", \"邃\", \"託\", \"蔚\", \"靴\", \"嘴\", \"诡\", \"枯\", \"身\", \"骚\", \"趾\", \"陈\", \"力\", \"媲\", \"霹\", \"咆\", \"猩\", \"抒\", \"址\", \"到\", \"群\", \"厚\", \"园\", \"论\", \"飕\", \"符\", \"鹦\", \"垄\", \"播\", \"搁\", \"脏\", \"幸\", \"执\", \"捷\", \"发\", \"时\", \"睛\", \"客\", \"陵\", \"沥\", \"伯\", \"视\", \"喝\", \"愈\", \"柄\", \"耽\", \"促\", \"行\", \"臧\", \"后\", \"庭\", \"秩\", \"尚\", \"贤\", \"掷\", \"厅\", \"呸\", \"捧\", \"描\", \"吹\", \"惧\", \"皖\", \"凸\", \"昭\", \"豪\", \" \", \"邪\", \"歌\", \"奢\", \"亭\", \"辕\", \"吾\", \"攸\", \"腭\", \"痕\", \"烬\", \"淼\", \"噱\", \"懂\", \"退\", \"拥\", \"渔\", \"灼\", \"蜘\", \"档\", \"小\", \"瑟\", \"睹\", \"〞\", \"缆\", \"劳\", \"边\", \"辗\", \"內\", \"⑩\", \"唾\", \"僧\", \"醒\", \"螃\", \"张\", \"亏\", \"阁\", \"媚\", \"部\", \"婉\", \"霈\", \"警\", \"谔\", \"俞\", \".\", \"割\", \"矛\", \"包\", \"晋\", \"焕\", \"【\", \"忘\", \"恐\", \"式\", \"齐\", \"歹\", \"鄙\", \"独\", \"鲜\", \"村\", \"诧\", \"铭\", \"衣\", \"钊\", \"风\", \"瘀\", \"玳\", \"测\", \"廷\", \"睽\", \"愤\", \"版\", \"际\", \"遥\", \"钜\", \"锒\", \"糯\", \"抽\", \"牵\", \"还\", \"娃\", \"悖\", \"疆\", \"叛\", \"匪\", \"窝\", \"伐\", \"玖\", \"镕\", \"翼\", \"〈\", \"咔\", \"杉\", \"萤\", \"寐\", \"征\", \"嗤\", \"碧\", \"双\", \"叶\", \"闪\", \"潢\", \"子\", \"湿\", \"陇\", \"璀\", \"胀\", \"承\", \"鱼\", \"但\", \"唉\", \"讷\", \"侨\", \"旭\", \"亩\", \"黧\", \"夜\", \"已\", \"灸\", \"砌\", \"返\", \"饭\", \"鸿\", \"珏\", \"熨\", \"钝\", \"陀\", \"碾\", \"豚\", \"诟\", \"述\", \"橇\", \"瞪\", \"秀\", \"淞\", \"西\", \"檀\", \"柏\", \"绵\", \"局\", \"淮\", \"丝\", \"鳌\", \"麽\", \"哦\", \"平\", \"如\", \"闹\", \"猫\", \"烘\", \"砖\", \"钮\", \"痰\", \"取\", \"帽\", \"籍\", \"难\", \"列\", \"顶\", \"钟\", \"举\", \"慎\", \"仲\", \"旦\", \"隧\", \"辛\", \"雯\", \"缄\", \"理\", \"酒\", \"驶\", \"鼻\", \"悟\", \"缸\", \"几\", \"犀\", \"薩\", \"冽\", \"憔\", \"位\", \"未\", \"围\", \"摊\", \"圭\", \"瞄\", \"直\", \"菱\", \"巅\", \"丘\", \"定\", \"歪\", \"镇\", \"犰\", \"偷\", \"涩\", \"恕\", \"歩\", \"槿\", \"衅\", \"织\", \"支\", \"傲\", \"仪\", \"闻\", \"交\", \"T\", \"庙\", \"梭\", \"修\", \"暗\", \"潜\", \"频\", \"+\", \"守\", \"尔\", \"瞠\", \"软\", \"靛\", \"憾\", \"私\", \"稀\", \"球\", \"朱\", \"迈\", \"札\", \"校\", \"遐\", \"裔\", \"稣\", \"泌\", \"焙\", \"漪\", \"擤\", \"早\", \"報\", \"害\", \"慰\", \"限\", \"圆\", \"澳\", \"紊\", \"崽\", \"庸\", \"阴\", \"妓\", \"驴\", \"王\", \"飚\", \"磕\", \"抗\", \"淇\", \"息\", \"年\", \"潇\", \"伟\", \"贞\", \"锐\", \"赞\", \"证\", \"事\", \"怂\", \"亨\", \"埠\", \"昌\", \"篱\", \"练\", \"眠\", \"鹌\", \"揉\", \"碍\", \"去\", \"讽\", \"圳\", \"果\", \"廉\", \"雾\", \"措\", \"淄\", \"谍\", \"芹\", \"撅\", \"摞\", \"税\", \"妊\", \"烫\", \"涨\", \"怪\", \"课\", \"盈\", \"昧\", \"崩\", \"知\", \"融\", \"愚\", \"吕\", \"假\", \"唤\", \"拽\", \"个\", \"侍\", \"滋\", \"幽\", \"猾\", \"畔\", \"A\", \"シ\", \"飓\", \"孪\", \"落\", \"任\", \"甸\", \"印\", \"芃\", \"瀑\", \"甲\", \"曹\", \"岸\", \"技\", \"庐\", \"赶\", \"胃\", \"骑\", \"萨\", \"犹\", \"誓\", \"阐\", \"杨\", \"做\", \"!\", \"薰\", \"伉\", \"由\", \"翁\", \"郝\", \"昊\", \"韩\", \"励\", \"庇\", \"官\", \"昕\", \"呼\", \"青\", \"磺\", \"波\", \"焚\", \"棣\", \"丛\", \"于\", \"腾\", \" \", \"嘭\", \"罪\", \"喃\", \"懈\", \"麓\", \"寰\", \"璃\", \"夏\", \"怎\", \"棘\", \"配\", \"听\", \"晒\", \"汁\", \"恤\", \"策\", \"奎\", \"腕\", \"葆\", \"驿\", \"橄\", \"氧\", \"嫉\", \"舌\", \"蓦\", \"蓬\", \"占\", \"⑥\", \"悄\", \"闭\", \"唱\", \"酋\", \"步\", \"搂\", \"纤\", \"审\", \"尸\", \"揪\", \"敛\", \"界\", \"吭\", \"芥\", \"菊\", \"毡\", \"嚷\", \"社\", \"]\", \"戢\", \"莞\", \"戮\", \"衍\", \"兄\", \"宸\", \"〔\", \"诵\", \"V\", \"膜\", \"责\", \"郭\", \"绰\", \"兽\", \"欲\", \"阔\", \"线\", \"呦\", \"寇\", \"胎\", \"有\", \"镑\", \"胰\", \"竣\", \"驮\", \"珀\", \"倩\", \"货\", \"疹\", \"刺\", \"茵\", \"拆\", \"\", \"咬\", \"满\", \"咪\", \"患\", \"嫩\", \"梨\", \"旧\", \"丫\", \"谀\", \"窘\", \"吮\", \"艾\", \"彪\", \"汗\", \"幕\", \"6\", \"器\", \"⒁\", \"互\", \"债\", \"寒\", \"两\", \"秉\", \"绉\", \"弈\", \"瞎\", \"杖\", \"锯\", \"窿\", \"皆\", \"转\", \"喇\", \"谋\", \"鸡\", \"彤\", \"侣\", \"似\", \"扔\", \"温\", \"噴\", \"写\", \"蕤\", \"垣\", \"衡\", \"体\", \"况\", \"吓\", \"晴\", \"崇\", \"匿\", \"童\", \"嚣\", \"⒂\", \"朦\", \"─\", \"纳\", \"辈\", \"ヨ\", \"h\", \"专\", \"俄\", \"咨\", \"词\", \"愿\", \"历\", \"颂\", \"米\", \"升\", \"容\", \"灿\", \"魄\", \"超\", \"痊\", \"抛\", \"▪\", \"胁\", \"纾\", \"悯\", \"答\", \"膝\", \"焯\", \"淤\", \"剥\", \"艇\", \"裳\", \"从\", \"扫\", \"喽\", \"疮\", \"幻\", \"屋\", \"帆\", \"烛\", \"呛\", \"鞠\", \"⑨\", \"〉\", \"莹\", \"裙\", \"當\", \"谷\", \"飘\", \"扒\", \"倡\", \"酷\", \"麟\", \"药\", \"肥\", \"翕\", \"掳\", \"邓\", \"睡\", \"纵\", \"若\", \"诈\", \"・\", \"蟋\", \"愣\", \"臂\", \"污\", \"逢\", \"扶\", \"嘻\", \"镜\", \"宴\", \"(\", \"龄\", \"屁\", \"样\", \"漓\", \"逞\", \"浴\", \"峻\", \"逶\", \"熊\", \"疤\", \"動\", \"粪\", \"输\", \"礼\", \"克\", \"砸\", \"缓\", \"傥\", \"泱\", \"著\", \"吉\", \"C\", \"扁\", \"漱\", \"儿\", \"滢\", \"忌\", \"刚\", \"迁\", \"酥\", \"靶\", \"篓\", \"铜\", \"参\", \"楂\", \"攀\", \"盾\", \"夥\", \"矢\", \"捏\", \"俏\", \"⑦\", \"牙\", \"棱\", \"接\", \"犁\", \"楼\", \"并\", \"殆\", \"窍\", \"俺\", \"对\", \"⒌\", \"变\", \"猛\", \"蛮\", \"倚\", \"甚\", \"票\", \"诨\", \"靖\", \"摒\", \"前\", \"燕\", \"~\", \"徒\", \"癜\", \"徇\", \"褚\", \"乖\", \"隋\", \"嫌\", \"襄\", \"忽\", \"雄\", \"嘿\", \"冻\", \"浠\", \"抚\", \"撐\", \"抬\", \"辰\", \"另\", \"津\", \"全\", \"抑\", \"倍\", \"据\", \"耳\", \"俨\", \"之\", \"溜\", \"领\", \"瑥\", \"押\", \"膊\", \"曙\", \"久\", \"孱\", \"衫\", \"厦\", \"贼\", \"煞\", \"郡\", \"箱\", \"养\", \"及\", \"兮\", \"马\", \"臭\", \"爽\", \"笆\", \"邀\", \"戒\", \"贩\", \"邱\", \"氢\", \"痹\", \"覆\", \"往\", \"请\", \"眶\", \"额\", \"脾\", \"快\", \"栖\", \"较\", \"矿\", \"後\", \"阻\", \"碗\", \"蹈\", \"坠\", \"攒\", \"篷\", \"跟\", \"崛\", \"嘱\", \"操\", \"牡\", \"积\", \"梵\", \"锌\", \"眉\", \"佘\", \"姐\", \"惠\", \"湾\", \"汇\", \"韬\", \"旺\", \"s\", \"副\", \"疲\", \"濒\", \"俱\", \"允\", \"设\", \"罢\", \"泣\", \"蘸\", \"言\", \"烃\", \"冉\", \"栅\", \"可\", \"婴\", \"泪\", \"影\", \"茱\", \"父\", \"B\", \"秤\", \"尽\", \"1\", \"陶\", \"戚\", \"⑤\", \"口\", \"师\", \"诸\", \"捺\", \"努\", \"期\", \"适\", \"喘\", \"岂\", \"驭\", \"化\", \"亮\", \"姿\", \"伺\", \"奥\", \"侄\", \"伪\", \"曲\", \"阀\", \"学\", \"畿\", \"〃\", \"补\", \"谭\", \"诲\", \"稍\", \"喊\", \"壶\", \"茅\", \"菁\", \"遣\", \"架\", \"耕\", \"惬\", \"下\", \"旅\", \"达\", \"郊\", \"婊\", \"酸\", \"蝌\", \"惕\", \"肺\", \"玉\", \"谊\", \"卻\", \"谁\", \"铄\", \"洼\", \")\", \"泡\", \"想\", \"萌\", \"黑\", \"挚\", \"痒\", \"Y\", \"麻\", \"垂\", \"农\", \"弱\", \"蛋\", \"除\", \"沛\", \"空\", \"脱\", \"ズ\", \"异\", \"赫\", \"脚\", \"淘\", \"疸\", \"看\", \"是\", \"先\", \"帖\", \"酣\", \"栩\", \"é\", \"矫\", \"邢\", \"陷\", \"细\", \"碴\", \"款\", \"屿\", \"纲\", \"工\", \"盖\", \"凌\", \"桢\", \"营\", \"喧\", \"繁\", \"黎\", \"蟑\", \"蘑\", \"宛\", \"闲\", \"簿\", \"⑿\", \"跻\", \"翔\", \"笋\", \"瓢\", \"徨\", \"哇\", \"士\", \"虹\", \"ο\", \"泰\", \"他\", \"铺\", \"奸\", \"翘\", \"瑑\", \"網\", \"红\", \"巍\", \"强\", \"◆\", \"イ\", \"猖\", \"∶\", \"吨\", \"京\", \"乒\", \"辨\", \"氏\", \"饲\", \"隐\", \"罕\", \"揍\", \"翩\", \"换\", \"畑\", \"丑\", \"嫁\", \"荐\", \"邂\", \"闺\", \"挫\", \"邮\", \"援\", \"稿\", \"河\", \"泼\", \"メ\", \"鼓\", \"文\", \"恋\", \"岁\", \"鹏\", \"暂\", \"聘\", \"甬\", \"為\", \"e\", \"烤\", \"谜\", \"僻\", \"舀\", \"差\", \"顷\", \"破\", \"芋\", \"石\", \"租\"]",
"lossless": false
},
"deepseek-ai/DeepSeek-V2 @ cc100/ar": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 2813283,
"_n_tokens": 1416103,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/de": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1814876,
"_n_tokens": 631152,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/en": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1124813,
"_n_tokens": 262324,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/es": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1664455,
"_n_tokens": 470524,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/fa": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 2054052,
"_n_tokens": 963451,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/fr": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1540504,
"_n_tokens": 497667,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/ja": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1774770,
"_n_tokens": 751467,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/ko": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1524839,
"_n_tokens": 1071983,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/zh-Hans": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 2633047,
"_n_tokens": 595081,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/ar": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 2813283,
"_n_tokens": 1948863,
"_n_chars": 1560987,
"_n_oov_chars": 1,
"oov_ratio": 6.406203254735626e-07,
"_oov_charset": "[\"ö\"]",
"lossless": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/de": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1814876,
"_n_tokens": 735618,
"_n_chars": 1784021,
"_n_oov_chars": 13536,
"oov_ratio": 0.007587354633157345,
"_oov_charset": "[\"ø\", \"û\", \"ü\", \"ú\", \"ö\", \"Á\"]",
"lossless": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/en": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1124813,
"_n_tokens": 277408,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/es": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1664455,
"_n_tokens": 513884,
"_n_chars": 1630297,
"_n_oov_chars": 1637,
"oov_ratio": 0.0010041115207842497,
"_oov_charset": "[\"ø\", \"ü\", \"ú\", \"ö\", \"Á\", \"ý\"]",
"lossless": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/fa": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 2054052,
"_n_tokens": 1316109,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/fr": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1540504,
"_n_tokens": 527538,
"_n_chars": 1484970,
"_n_oov_chars": 557,
"oov_ratio": 0.00037509175269534066,
"_oov_charset": "[\"ü\", \"À\", \"û\", \"ù\"]",
"lossless": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/ja": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1774770,
"_n_tokens": 1008060,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/ko": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1524839,
"_n_tokens": 1444805,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/zh-Hans": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 2633047,
"_n_tokens": 710577,
"_n_chars": 927311,
"_n_oov_chars": 1,
"oov_ratio": 1.0783868626598843e-06,
"_oov_charset": "[\"ù\"]",
"lossless": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/en": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1124813,
"_n_tokens": 262324,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/zh-Hans": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 2633047,
"_n_tokens": 595081,
"_n_chars": 927311,
"_n_oov_chars": 1,
"oov_ratio": 1.0783868626598843e-06,
"_oov_charset": "[\"ù\"]",
"lossless": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/fr": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1540504,
"_n_tokens": 497693,
"_n_chars": 1484970,
"_n_oov_chars": 557,
"oov_ratio": 0.00037509175269534066,
"_oov_charset": "[\"û\", \"ù\", \"À\", \"ü\"]",
"lossless": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/es": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1664455,
"_n_tokens": 470877,
"_n_chars": 1630297,
"_n_oov_chars": 1637,
"oov_ratio": 0.0010041115207842497,
"_oov_charset": "[\"ý\", \"ú\", \"ü\", \"Á\", \"ø\", \"ö\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/en": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1124813,
"_n_tokens": 373564,
"_n_chars": 1121360,
"_n_oov_chars": 31094,
"oov_ratio": 0.027728829278732967,
"_oov_charset": "[\"D\", \"S\", \"R\", \"😥\", \"\", \"\", \"W\", \"‑\", \"ñ\", \"🙂\", \"´\", \"Z\", \"V\", \"U\", \"😉\", \"®\", \"J\", \"H\", \"K\", \"N\", \"C\", \"¡\", \"Y\", \"A\", \"é\", \"ï\", \"è\", \"¦\", \"�\", \"ó\", \"\", \"M\", \"F\", \"Q\", \"L\", \"I\", \"T\", \"O\", \"P\", \"B\", \"G\", \"\", \"X\", \"E\", \"\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/zh-Hans": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 2633047,
"_n_tokens": 882451,
"_n_chars": 927311,
"_n_oov_chars": 26366,
"oov_ratio": 0.02843274802089051,
"_oov_charset": "[\"D\", \"員\", \"i\", \"壓\", \"N\", \"浞\", \"鲎\", \"à\", \"W\", \"4\", \"Z\", \"損\", \"镏\", \"・\", \"瑥\", \"\\u0006\", \"韫\", \"戢\", \"6\", \"託\", \"翕\", \"N\", \"ズ\", \"A\", \"�\", \"於\", \"\", \"ό\", \"M\", \"ě\", \"麽\", \"採\", \"韪\", \"Q\", \"V\", \"阪\", \"號\", \"T\", \"劑\", \"\", \"⒁\", \"岣\", \"A\", \"î\", \"S\", \"\\u0005\", \"\", \"+\", \"個\", \"t\", \"別\", \"ヨ\", \"&\", \"旳\", \"V\", \"T\", \"撐\", \"馕\", \".\", \"時\", \"龇\", \"瑒\", \"`\", \"確\", \"旆\", \"a\", \"猡\", \"H\", \"ê\", \"屣\", \"p\", \"©\", \" \", \"狳\", \"⑿\", \"Y\", \"資\", \"權\", \"9\", \"\\u0000\", \"\\u0007\", \"網\", \"F\", \"\", \"h\", \""\", \"瑧\", \"I\", \"/\", \"ソ\", \"價\", \"G\", \"電\", \"B\", \"內\", \"5\", \"X\", \"為\", \"Ø\", \"\", \"亂\", \"シ\", \"瑑\", \"黩\", \"R\", \"⒂\", \"3\", \"\", \"漲\", \"メ\", \"並\", \"\", \"浠\", \"_\", \"o\", \"e\", \"倨\", \"據\", \"へ\", \"鸩\", \"卻\", \"鄯\", \"ト\", \"ノ\", \"瑨\", \"⒀\", \"J\", \"耩\", \"▪\", \"锒\", \"當\", \"發\", \"報\", \"C\", \"犰\", \"動\", \"讦\", \"\", \"7\", \"C\", \"啐\", \"擤\", \"黧\", \"L\", \"1\", \"[\", \"犟\", \"イ\", \"の\", \"0\", \"標\", \"ù\", \"瑢\", \"阽\", \"逑\", \"E\", \"賣\", \"\\b\", \"]\", \"%\", \"诨\", \"8\", \"d\", \"D\", \"薩\", \"疴\", \"ㄓ\", \"彙\", \"藉\", \" \", \"r\", \"後\", \"噴\", \"牖\", \"s\", \"U\", \"強\", \"-\", \"灑\", \"ὐ\", \"⒌\", \"門\", \"篢\", \"K\", \"2\", \"á\", \"é\", \"n\", \"溘\", \"慮\", \"運\", \"ç\", \"P\", \"O\", \"鼯\", \"選\", \"穰\", \"⒃\", \"娛\", \"併\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/fr": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1540504,
"_n_tokens": 618107,
"_n_chars": 1484970,
"_n_oov_chars": 66958,
"oov_ratio": 0.04509047320821296,
"_oov_charset": "[\"ë\", \"î\", \"D\", \"R\", \"S\", \"È\", \"ô\", \"\", \"̧\", \"\", \"‐\", \"Ê\", \"à\", \"W\", \"🙂\", \"´\", \"Z\", \"😀\", \"♕\", \"̂\", \"V\", \"❤\", \"́\", \"U\", \"😉\", \"®\", \"À\", \"J\", \"™\", \"ü\", \"H\", \"
\", \"ê\", \"♠\", \"Ç\", \"K\", \"N\", \"C\", \"É\", \"🤔\", \"Ô\", \"è\", \"é\", \"A\", \"ï\", \"Y\", \"�\", \"ã\", \"í\", \"M\", \"â\", \"û\", \"Â\", \"F\", \"Q\", \"L\", \"I\", \"ç\", \"T\", \"P\", \"O\", \"B\", \"œ\", \"ù\", \"G\", \"X\", \"ğ\", \"ä\", \"E\", \"Î\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/es": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1664455,
"_n_tokens": 684804,
"_n_chars": 1630297,
"_n_oov_chars": 69225,
"oov_ratio": 0.04246158828728753,
"_oov_charset": "[\"D\", \"\", \"S\", \"R\", \"▷\", \"\", \"¿\", \"\", \"😦\", \"🙁\", \"\", \"ô\", \"à\", \"W\", \"ñ\", \"Á\", \"🙂\", \"´\", \"Z\", \"😀\", \"V\", \"❤\", \"️\", \"U\", \"😉\", \"Ó\", \"✖\", \"®\", \"J\", \"ü\", \"ö\", \"H\", \"✔\", \"©\", \"K\", \"N\", \"C\", \"É\", \"ò\", \"á\", \"¡\", \"A\", \"é\", \"Y\", \"è\", \"М\", \"ó\", \"í\", \"M\", \"✓\", \"ú\", \"F\", \"Q\", \"L\", \"Ñ\", \"Ú\", \"I\", \"ª\", \"ý\", \"👍\", \"T\", \"P\", \"O\", \"B\", \"G\", \"👏\", \"X\", \"Í\", \"\", \"E\"]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/en": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1124813,
"_n_tokens": 257070,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/zh-Hans": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 2633047,
"_n_tokens": 557455,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/fr": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1540504,
"_n_tokens": 515669,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/es": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1664455,
"_n_tokens": 568539,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/en": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1124813,
"_n_tokens": 268022,
"_n_chars": 1121360,
"_n_oov_chars": 43,
"oov_ratio": 3.8346293786116855e-05,
"_oov_charset": "[\"🙂\", \"⑦\", \"\", \"⑧\", \"⑤\", \"😥\", \"\", \"😉\", \"\", \"⑩\", \"¦\", \"\", \"�\", \"③\", \"\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/zh-Hans": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 2633047,
"_n_tokens": 879709,
"_n_chars": 927311,
"_n_oov_chars": 690301,
"oov_ratio": 0.7444115296809808,
"_oov_charset": "[\"搅\", \"千\", \"稻\", \"缕\", \"膨\", \"杆\", \"痕\", \"抽\", \"滓\", \"办\", \"淋\", \"址\", \"郊\", \"霸\", \"墟\", \"惹\", \"先\", \"沥\", \"构\", \"徨\", \"恒\", \"著\", \"狈\", \"都\", \"戢\", \"竭\", \"畜\", \"擂\", \"吗\", \"奸\", \"壮\", \"伟\", \"东\", \"政\", \"蕴\", \"羁\", \"射\", \"咏\", \"撒\", \"蕾\", \"窃\", \"倩\", \"劑\", \"腾\", \"突\", \"等\", \"犹\", \"嗯\", \"渺\", \"龚\", \"愤\", \"赚\", \"矮\", \"股\", \"~\", \"知\", \"擦\", \"伪\", \"罕\", \"甚\", \"掏\", \"遢\", \"跷\", \"手\", \"簿\", \"赴\", \"者\", \"猴\", \"障\", \"俯\", \"客\", \"擅\", \"程\", \"宸\", \"款\", \"褒\", \"腺\", \"续\", \"迈\", \"哄\", \"涌\", \"骸\", \"路\", \"谐\", \"茎\", \"睡\", \"晨\", \"嫁\", \"庞\", \"跻\", \"苹\", \"衰\", \"脾\", \"圜\", \"讼\", \"揪\", \"钦\", \"嫉\", \"壹\", \"承\", \"婆\", \"饶\", \"搬\", \"澎\", \"箭\", \"防\", \"几\", \"泛\", \"溪\", \"9\", \"弃\", \"骑\", \"堤\", \"鹃\", \"槌\", \"唇\", \"刃\", \"瑧\", \"捺\", \"铤\", \"鄂\", \"丰\", \"宜\", \"需\", \"阶\", \"懈\", \"戏\", \"妻\", \"踝\", \"冷\", \"睑\", \"昵\", \"眯\", \"薇\", \"闷\", \"晓\", \"冽\", \"像\", \"渥\", \"追\", \"寇\", \"注\", \"怯\", \"烫\", \"怂\", \"矿\", \"〉\", \"轶\", \"咬\", \"【\", \"也\", \"咒\", \"肃\", \"镇\", \"独\", \"绩\", \"帅\", \"偌\", \"铜\", \"例\", \"▪\", \"迅\", \"足\", \"悠\", \"守\", \"澄\", \"炖\", \"粹\", \"稳\", \"铺\", \"牡\", \"灌\", \"闯\", \"属\", \"黎\", \"陆\", \"帜\", \"衿\", \"咙\", \"绥\", \"1\", \"如\", \"腻\", \"②\", \"画\", \"堡\", \"猜\", \"凹\", \"抵\", \"祟\", \"纠\", \"逢\", \"〞\", \"蹒\", \"丢\", \"试\", \"诈\", \"弩\", \"餐\", \"批\", \"遭\", \"叔\", \"观\", \"叶\", \"铨\", \"姬\", \"绰\", \"五\", \"踩\", \"屡\", \"宇\", \"衍\", \"铂\", \"秒\", \"⒌\", \"姜\", \"给\", \"垃\", \"棵\", \"瞳\", \"捂\", \"层\", \"愿\", \"瓦\", \"蒋\", \"位\", \"葵\", \"佰\", \"玖\", \"殊\", \"温\", \"闭\", \"跑\", \"睹\", \"狰\", \"族\", \"肝\", \"铃\", \"暴\", \"尴\", \"饷\", \"桐\", \"胶\", \"臊\", \"尘\", \"裔\", \"肓\", \"阐\", \"赎\", \"落\", \"碱\", \"使\", \"劈\", \"叹\", \"扁\", \"评\", \"险\", \"冶\", \"鲎\", \"悯\", \"痰\", \"穷\", \"筹\", \"苯\", \"捆\", \"航\", \"紫\", \"髦\", \"短\", \"郴\", \"挥\", \"嘘\", \"抨\", \"嘉\", \"嚎\", \"烊\", \"挝\", \"滢\", \"砺\", \"衫\", \"融\", \"鞭\", \"霹\", \"赋\", \"泸\", \"逍\", \"镕\", \"夕\", \"拇\", \"姓\", \"�\", \"傲\", \"督\", \"晾\", \"颇\", \"啃\", \"斜\", \"犁\", \"襟\", \"蓦\", \"羡\", \"丘\", \"仗\", \"怨\", \"吠\", \"凛\", \"惊\", \"漓\", \"遴\", \"笨\", \"件\", \"跳\", \"无\", \"\", \"男\", \"摩\", \"秉\", \"莲\", \"绕\", \"孩\", \"汕\", \"魔\", \"驾\", \"啕\", \"旌\", \"炫\", \"蚌\", \"昏\", \"偿\", \"剩\", \"佼\", \"咸\", \"蒿\", \"前\", \"確\", \"旆\", \"泌\", \"菜\", \"摄\", \"格\", \"璀\", \"图\", \"勇\", \"憾\", \"诲\", \"销\", \"决\", \"谱\", \"仰\", \"必\", \"侧\", \"赁\", \"诅\", \"授\", \"電\", \"借\", \"臂\", \"消\", \"低\", \"帖\", \"粉\", \"忌\", \"栏\", \"鱼\", \"仍\", \"肘\", \"相\", \"刁\", \"诺\", \"蹲\", \"情\", \"练\", \"父\", \"喝\", \"粥\", \"厮\", \"恣\", \"毒\", \"线\", \"与\", \"祢\", \"辖\", \"朦\", \"狮\", \"伤\", \"增\", \"裂\", \"杂\", \"氧\", \"馆\", \"泊\", \"踹\", \"坡\", \"顷\", \"塘\", \"汀\", \"奈\", \"犰\", \"裙\", \"惴\", \"狞\", \"耶\", \"彬\", \"阵\", \"7\", \"逅\", \"谆\", \"咧\", \"盼\", \"稍\", \"侃\", \"永\", \"楂\", \"登\", \"末\", \"漏\", \"涡\", \"匕\", \"歇\", \"蚊\", \"七\", \"夹\", \"胆\", \"誉\", \"俄\", \"趋\", \"汇\", \"泠\", \"肉\", \"盾\", \"扛\", \"墉\", \"碴\", \"闫\", \"苑\", \"噩\", \"记\", \"舶\", \"⑴\", \"滑\", \"考\", \"耳\", \"鳞\", \"念\", \"捍\", \"论\", \"徊\", \"砸\", \"零\", \"篇\", \"鞍\", \"疼\", \"弈\", \"抢\", \"君\", \"语\", \"狡\", \"盏\", \"宗\", \"汶\", \"凯\", \"丫\", \"破\", \"师\", \"朱\", \"拣\", \"谓\", \"摞\", \"彰\", \"残\", \"镶\", \"庄\", \"恿\", \"投\", \"涸\", \"乍\", \"疮\", \"信\", \"掠\", \"述\", \"骁\", \"栋\", \"跪\", \"阔\", \"均\", \"褐\", \"瑞\", \"畴\", \"渎\", \"岖\", \"擘\", \"舌\", \"兑\", \"盖\", \"睐\", \"覃\", \"愧\", \"期\", \"瑥\", \"谎\", \"6\", \"皈\", \"滚\", \"个\", \"哗\", \"懑\", \"艾\", \"嫖\", \"曰\", \"冲\", \"列\", \"炒\", \"洼\", \"溃\", \"焕\", \"功\", \"快\", \"聘\", \"薛\", \"嫌\", \"津\", \"颊\", \"才\", \"检\", \"皑\", \"莓\", \"藕\", \"徇\", \"剥\", \"裕\", \"笋\", \"敞\", \"恤\", \"滞\", \"乞\", \"憬\", \"治\", \"击\", \"涛\", \"瓶\", \"咦\", \"桶\", \"勉\", \"⒁\", \"赠\", \"咎\", \"若\", \"不\", \"迩\", \"聂\", \"钩\", \"濒\", \"t\", \"禾\", \"索\", \"芮\", \"斛\", \"吸\", \"窜\", \"刨\", \"半\", \"齐\", \"娴\", \"暖\", \"喊\", \"撑\", \"缩\", \"舱\", \"妤\", \"碟\", \"且\", \"套\", \"俺\", \"聊\", \"乐\", \"缘\", \"咐\", \"扫\", \"戾\", \"沙\", \"酷\", \"沂\", \"劣\", \"雄\", \"黑\", \"俑\", \"霖\", \"譬\", \"皖\", \"殴\", \"措\", \"雯\", \"恐\", \"芭\", \"归\", \"整\", \"始\", \"引\", \"斗\", \"械\", \"瘤\", \"\", \"囚\", \"雁\", \"毯\", \"⒂\", \"3\", \"奥\", \"獗\", \"勋\", \"致\", \"拿\", \"婊\", \"羊\", \"甘\", \"药\", \"坐\", \"醇\", \"禅\", \"崎\", \"屌\", \"聆\", \"蔚\", \"清\", \"璜\", \"否\", \"频\", \"爷\", \"牌\", \"彭\", \"搐\", \"扇\", \"室\", \"受\", \"姨\", \"脯\", \"绣\", \"肤\", \"亳\", \"及\", \"兆\", \"猪\", \"肴\", \"瞥\", \"惭\", \"耸\", \"廖\", \"谜\", \"辉\", \"识\", \"债\", \"违\", \"症\", \"穿\", \"薄\", \"灸\", \"断\", \"森\", \"涎\", \"暑\", \"逑\", \"腿\", \"歉\", \"内\", \"]\", \"痘\", \"瀚\", \"喀\", \"陨\", \"岗\", \"册\", \"愉\", \"邱\", \"稚\", \"纷\", \"攀\", \"做\", \"钰\", \"玮\", \"卦\", \"汝\", \"翰\", \"谭\", \"眉\", \"亿\", \"爰\", \"噴\", \"悉\", \"鼻\", \"斤\", \"仔\", \"厚\", \"泻\", \"移\", \"灿\", \"璧\", \"蓄\", \"喉\", \"拎\", \"纾\", \"扒\", \"冤\", \"抚\", \"胜\", \"切\", \"陕\", \"得\", \"杖\", \"撼\", \"骨\", \"堪\", \"聪\", \"毎\", \"董\", \"习\", \"常\", \"奏\", \"棚\", \"垢\", \"刑\", \"气\", \"選\", \"溉\", \"炕\", \"霈\", \"〈\", \"框\", \"震\", \"坷\", \"钝\", \"爱\", \"组\", \"学\", \"头\", \"柚\", \"艘\", \"桅\", \"眷\", \"恋\", \"員\", \"伊\", \"塑\", \"闵\", \"掳\", \"节\", \"溺\", \"妇\", \"芙\", \"健\", \"询\", \"脊\", \"霾\", \"4\", \"撩\", \"浪\", \"巳\", \"选\", \"诫\", \"鲨\", \"魇\", \"湘\", \"沿\", \";\", \"祭\", \"束\", \"淫\", \"填\", \"铁\", \"韫\", \"奂\", \"雷\", \"馋\", \"己\", \"昭\", \"章\", \"良\", \"赞\", \"霭\", \"吐\", \"合\", \"筑\", \"骤\", \"荡\", \"踪\", \"尺\", \"疲\", \"茫\", \"舅\", \"玫\", \"棒\", \"胰\", \"席\", \"顿\", \"驰\", \"腥\", \"涮\", \"阎\", \"颓\", \"窗\", \"参\", \"茱\", \"俞\", \"樟\", \"枉\", \"匈\", \"泥\", \"杉\", \"汐\", \"瞠\", \"诗\", \"枢\", \"流\", \"晶\", \"留\", \"匹\", \"蹭\", \"遛\", \"卓\", \"偷\", \"偻\", \"璃\", \"贡\", \"琴\", \"汤\", \"淼\", \"免\", \"椅\", \"擎\", \"峻\", \"烛\", \"馒\", \"技\", \"枝\", \"円\", \"◆\", \"犯\", \"卧\", \"杠\", \"绅\", \"拉\", \"馕\", \"侠\", \"患\", \"妞\", \"占\", \"哭\", \"牠\", \"更\", \"凶\", \"拍\", \"娶\", \"降\", \"蜜\", \"贬\", \"绍\", \"暨\", \"您\", \"磺\", \"菲\", \"俚\", \"噢\", \"拭\", \"岌\", \"阑\", \"仙\", \"酸\", \"医\", \"為\", \"⑩\", \"兵\", \"缆\", \"升\", \"采\", \"堕\", \"黩\", \"挡\", \"炼\", \"员\", \"傅\", \"\", \"娃\", \"颌\", \"宠\", \"逸\", \"皿\", \"恩\", \"驶\", \"蝌\", \"际\", \"僧\", \"葱\", \"眠\", \"捷\", \"喔\", \"迤\", \"弓\", \"害\", \"献\", \"屋\", \"隐\", \"铩\", \"烟\", \"培\", \"角\", \"宪\", \"成\", \"爸\", \"婉\", \"屄\", \"膛\", \"發\", \"鞠\", \"臻\", \"由\", \"逻\", \"挽\", \"锡\", \"攫\", \"炅\", \"癌\", \"铮\", \"谬\", \"岁\", \"娥\", \"砂\", \"琅\", \"涝\", \"芝\", \"祸\", \"[\", \"覆\", \"怠\", \"窟\", \"煜\", \"犟\", \"芃\", \"糯\", \"蹊\", \"重\", \"萍\", \"招\", \"標\", \"胥\", \"呐\", \"殆\", \"③\", \"缅\", \"蒜\", \"崽\", \"傥\", \"市\", \"飙\", \"绳\", \"愁\", \"阮\", \"亟\", \"坟\", \"诬\", \"掩\", \"仕\", \"疙\", \"获\", \"演\", \"扔\", \"厅\", \"埃\", \"翱\", \"刷\", \"鲸\", \"篱\", \"渐\", \"岭\", \"援\", \"虐\", \"灑\", \"楣\", \"却\", \"芯\", \"锣\", \"代\", \"嬉\", \"农\", \"洪\", \"差\", \"处\", \"囤\", \"耀\", \"▲\", \"佣\", \"汁\", \"鸭\", \"放\", \"坛\", \"慮\", \"乔\", \"衣\", \"鹕\", \"讷\", \"柔\", \"最\", \"踢\", \"挠\", \"踞\", \"蜀\", \"根\", \"噬\", \"鼯\", \"散\", \"髻\", \"傍\", \"掀\", \"坝\", \"嗲\", \"凄\", \"肾\", \"闸\", \"跃\", \"萦\", \"i\", \"貌\", \"壓\", \"缭\", \"匿\", \"飕\", \"这\", \"监\", \"弹\", \"吨\", \"嘲\", \"样\", \"巫\", \"补\", \"恶\", \"懒\", \"陋\", \"听\", \"俊\", \"黯\", \"亚\", \"尝\", \"淆\", \"焉\", \"煎\", \"骅\", \"衷\", \"钧\", \"棣\", \"似\", \"收\", \"颁\", \"抗\", \"茶\", \"九\", \"锏\", \"铎\", \"翕\", \"爪\", \"链\", \"闺\", \"挪\", \"岔\", \"噱\", \"袍\", \"劝\", \"锁\", \"肌\", \"吁\", \"辰\", \"到\", \"寻\", \"黔\", \"褚\", \"槿\", \"周\", \"究\", \"裆\", \"理\", \"嘴\", \"撰\", \"较\", \"积\", \"莉\", \"税\", \"赤\", \"蘑\", \"巅\", \"愈\", \"录\", \"飞\", \"自\", \"瑜\", \"泣\", \"瑰\", \"镐\", \"讽\", \"浮\", \"別\", \"谋\", \"茨\", \"宛\", \"贝\", \"沉\", \"倏\", \"翔\", \"蝶\", \"灼\", \"谦\", \"廊\", \"键\", \"液\", \"旗\", \"辫\", \"六\", \"瓜\", \"色\", \"啬\", \"希\", \"寨\", \"挖\", \"码\", \"他\", \"疹\", \"老\", \"诊\", \"槛\", \"饿\", \"汛\", \"卵\", \"菩\", \"觉\", \"蔬\", \"煽\", \"绸\", \"割\", \"豚\", \"鸿\", \"螃\", \"贯\", \"侦\", \"亭\", \"堵\", \"符\", \"座\", \"旧\", \"醛\", \"內\", \"5\", \"拂\", \"菌\", \"遏\", \"随\", \"刹\", \"怜\", \"嘣\", \"膊\", \"滥\", \"涣\", \"吧\", \"庆\", \"圩\", \"魏\", \"骏\", \"未\", \"派\", \"辙\", \"坤\", \"攒\", \"漉\", \"珉\", \"炮\", \"寐\", \"掺\", \"秩\", \"乃\", \"韦\", \"峭\", \"桓\", \"町\", \"哪\", \"满\", \"唤\", \"洽\", \"钮\", \"卿\", \"咖\", \"姚\", \"渤\", \"汪\", \"悟\", \"報\", \"吵\", \"窿\", \"御\", \"弛\", \"凤\", \"狗\", \"蹈\", \"琉\", \"畑\", \"速\", \"块\", \"讦\", \"容\", \"漪\", \"宵\", \"察\", \"躯\", \"诱\", \"弑\", \"猛\", \"泼\", \"渝\", \"阽\", \"帝\", \"戍\", \"黏\", \"剁\", \"峰\", \"罪\", \"宴\", \"杀\", \"把\", \"拢\", \"皱\", \"兹\", \"街\", \"渗\", \"指\", \"颖\", \"刊\", \"狭\", \"逮\", \"榴\", \"疴\", \"酱\", \"厘\", \"①\", \"插\", \"烬\", \"纨\", \"略\", \"r\", \"资\", \"函\", \"鳃\", \"噌\", \"而\", \"奶\", \"茧\", \"強\", \"拓\", \"彤\", \"恕\", \"坦\", \"约\", \"蒸\", \"竺\", \"吩\", \"笆\", \"烁\", \"烷\", \"跤\", \"揣\", \"簇\", \"鹭\", \"撬\", \"娅\", \"滨\", \"勖\", \"钜\", \"庸\", \"洋\", \"沦\", \"哉\", \"卜\", \"雇\", \"础\", \"棉\", \"婚\", \"尾\", \"陶\", \"规\", \"邻\", \"适\", \"瞻\", \"静\", \"排\", \"盯\", \"联\", \"膀\", \"霜\", \"榨\", \"次\", \"镜\", \"忘\", \"胞\", \"璇\", \"疸\", \"球\", \"贴\", \"蛔\", \"庐\", \"谑\", \"践\", \"抖\", \"混\", \"栽\", \"寥\", \"吏\", \"恙\", \"鼠\", \"拔\", \"郁\", \"庭\", \"书\", \"兰\", \"亡\", \"炳\", \"滋\", \"柏\", \"战\", \"澜\", \"欢\", \"钱\", \"摘\", \"溢\", \"陀\", \"吴\", \"熔\", \"聒\", \"扬\", \"趾\", \"婶\", \"挺\", \"姣\", \"态\", \"绘\", \"烹\", \"V\", \"季\", \"恪\", \"矢\", \"舰\", \"熄\", \"厉\", \"狐\", \"偏\", \"耻\", \"蔷\", \"择\", \"暇\", \"数\", \"激\", \"诵\", \"徘\", \"呵\", \"罹\", \"饰\", \"秘\", \"腑\", \"礼\", \"瓣\", \"宣\", \"懂\", \"耽\", \"徳\", \"量\", \"依\", \"疯\", \"篮\", \"痹\", \"柘\", \"呷\", \"科\", \"讲\", \"舐\", \"莺\", \"朽\", \"讳\", \"结\", \"翩\", \"牺\", \"智\", \"虎\", \"權\", \"伦\", \"漫\", \"候\", \"拱\", \"珠\", \"舵\", \"签\", \"倜\", \"髓\", \"沾\", \"湿\", \"蓁\", \"厨\", \"咽\", \"躁\", \"茸\", \"点\", \"卤\", \"勘\", \"锌\", \"攥\", \"详\", \"瑕\", \"蛊\", \"巡\", \"桌\", \"嘱\", \"摧\", \"浠\", \"池\", \"稠\", \"号\", \"判\", \"难\", \"哦\", \"欺\", \"霍\", \"谔\", \"腔\", \"撷\", \"虏\", \"蚀\", \"⑧\", \"夭\", \"瀛\", \"屏\", \"翊\", \"敝\", \"漩\", \"礁\", \"箍\", \"在\", \"铝\", \"邸\", \"辨\", \"漆\", \"秋\", \"蹿\", \"鹑\", \"動\", \"玻\", \"轿\", \"抛\", \"央\", \"啐\", \"沃\", \"谧\", \"寰\", \"坊\", \"哲\", \"夺\", \"罚\", \"古\", \"概\", \"纹\", \"巩\", \"秃\", \"胧\", \"惜\", \"凸\", \"殖\", \"艇\", \"烦\", \"诨\", \"渍\", \"剧\", \"浸\", \"关\", \"丐\", \"坞\", \"壁\", \"曼\", \"看\", \"斌\", \"跋\", \"沸\", \"槃\", \"畿\", \"瘦\", \"彙\", \"燃\", \"後\", \"用\", \"纵\", \"严\", \"夸\", \"寅\", \"帕\", \"贱\", \"徽\", \"玷\", \"倒\", \"冥\", \"厂\", \"邓\", \"纬\", \"迭\", \"幽\", \"荫\", \"弟\", \"霆\", \"崔\", \"绊\", \"硅\", \"撇\", \"橇\", \"呦\", \"嚣\", \"飓\", \"姆\", \"耦\", \"摔\", \"粱\", \"裴\", \"茂\", \"绚\", \"遣\", \"赵\", \"⒃\", \"基\", \"妖\", \"旅\", \"群\", \"驳\", \"挟\", \"第\", \"剔\", \"洁\", \"篝\", \"浩\", \"沐\", \"皂\", \"豪\", \"瞪\", \"啜\", \"溅\", \"雨\", \"居\", \"趣\", \"棘\", \"眶\", \"但\", \"・\", \"拳\", \"舞\", \"糖\", \"莎\", \"澳\", \"媚\", \"伴\", \"幸\", \"聿\", \"火\", \"挨\", \"锚\", \"两\", \"配\", \"砾\", \"枚\", \"蓉\", \"你\", \"找\", \"通\", \"渡\", \"芳\", \"帐\", \"唉\", \"微\", \"酿\", \"旬\", \"宾\", \"婴\", \"姗\", \"待\", \"后\", \"A\", \"嘈\", \"厌\", \"谈\", \"\\u0005\", \"亮\", \"豁\", \"呕\", \"滇\", \"孱\", \"疗\", \"望\", \"斧\", \"僚\", \"袱\", \"&\", \"沏\", \"圈\", \"戚\", \"以\", \"蕉\", \"荧\", \"骼\", \"催\", \"撐\", \"刮\", \"時\", \"斩\", \"窦\", \"哺\", \"纂\", \"呼\", \"非\", \"秤\", \"迄\", \"协\", \"灶\", \"肚\", \"蒙\", \"鸦\", \"汹\", \"橱\", \"伙\", \"助\", \"躲\", \"率\", \"卸\", \"蘸\", \"叨\", \"维\", \"了\", \"机\", \"赖\", \"橄\", \"乳\", \"趴\", \"孰\", \"飘\", \"粟\", \"认\", \"右\", \"媲\", \"亥\", \"_\", \"盗\", \"屠\", \"掖\", \"床\", \"锋\", \"辆\", \"暧\", \"昨\", \"味\", \"盎\", \"凿\", \"累\", \"據\", \"蜃\", \"临\", \"寿\", \"瑨\", \"喆\", \"益\", \"冬\", \"鹿\", \"辣\", \"吝\", \"溯\", \"雀\", \"奢\", \"粕\", \"尧\", \"外\", \"魁\", \"聚\", \"豫\", \"酋\", \"责\", \"货\", \"崩\", \"裹\", \"翅\", \"肆\", \"忙\", \"挫\", \"毅\", \"茏\", \"嗓\", \"目\", \"妙\", \"炊\", \"砌\", \"准\", \"焯\", \"戛\", \"艋\", \"峥\", \"揍\", \"台\", \"唯\", \"呢\", \"杰\", \"鼓\", \"早\", \"黝\", \"娜\", \"乾\", \"萎\", \"藏\", \"铲\", \"郭\", \"洛\", \"甲\", \"乏\", \"丑\", \"敦\", \"哇\", \" \", \"涕\", \"丙\", \"呻\", \"肢\", \"蛙\", \"柴\", \"世\", \"脱\", \"脚\", \"鞋\", \"叼\", \"抿\", \"汉\", \"纱\", \"兔\", \"歌\", \"弯\", \"偎\", \"涤\", \"伏\", \"麾\", \"椭\", \"血\", \"鬼\", \"热\", \"臧\", \"溜\", \"扉\", \"嘎\", \"猩\", \"璎\", \"螺\", \"净\", \"憔\", \"焙\", \"疑\", \"剪\", \"缜\", \"显\", \"埂\", \"票\", \"骆\", \"夏\", \"孝\", \"任\", \"户\", \"棂\", \"肥\", \"谩\", \"干\", \"她\", \"※\", \"蝉\", \"濮\", \"班\", \"苗\", \"好\", \"℃\", \"乡\", \"绉\", \"萝\", \"初\", \"拥\", \"堂\", \"肿\", \"执\", \"萄\", \"久\", \"荤\", \"载\", \"刀\", \"幻\", \"醒\", \"诣\", \"连\", \"俩\", \"英\", \"胀\", \"茉\", \"即\", \"於\", \"岛\", \"名\", \"值\", \"嗜\", \"偶\", \"建\", \"沁\", \"绑\", \"勃\", \"搂\", \"屈\", \"麟\", \"韧\", \"叫\", \"卉\", \"钵\", \"牵\", \"喷\", \"躺\", \"便\", \"歹\", \"贤\", \"籁\", \"测\", \"讯\", \"壤\", \"化\", \"赔\", \"延\", \"奔\", \"滴\", \"琛\", \"戴\", \"队\", \"空\", \"券\", \"婺\", \"颈\", \"匠\", \"孔\", \"请\", \"滕\", \"娼\", \"粮\", \"奎\", \"缓\", \"争\", \"没\", \"瞧\", \"吮\", \"端\", \"籍\", \"锐\", \"乙\", \"颉\", \"嘀\", \"沧\", \"仲\", \"湃\", \"绎\", \"岳\", \"寞\", \"倚\", \"惶\", \"拒\", \"有\", \"h\", \"地\", \"携\", \"预\", \"株\", \"振\", \"颜\", \"醍\", \"蜕\", \"侯\", \"慨\", \"洲\", \"拨\", \"揖\", \"蜒\", \"别\", \"椎\", \"顽\", \"靴\", \"慷\", \"阁\", \"场\", \"贫\", \"詹\", \"剖\", \"匀\", \"壑\", \"陛\", \"攘\", \"疤\", \"灯\", \"邕\", \"皙\", \"袁\", \"兮\", \"览\", \"济\", \"矣\", \"糊\", \"总\", \"鄯\", \"过\", \"愕\", \"珍\", \"坏\", \"橡\", \"讥\", \"摇\", \"盐\", \"梭\", \"钟\", \"赛\", \"洗\", \"锲\", \"性\", \"彻\", \"辩\", \"箱\", \"音\", \"窒\", \"牲\", \"案\", \"酝\", \"瘾\", \"实\", \"店\", \"贵\", \"惦\", \"甜\", \"波\", \"经\", \"寓\", \"比\", \"嘻\", \"莅\", \"%\", \"鸽\", \"侬\", \"斥\", \"浊\", \"彗\", \"钢\", \"爵\", \"苇\", \"律\", \"朔\", \"番\", \"鹤\", \"馨\", \"潜\", \"架\", \"冯\", \"影\", \"奘\", \"啼\", \"涉\", \"棍\", \"威\", \"柑\", \"翁\", \"淳\", \"扰\", \"段\", \"廉\", \"氢\", \"颤\", \"作\", \"荒\", \"应\", \"榆\", \"悦\", \"淑\", \"趁\", \"谨\", \"穆\", \"痪\", \"漠\", \"渣\", \"腹\", \"提\", \"僻\", \"页\", \"斯\", \"匆\", \"驮\", \"菱\", \"综\", \"碍\", \"妨\", \"爆\", \"职\", \"睿\", \"槽\", \"闲\", \"巨\", \"昊\", \"界\", \"肯\", \"镀\", \"惩\", \"病\", \"拖\", \"纰\", \"肺\", \"舀\", \"姐\", \"挂\", \"掘\", \"熟\", \"柯\", \"假\", \"阴\", \"捅\", \"涟\", \"姥\", \"腋\", \"矗\", \"俪\", \"葩\", \"虔\", \"息\", \"孪\", \"渠\", \"繁\", \"浴\", \"臀\", \"豹\", \"夥\", \"擀\", \"梗\", \"言\", \"厦\", \"伐\", \"雌\", \"剑\", \"钥\", \"垄\", \"旁\", \"畔\", \"栖\", \"托\", \"拽\", \"袜\", \"艺\", \"堰\", \"拟\", \"般\", \"冒\", \"辽\", \"秦\", \"虑\", \"圆\", \"孙\", \"蝗\", \"酵\", \"县\", \"窥\", \"婪\", \"羞\", \"+\", \"盲\", \"绪\", \"鼾\", \"沫\", \"讶\", \"搭\", \"楚\", \"嗣\", \"蚓\", \"旱\", \"忐\", \"潘\", \"ヨ\", \"镭\", \"划\", \"觅\", \"屎\", \"倘\", \"牢\", \"弘\", \"絮\", \"定\", \"龇\", \"悔\", \"褪\", \"恰\", \"伯\", \"辞\", \"泉\", \"陡\", \"烯\", \"笛\", \"辕\", \"p\", \"媒\", \"侣\", \"宏\", \"剂\", \"锥\", \"附\", \"⑨\", \"\", \"确\", \"雏\", \"惋\", \"弱\", \"宽\", \"握\", \"瘫\", \"恨\", \"贼\", \"噪\", \"晒\", \"保\", \"兢\", \"蹄\", \"教\", \"管\", \"编\", \"摸\", \"涂\", \"荏\", \"仇\", \"枷\", \"畏\", \"勿\", \"埠\", \"近\", \"锻\", \"泱\", \"栈\", \"慑\", \"秸\", \"倨\", \"爹\", \"愚\", \"鹉\", \"剽\", \"质\", \"咯\", \"邪\", \"⒀\", \"盆\", \"须\", \"荟\", \"牧\", \"梦\", \"阀\", \"查\", \"操\", \"勒\", \"背\", \"拼\", \"倡\", \"左\", \"奋\", \"岑\", \"遮\", \"锢\", \"垠\", \"脑\", \"褂\", \"蜘\", \"伉\", \"酪\", \"深\", \"权\", \"萌\", \"坪\", \"谁\", \"沽\", \"钞\", \"甫\", \"痒\", \"邢\", \"佟\", \"浙\", \"全\", \"葡\", \"度\", \"煮\", \"0\", \"虹\", \"忆\", \"砖\", \"賣\", \"氰\", \"告\", \"渴\", \"抬\", \"坠\", \"淄\", \"庙\", \"绛\", \"寸\", \"薰\", \"型\", \"盟\", \"卷\", \"逊\", \"咕\", \"帘\", \"贩\", \"童\", \"曳\", \"遗\", \"敬\", \"于\", \"呀\", \"宫\", \"啤\", \"赶\", \"耘\", \"捧\", \"邬\", \"峨\", \"佳\", \"崖\", \"署\", \"舎\", \"针\", \"惚\", \"蕤\", \"印\", \"撞\", \"德\", \"儒\", \"挑\", \"硬\", \"烧\", \"装\", \"茜\", \"碑\", \"儿\", \"诧\", \"肪\", \"因\", \"据\", \"螂\", \"糠\", \"惰\", \"埋\", \"价\", \"瞎\", \"叛\", \"捕\", \"遍\", \"卑\", \"为\", \"毡\", \"嚼\", \"癜\", \"抒\", \"俱\", \"声\", \"润\", \"局\", \"韩\", \"袋\", \"蜡\", \"叠\", \"刚\", \"然\", \"莴\", \"尸\", \"甩\", \"恼\", \"徙\", \"憋\", \"捏\", \"】\", \"苒\", \"鳗\", \"妃\", \"咱\", \"芋\", \"檬\", \"抉\", \"越\", \"抹\", \"倾\", \"仑\", \"冻\", \"校\", \"欣\", \"遇\", \"扎\", \"院\", \"缈\", \"厥\", \"晰\", \"粘\", \"噶\", \"隋\", \"玄\", \"返\", \"藐\", \"咪\", \"菁\", \"巢\", \"麽\", \"羚\", \"喇\", \"肇\", \"夜\", \"阪\", \"號\", \"卖\", \"逝\", \"骛\", \"弗\", \"奴\", \"\", \"惑\", \"红\", \"畸\", \"萃\", \"站\", \"圭\", \"广\", \"膏\", \"盈\", \"循\", \"陇\", \"熏\", \"揽\", \"牒\", \"岸\", \"吻\", \"穹\", \"稽\", \"郑\", \"迫\", \"魅\", \"奖\", \"祥\", \"瘩\", \"昂\", \"脆\", \"玉\", \"冉\", \"喜\", \"对\", \"遐\", \"睫\", \"廷\", \"可\", \"挤\", \"露\", \"诡\", \"很\", \"答\", \"梁\", \"壶\", \"鸠\", \"匾\", \"细\", \"缝\", \"懵\", \"喧\", \"蓟\", \"萼\", \"淘\", \"终\", \"梵\", \"靠\", \"臣\", \"吱\", \"豌\", \"嘤\", \"嵘\", \"立\", \"秀\", \"醐\", \"猫\", \"罩\", \"分\", \"灾\", \"骗\", \"庇\", \"泡\", \"潦\", \"策\", \"烙\", \"翠\", \"阿\", \"猥\", \"苛\", \"描\", \"锂\", \"唏\", \"怪\", \"此\", \"竿\", \"芷\", \"卢\", \"捉\", \"缄\", \"靶\", \"档\", \"丹\", \"订\", \"脉\", \"慌\", \"叩\", \"呸\", \"慎\", \"慰\", \"绞\", \"菊\", \"淖\", \"驿\", \"购\", \"寒\", \"瘀\", \"碰\", \"砧\", \"酣\", \"湾\", \"圣\", \"馄\", \"甯\", \"汗\", \"狠\", \"⑸\", \"C\", \"凝\", \"帽\", \"擤\", \"尔\", \"翼\", \"祝\", \"黧\", \"翡\", \"至\", \"的\", \"辛\", \"薯\", \"嗦\", \"极\", \"魂\", \"桥\", \"服\", \"邹\", \"妄\", \"旷\", \"瑟\", \"雳\", \"盘\", \"苦\", \"秆\", \"饨\", \"审\", \"⑥\", \"矫\", \"嗨\", \"钻\", \"时\", \"昕\", \"暮\", \"掉\", \"所\", \"耿\", \"扣\", \"辱\", \"劾\", \"减\", \"侈\", \"志\", \"俭\", \"?\", \"逆\", \"运\", \"瞟\", \"婷\", \"房\", \"竟\", \"验\", \"骂\", \"芦\", \"饱\", \"播\", \"嗅\", \"桔\", \"域\", \"钉\", \"伫\", \"嚷\", \"蟀\", \"晚\", \"溘\", \"阅\", \"玛\", \"巾\", \"吟\", \"掐\", \"荼\", \"楔\", \"畅\", \"瞒\", \"萨\", \"矩\", \"柠\", \"宅\", \"熙\", \"泾\", \"训\", \"荆\", \"黢\", \"爬\", \"裘\", \"熨\", \"坂\", \"併\", \"欧\", \"粒\", \"它\", \"惯\", \"喃\", \"○\", \"脸\", \"晤\", \"粽\", \"焦\", \"疆\", \"晴\", \"寄\", \"痫\", \"锈\", \"轻\", \"牟\", \"遂\", \"篡\", \"戒\", \"稀\", \"貂\", \"亩\", \"遥\", \"屯\", \"隔\", \"磋\", \"祀\", \"\\u0006\", \"扭\", \"敏\", \"肩\", \"棠\", \"超\", \"霉\", \"园\", \"坚\", \"顾\", \"伍\", \"固\", \"裁\", \"哧\", \"算\", \"匮\", \"欸\", \"臃\", \"碌\", \"梢\", \"百\", \"憧\", \"疚\", \"韪\", \"专\", \"船\", \"刘\", \"苣\", \"困\", \"橘\", \"腓\", \"搏\", \"巴\", \"输\", \"募\", \"耕\", \"醋\", \"奚\", \"徒\", \"纽\", \"介\", \"物\", \"级\", \"享\", \"辈\", \"鸟\", \"敷\", \"布\", \"酥\", \"拐\", \"個\", \"词\", \"朝\", \"仅\", \"昧\", \"赏\", \"啊\", \"欲\", \"伺\", \"交\", \"活\", \"胱\", \"惫\", \"单\", \"妒\", \"张\", \"煞\", \"帷\", \"琳\", \"瓷\", \"底\", \"侥\", \"臆\", \"芬\", \"养\", \"葫\", \"彷\", \"篓\", \"特\", \"身\", \"倪\", \"烃\", \"汰\", \"歧\", \"靛\", \"充\", \"围\", \"誓\", \"筝\", \"回\", \"私\", \"娄\", \"烂\", \"则\", \"仓\", \"式\", \"鹰\", \"坎\", \"瑑\", \"狸\", \"炭\", \"胖\", \"沛\", \"报\", \"メ\", \"晖\", \"拜\", \"琢\", \"映\", \"肛\", \"咀\", \"毕\", \"余\", \"摆\", \"赃\", \"狄\", \"响\", \"へ\", \"继\", \"腕\", \"区\", \"惧\", \"再\", \"毁\", \"役\", \"茄\", \"奇\", \"万\", \"甸\", \"莹\", \"状\", \"思\", \"棕\", \"折\", \"蚤\", \"釜\", \"克\", \"乓\", \"荻\", \"虾\", \"冰\", \"骰\", \"置\", \"尼\", \"筋\", \"哮\", \"课\", \"缚\", \"门\", \"诸\", \"勤\", \"储\", \"诙\", \"党\", \"沟\", \"猝\", \"令\", \"尊\", \"姑\", \"簧\", \"疾\", \"柿\", \"慧\", \"楼\", \"仿\", \"喂\", \"8\", \"恍\", \"缥\", \"羹\", \"d\", \"恺\", \"喻\", \"浏\", \"账\", \"薩\", \"瀑\", \"惘\", \"艳\", \"饭\", \"蓝\", \"持\", \"腊\", \"坯\", \"窖\", \"贸\", \"称\", \"葆\", \"幅\", \"辗\", \"奉\", \"岂\", \"〖\", \"汩\", \"吹\", \"壕\", \"游\", \"苟\", \"揉\", \"财\", \"午\", \"柜\", \"兜\", \"辅\", \"访\", \"贺\", \"举\", \"屿\", \"动\", \"亲\", \"顺\", \"饥\", \"宙\", \"栅\", \"艰\", \"迟\", \"炬\", \"〔\", \"赂\", \"孕\", \"靖\", \"替\", \"罄\", \"限\", \"途\", \"懦\", \"会\", \"读\", \"源\", \"巷\", \"癫\", \"轰\", \"府\", \"照\", \"怡\", \"鞘\", \"走\", \"缉\", \"呛\", \"衅\", \"囊\", \"起\", \"隆\", \"筛\", \"迹\", \"啪\", \"氛\", \"兴\", \"損\", \"镏\", \"鲤\", \"毛\", \"哑\", \"淤\", \"磊\", \"痊\", \"劳\", \"託\", \"剿\", \"翻\", \"浚\", \"衡\", \"贷\", \"瘙\", \"母\", \"颗\", \"谀\", \"妍\", \"推\", \"粪\", \"除\", \"贪\", \"挈\", \"昔\", \"拷\", \"勾\", \"鑫\", \"镉\", \"⑶\", \"竖\", \"旋\", \"鲍\", \"够\", \"罗\", \"掌\", \"矶\", \"舟\", \"披\", \"犷\", \"凌\", \"罐\", \"寺\", \"跌\", \"瞩\", \"幕\", \"家\", \"启\", \"妹\", \"转\", \"努\", \"蟹\", \"挎\", \"纸\", \"嘟\", \"嗪\", \"嗤\", \"忑\", \"孜\", \"婿\", \"旳\", \"佬\", \"杯\", \"尿\", \"斐\", \"墨\", \"浆\", \"铣\", \"弊\", \"送\", \"要\", \"狙\", \"福\", \"珊\", \"拯\", \"丛\", \"瞅\", \"体\", \"傻\", \" \", \"蛇\", \"敖\", \"狳\", \"删\", \"榷\", \"绒\", \"镑\", \"发\", \"蹦\", \"呃\", \"\\u0007\", \"枣\", \"素\", \"網\", \"桃\", \""\", \"寝\", \"只\", \"淮\", \"愣\", \"苏\", \"饵\", \"舆\", \"风\", \"颂\", \"哥\", \"乌\", \"佘\", \"朴\", \"晃\", \"抑\", \"利\", \"抄\", \"泪\", \"休\", \"湮\", \"陪\", \"递\", \"垣\", \"泵\", \"蕃\", \"崛\", \"存\", \"淹\", \"悚\", \"厕\", \"丸\", \"已\", \"扑\", \"截\", \"缺\", \"亵\", \"踱\", \"紧\", \"产\", \"疫\", \"癖\", \"雾\", \"漂\", \"ノ\", \"肠\", \"惨\", \"押\", \"殉\", \"项\", \"厝\", \"修\", \"熊\", \"當\", \"话\", \"桑\", \"系\", \"惟\", \"锄\", \"互\", \"某\", \"许\", \"狂\", \"蒂\", \"竣\", \"樱\", \"计\", \"\", \"珀\", \"盛\", \"份\", \"扶\", \"硕\", \"酒\", \"睬\", \"栓\", \"耗\", \"宁\", \"官\", \"接\", \"触\", \"桩\", \"娩\", \"瑢\", \"感\", \"银\", \"写\", \"贞\", \"裤\", \"缴\", \"炉\", \"勺\", \"着\", \"额\", \"弥\", \"澈\", \"副\", \"攻\", \"碧\", \"磅\", \"诀\", \"胸\", \"矍\", \"藉\", \"跚\", \"沓\", \"卡\", \"包\", \"榜\", \"压\", \"达\", \"珞\", \"蜴\", \"就\", \"取\", \"哟\", \"谣\", \"兽\", \"爽\", \"膜\", \"轨\", \"浅\", \"稿\", \"冀\", \"避\", \"仄\", \"领\", \"彦\", \"茁\", \"嫩\", \"硫\", \"⑤\", \"搁\", \"锤\", \"夯\", \"脂\", \"糟\", \"晕\", \"猖\", \"穰\", \"鄙\", \"瞄\", \"吭\", \"或\", \"讨\", \"袭\", \"逼\", \"效\", \"葬\", \"忡\", \"救\", \"反\", \"邃\", \"辐\", \"意\", \"铸\", \"统\", \"涵\", \"驭\", \"狼\", \"淞\", \"穴\", \"凰\", \"靓\", \"丈\", \"狱\", \"诉\", \"付\", \"棺\", \"捡\", \"窝\", \"怕\", \"材\", \"忧\", \"赡\", \"骇\", \"蹴\", \"铛\", \"强\", \"共\", \"炸\", \"怎\", \"豆\", \"摊\", \"笔\", \"稣\", \"误\", \"搀\", \"贿\", \"煤\", \"挣\", \"少\", \"抱\", \"蜷\", \"甄\", \"伞\", \"阂\", \"怀\", \"塞\", \"烘\", \"郝\", \"氨\", \"尹\", \"姿\", \"蔼\", \"驱\", \"被\", \"纤\", \"削\", \"镳\", \"晟\", \"迦\", \"护\", \"屑\", \"邀\", \"榄\", \"赫\", \"姊\", \"拦\", \"些\", \"瑄\", \"去\", \"栾\", \"悲\", \"烈\", \"犄\", \"酬\", \"屣\", \"网\", \"步\", \"〕\", \"阳\", \"資\", \"另\", \"卍\", \"尽\", \"琪\", \"朵\", \"黛\", \"惠\", \"\\u0000\", \"诚\", \"羽\", \"么\", \"横\", \"榭\", \"吞\", \"叙\", \"旨\", \"遑\", \"ソ\", \"邂\", \"元\", \"佩\", \"轮\", \"牛\", \"咚\", \"霄\", \"岚\", \"纪\", \"亂\", \"祉\", \"琶\", \"脖\", \"瞬\", \"漲\", \"\", \"梳\", \"咋\", \"炝\", \"骚\", \"磨\", \"隙\", \"痴\", \"间\", \"品\", \"眩\", \"溶\", \"彪\", \"废\", \"标\", \"殿\", \"煌\", \"腱\", \"耍\", \"杏\", \"觑\", \"啥\", \"谍\", \"澡\", \"是\", \"胺\", \"斋\", \"邵\", \"禁\", \"召\", \"届\", \"篷\", \"胃\", \"其\", \"暗\", \"悄\", \"予\", \"康\", \"纲\", \"绷\", \"榻\", \"呈\", \"虞\", \"哒\", \"侄\", \"辟\", \"侵\", \"舔\", \"荨\", \"曝\", \"潭\", \"绿\", \"泰\", \"租\", \"契\", \"那\", \"鳌\", \"邋\", \"燥\", \"行\", \"碾\", \"宰\", \"禧\", \"坑\", \"拾\", \"币\", \"楷\", \"⑦\", \"叉\", \"舒\", \"调\", \"仪\", \"句\", \"纳\", \"译\", \"萤\", \"喱\", \"渊\", \"戈\", \"阜\", \"梯\", \"鹅\", \"焚\", \"吓\", \"损\", \"眺\", \"潇\", \"拧\", \"侮\", \"善\", \"曾\", \"核\", \"失\", \"氯\", \"议\", \"首\", \"筷\", \"曙\", \"磁\", \"淌\", \"兄\", \"诠\", \"鸥\", \"2\", \"何\", \"琦\", \"鬣\", \"离\", \"腰\", \"敲\", \"氮\", \"博\", \"普\", \"务\", \"荷\", \"渔\", \"薪\", \"拌\", \"慈\", \"我\", \"竞\", \"歩\", \"馏\", \"命\", \"从\", \"娇\", \"伽\", \"鲁\", \"枕\", \"芹\", \"翌\", \"集\", \"椒\", \"闹\", \"堆\", \"警\", \"廓\", \"垂\", \"绝\", \"育\", \"含\", \"霊\", \"靡\", \"旭\", \"圾\", \"孵\", \"忪\", \"娟\", \"谊\", \"躇\", \"委\", \"慢\", \"轴\", \"甬\", \"妈\", \"题\", \"富\", \"商\", \"戮\", \"痛\", \"军\", \"蠢\", \"备\", \"逛\", \"玳\", \"缔\", \"直\", \"棋\", \"鹈\", \"札\", \"虱\", \"妮\", \"迷\", \"米\", \"啡\", \"碗\", \"况\", \"楞\", \"罔\", \"禄\", \"扯\", \"制\", \"踵\", \"扪\", \"友\", \"垫\", \"向\", \"境\", \"顶\", \"罢\", \"麓\", \"诶\", \"〗\", \"故\", \"嘿\", \"毋\", \"透\", \"菇\", \"椰\", \"让\", \"沼\", \"岐\", \"蔑\", \"魄\", \"凳\", \"涅\", \"具\", \"展\", \"蹩\", \"恢\", \"妓\", \"舍\", \"碳\", \"探\", \"忿\", \"垛\", \"鼎\", \"业\", \"买\", \"赅\", \"搜\", \"蛋\", \"娠\", \"馍\", \"盹\", \"瑒\", \"喽\", \"a\", \"见\", \"岱\", \"锯\", \"灭\", \"雍\", \"④\", \"遵\", \"槐\", \"树\", \"⑿\", \"逾\", \"涨\", \"退\", \"刻\", \"匙\", \"错\", \"迁\", \"臭\", \"檀\", \"亨\", \"芒\", \"媳\", \"腭\", \"能\", \"赐\", \"倦\", \"皮\", \"叮\", \"优\", \"丽\", \"麻\", \"类\", \"轩\", \"还\", \"祈\", \"滔\", \"矛\", \"芥\", \"扮\", \"蚪\", \"拆\", \"赌\", \"履\", \"窘\", \"圳\", \"熬\", \"熹\", \"串\", \"踊\", \"莱\", \"睛\", \"聋\", \"忍\", \"四\", \"鸩\", \"礴\", \"汲\", \"湄\", \"面\", \"缀\", \"笃\", \"娘\", \"赣\", \"浑\", \"耩\", \"俏\", \"马\", \"凋\", \"滩\", \"们\", \"醉\", \"啸\", \"姻\", \"帆\", \"序\", \"想\", \"庚\", \"鲱\", \"摹\", \"龄\", \"挲\", \"孤\", \"馈\", \"嗔\", \"劲\", \"遁\", \"呆\", \"璨\", \"变\", \"谅\", \"戳\", \"腐\", \"虚\", \"隧\", \"焊\", \"创\", \"淇\", \"蚯\", \"鹌\", \"侨\", \"诩\", \"岩\", \"恳\", \"法\", \"碎\", \"淡\", \"掂\", \"允\", \"料\", \"尤\", \"曲\", \"敢\", \"忱\", \"幼\", \"掰\", \"樯\", \"窄\", \"来\", \"淀\", \"换\", \"祛\", \"凑\", \"喘\", \"急\", \"蚁\", \"妆\", \"恭\", \"眼\", \"吕\", \"s\", \"鹜\", \"瓢\", \"施\", \"琼\", \"篢\", \"解\", \"悖\", \"齿\", \"字\", \"尉\", \"佝\", \"匪\", \"哨\", \"讪\", \"叭\", \"幢\", \"易\", \"拗\", \"唆\", \"胎\", \"悼\", \"涩\", \"墒\", \"示\", \"粤\", \"祷\", \"耙\", \"疵\", \"雪\", \"妊\", \"锦\", \"踏\", \"擞\", \"嵌\", \"厄\", \"封\", \"什\", \"撅\", \"将\", \"萧\", \"柳\", \"铄\", \"呗\", \"娛\", \"砥\", \"洞\", \"设\", \"冠\", \"俨\", \"帮\", \"歪\", \"密\", \"莘\", \"笑\", \"黄\", \"旦\", \"嘭\", \"洒\", \"浇\", \"N\", \"春\", \"卫\", \"镍\", \"搞\", \"茵\", \"昌\", \"霞\", \"暹\", \"吆\", \"狩\", \"噼\", \"龟\", \"砍\", \"停\", \"求\", \"肋\", \"鹏\", \"丧\", \"片\", \"潢\", \"沮\", \"形\", \"咨\", \"捞\", \"飚\", \"钊\", \"贾\", \"义\", \"电\", \"扳\", \"冈\", \"暄\", \"蛮\", \"瑶\", \"蝇\", \"驴\", \"捐\", \"燕\", \"牙\", \"亏\", \"企\", \"兼\", \"攸\", \"雅\", \"鸡\", \"拙\", \"懊\", \"煲\", \"疏\", \"泽\", \"楠\", \"蓬\", \"沪\", \"车\", \"骄\", \"抡\", \"岣\", \"胡\", \"添\", \"按\", \"鉴\", \"简\", \"炙\", \"织\", \"嗡\", \"铭\", \"仆\", \"箔\", \"该\", \"脐\", \"梧\", \"释\", \"凡\", \"霏\", \"赢\", \"塔\", \"耐\", \"默\", \"迎\", \"T\", \"乎\", \"荣\", \".\", \"跨\", \"毫\", \"扼\", \"敛\", \"革\", \"韬\", \"乘\", \"缪\", \"工\", \"蔡\", \"⒋\", \"爻\", \"景\", \"胳\", \"距\", \"轼\", \"莞\", \"完\", \"桦\", \"造\", \"紊\", \"價\", \"乖\", \"括\", \"谚\", \"说\", \"既\", \"改\", \"辑\", \"哈\", \"止\", \"赘\", \"咳\", \"墅\", \"逶\", \"长\", \"雕\", \"逗\", \"鲜\", \"沈\", \"唠\", \"並\", \"胫\", \"昆\", \"问\", \"钓\", \"肖\", \"弦\", \"糕\", \"吃\", \"霓\", \"库\", \"俘\", \"嫂\", \"悍\", \"软\", \"邯\", \"蟑\", \"袖\", \"蟋\", \"卻\", \"晗\", \"染\", \"污\", \"驼\", \"膝\", \"逞\", \"郅\", \"抠\", \"庶\", \"枪\", \"芜\", \"弧\", \"锒\", \"檐\", \"曦\", \"柱\", \"鹦\", \"曹\", \"奠\", \"柄\", \"怵\", \"朗\", \"睽\", \"悬\", \"垮\", \"塌\", \"八\", \"打\", \"裸\", \"栩\", \"陌\", \"寂\", \"邮\", \"\\b\", \"往\", \"虫\", \"并\", \"乒\", \"灰\", \"屉\", \"芽\", \"涯\", \"猬\", \"苍\", \"D\", \"呜\", \"怒\", \"梅\", \"怖\", \"杨\", \"挚\", \"炎\", \"油\", \"申\", \"边\", \"香\", \"刺\", \"锅\", \"掬\", \"睦\", \"欠\", \"牖\", \"峡\", \"秽\", \"缠\", \"娑\", \"泄\", \"彩\", \" \", \"析\", \"毙\", \"俗\", \"入\", \"模\", \"瞰\", \"n\", \"暂\", \"吾\", \"尬\", \"杭\", \"出\", \"诟\", \"羔\", \"术\", \"眨\", \"翘\", \"玲\", \"樊\", \"埔\", \"唬\", \"诃\", \"又\", \"泳\", \"惕\", \"异\", \"哀\", \"琐\", \"珏\", \"躬\", \"窍\", \"控\", \"条\", \"趟\", \"湖\", \"晋\", \"谴\", \"屹\", \"撸\", \"草\", \"潮\", \"带\", \"吊\", \"励\", \"怔\", \"饲\", \"闪\", \"浞\", \"负\", \"杜\", \"粼\", \"现\", \"主\", \"滤\", \"历\", \"憨\", \"贮\", \"导\", \"费\", \"缸\", \"哼\", \"吼\", \"唐\", \"表\", \"蛛\", \"胚\", \"势\", \"供\", \"谢\", \"开\", \"猾\", \"纺\", \"惺\", \"当\", \"抓\", \"孽\", \"浦\", \"〝\", \"桢\", \"啦\", \"加\", \"担\", \"诞\", \"绵\", \"陷\", \"\", \"裳\", \"麦\", \"浓\", \"晦\", \"络\", \"忽\", \"墓\", \"劫\", \"採\", \"陵\", \"里\", \"剐\", \"民\", \"支\", \"住\", \"隘\", \"壳\", \"燎\", \"漱\", \"唷\", \"蜥\", \"凭\", \"猎\", \"屁\", \"巧\", \"逃\", \"促\", \"隶\", \"茅\", \"歼\", \"传\", \"莫\", \"籽\", \"徐\", \"荐\", \"云\", \"阻\", \"弄\", \"胁\", \"渲\", \"嘛\", \"臼\", \"佛\", \"范\", \"玩\", \"扩\", \"衔\", \"摒\", \"猡\", \"败\", \"慕\", \"舛\", \"港\", \"膳\", \"饽\", \"瘠\", \"肮\", \"揭\", \"丁\", \"撤\", \"妥\", \"纯\", \"葛\", \"柬\", \"植\", \"穗\", \"馅\", \"宝\", \"咆\", \"惮\", \"伸\", \"焰\", \"⑷\", \"厢\", \"枯\", \"斑\", \"殷\", \"栗\", \"谛\", \"蔓\", \"之\", \"阱\", \"泯\", \"旖\", \"凉\", \"桂\", \"湛\", \"陈\", \"象\", \"倍\", \"襄\", \"唱\", \"娱\", \"器\", \"韵\", \"征\", \"绽\", \"逐\", \"哎\", \"跟\", \"颠\", \"售\", \"证\", \"o\", \"团\", \"饼\", \"e\", \"寡\", \"宋\", \"彼\", \"巍\", \"径\", \"僵\", \"尖\", \"远\", \"邦\", \"忠\", \"踌\", \"鬓\", \"多\", \"种\", \"盒\", \"进\", \"烤\", \"闾\", \"磕\", \"闻\", \"旎\", \"蔽\", \"睁\", \"颧\", \"各\", \"饮\", \"酌\", \"辜\", \"颐\", \"龙\", \"乱\", \"环\", \"筐\", \"恃\", \"〃\", \"迪\", \"鸣\", \"华\", \"板\", \"媛\", \"缮\", \"丝\", \"掷\", \"惬\", \"拘\", \"ㄓ\", \"垒\", \"唾\", \"估\", \"馁\", \"橙\", \"夷\", \"墙\", \"粗\", \"汽\", \"梨\", \"每\", \"虽\", \"郸\", \"众\", \"邑\", \"衬\", \"敌\", \"朋\", \"视\", \"笼\", \"蜿\", \"淅\", \"亦\", \"∶\", \"研\", \"孀\", \"咔\", \"驻\", \"今\", \"悴\", \"筒\", \"袒\", \"辄\", \"死\", \"崇\", \"果\", \"峙\", \"搡\", \"精\", \"運\", \"双\", \"毗\", \"禽\", \"皆\", \"灵\", \"犀\", \"脏\", \"郜\", \"撕\", \"典\", \"旺\", \"危\", \"蚂\", \"蜂\", \"棱\", \"营\", \"孟\", \"祖\", \"复\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/fr": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1540504,
"_n_tokens": 563220,
"_n_chars": 1484970,
"_n_oov_chars": 49,
"oov_ratio": 3.29972996087463e-05,
"_oov_charset": "[\"🙂\", \"
\", \"😀\", \"♕\", \"℃\", \"❤\", \"\", \"̂\", \"̧\", \"🤔\", \"\", \"Ô\", \"😉\", \"�\", \"Ê\", \"™\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/es": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1664455,
"_n_tokens": 610231,
"_n_chars": 1630297,
"_n_oov_chars": 68,
"oov_ratio": 4.171019145591263e-05,
"_oov_charset": "[\"\", \"▷\", \"\", \"\", \"😦\", \"🙁\", \"\", \"🙂\", \"😀\", \"❤\", \"️\", \"😉\", \"✪\", \"✖\", \"✔\", \"✓\", \"👏\", \"👍\", \"\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/en": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1124813,
"_n_tokens": 357068,
"_n_chars": 1121360,
"_n_oov_chars": 32977,
"oov_ratio": 0.029408040236855247,
"_oov_charset": "[\"“\", \"D\", \"S\", \"R\", \"😥\", \"\", \"–\", \"\", \"‘\", \"W\", \"…\", \"‑\", \"’\", \"ñ\", \"🙂\", \"´\", \"Z\", \"V\", \"”\", \"U\", \"😉\", \"J\", \" \", \"H\", \"—\", \"K\", \"N\", \"C\", \"¡\", \"Y\", \"A\", \"é\", \"ï\", \"è\", \"¦\", \"�\", \"ó\", \"\", \"M\", \"F\", \"Q\", \"L\", \"I\", \"T\", \"O\", \"P\", \"B\", \"G\", \"\", \"X\", \"E\", \"\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/zh-Hans": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 2633047,
"_n_tokens": 876599,
"_n_chars": 927311,
"_n_oov_chars": 34029,
"oov_ratio": 0.0366964265494532,
"_oov_charset": "[\"“\", \"D\", \"N\", \"浞\", \"鲎\", \"à\", \"W\", \"Z\", \"镏\", \"绉\", \"瑥\", \"\\u0006\", \"韫\", \"戢\", \"翕\", \"N\", \"ズ\", \"A\", \"�\", \"\", \"ό\", \"M\", \"ě\", \"韪\", \"Q\", \"V\", \"T\", \"\", \"⒁\", \"岣\", \"A\", \"î\", \"S\", \"\\u0005\", \"\", \"‘\", \"’\", \"旳\", \"V\", \"T\", \"”\", \"馕\", \"龇\", \"瑒\", \"`\", \"旆\", \"猡\", \"H\", \"ê\", \"—\", \"屣\", \" \", \"狳\", \"⑿\", \"Y\", \"\\u0000\", \"\\u0007\", \"F\", \"\", \"瑧\", \"I\", \"G\", \"B\", \"X\", \"Ø\", \"\", \"瑑\", \"黩\", \"R\", \"⒂\", \"\", \"\", \"浠\", \"炝\", \"倨\", \"鸩\", \"鄯\", \"瑨\", \"⒀\", \"J\", \"耩\", \"锒\", \"C\", \"犰\", \"讦\", \"\", \"C\", \"啐\", \"擤\", \"黧\", \"L\", \"犟\", \"ù\", \"瑢\", \"阽\", \"逑\", \"E\", \"\\b\", \"–\", \"诨\", \"D\", \"…\", \"疴\", \"ㄓ\", \" \", \"牖\", \"―\", \"U\", \"ὐ\", \"⒌\", \"篢\", \"K\", \"á\", \"é\", \"溘\", \"ç\", \"P\", \"O\", \"鼯\", \"穰\", \"黢\", \"⒃\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/fr": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1540504,
"_n_tokens": 533134,
"_n_chars": 1484970,
"_n_oov_chars": 74274,
"oov_ratio": 0.0500171720640821,
"_oov_charset": "[\"ë\", \"î\", \"D\", \"R\", \"S\", \"“\", \"È\", \"ô\", \"–\", \"\", \"̧\", \"\", \"‐\", \"Ê\", \"‘\", \"à\", \"W\", \"…\", \"’\", \"🙂\", \"´\", \"Z\", \"😀\", \"♕\", \"̂\", \"V\", \"―\", \"́\", \"U\", \"”\", \"😉\", \"À\", \"J\", \" \", \"ü\", \"H\", \"
\", \"ê\", \"—\", \"Ç\", \"K\", \"N\", \"C\", \"É\", \"🤔\", \"Ô\", \"è\", \"é\", \"A\", \"ï\", \"Y\", \"�\", \"ã\", \"í\", \"M\", \"â\", \"û\", \"Â\", \"F\", \"Q\", \"L\", \"I\", \"ç\", \"T\", \"P\", \"O\", \"B\", \"œ\", \"ù\", \"G\", \"X\", \"ğ\", \"ä\", \"E\", \"Î\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/es": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1664455,
"_n_tokens": 589419,
"_n_chars": 1630297,
"_n_oov_chars": 71856,
"oov_ratio": 0.04407540466553027,
"_oov_charset": "[\"D\", \"“\", \"S\", \"R\", \"\", \"▷\", \"–\", \"¿\", \"\", \"\", \"🙁\", \"😦\", \"\", \"ô\", \"‘\", \"à\", \"W\", \"ñ\", \"…\", \"Á\", \"’\", \"🙂\", \"´\", \"Z\", \"😀\", \"V\", \"―\", \"️\", \"U\", \"”\", \"😉\", \"Ó\", \"J\", \" \", \"ü\", \"ö\", \"H\", \"—\", \"K\", \"N\", \"C\", \"É\", \"ò\", \"á\", \"¡\", \"A\", \"é\", \"Y\", \"è\", \"М\", \"ó\", \"í\", \"M\", \"✓\", \"ú\", \"F\", \"Q\", \"L\", \"Ñ\", \"Ú\", \"I\", \"ª\", \"ý\", \"👏\", \"T\", \"P\", \"O\", \"B\", \"G\", \"\", \"X\", \"Í\", \"E\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/en": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1124813,
"_n_tokens": 429260,
"_n_chars": 1121360,
"_n_oov_chars": 1766,
"oov_ratio": 0.0015748733680530783,
"_oov_charset": "[\"⑦\", \"“\", \"😥\", \"\", \"–\", \"\", \"‘\", \"…\", \"‑\", \"’\", \"ñ\", \"🙂\", \"´\", \"•\", \"⑧\", \"”\", \"😉\", \"®\", \"«\", \"»\", \"£\", \"—\", \"¡\", \"è\", \"é\", \"¦\", \"ï\", \"�\", \"ó\", \"\", \"q\", \"⑤\", \"\", \"⑩\", \"③\", \"\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/zh-Hans": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 2633047,
"_n_tokens": 881138,
"_n_chars": 927311,
"_n_oov_chars": 873395,
"oov_ratio": 0.9418576939128297,
"_oov_charset": "[\"搅\", \"千\", \"太\", \"稻\", \"缕\", \"膨\", \"星\", \"杆\", \"痕\", \"抽\", \"滓\", \"办\", \"淋\", \"址\", \"郊\", \"霸\", \"墟\", \"惹\", \"先\", \"沥\", \"构\", \"徨\", \"恒\", \"著\", \"狈\", \"都\", \"戢\", \"竭\", \"畜\", \"擂\", \"吗\", \"奸\", \"壮\", \"α\", \"伟\", \"东\", \"„\", \"政\", \"蕴\", \"羁\", \"ě\", \"射\", \"q\", \"咏\", \"撒\", \"蕾\", \"窃\", \"倩\", \"劑\", \"腾\", \"突\", \"等\", \"犹\", \"嗯\", \"渺\", \"龚\", \"愤\", \"赚\", \"矮\", \"股\", \"~\", \"知\", \"擦\", \"伪\", \"罕\", \"甚\", \"掏\", \"遢\", \"李\", \"跷\", \"手\", \"簿\", \"赴\", \"者\", \"猴\", \"障\", \"俯\", \"客\", \"擅\", \"程\", \"•\", \"宸\", \"款\", \"褒\", \"腺\", \"续\", \"迈\", \"哄\", \"涌\", \"骸\", \"路\", \"谐\", \"茎\", \"睡\", \"晨\", \"嫁\", \"庞\", \"跻\", \"苹\", \"衰\", \"脾\", \"》\", \"圜\", \"讼\", \"揪\", \"钦\", \"嫉\", \"壹\", \"承\", \"婆\", \"饶\", \"搬\", \"澎\", \"箭\", \"防\", \"几\", \"泛\", \"溪\", \"9\", \"弃\", \"骑\", \"堤\", \"鹃\", \"槌\", \"唇\", \"刃\", \"瑧\", \"捺\", \"铤\", \"鄂\", \"丰\", \"宜\", \"需\", \"阶\", \"懈\", \"戏\", \"妻\", \"踝\", \"冷\", \"睑\", \"昵\", \"眯\", \"薇\", \"闷\", \"晓\", \"冽\", \"像\", \"渥\", \"追\", \"寇\", \"注\", \"怯\", \"烫\", \"怂\", \"矿\", \"〉\", \"轶\", \"咬\", \"【\", \"也\", \"咒\", \"肃\", \"镇\", \"』\", \"独\", \"绩\", \"帅\", \"偌\", \"铜\", \"例\", \"▪\", \"迅\", \"足\", \"悠\", \"守\", \"澄\", \"炖\", \"粹\", \"稳\", \"铺\", \"牡\", \"灌\", \"闯\", \"属\", \"黎\", \"陆\", \"帜\", \"衿\", \"咙\", \"绥\", \"1\", \"如\", \"腻\", \"②\", \"画\", \"堡\", \"猜\", \"凹\", \"抵\", \"祟\", \"纠\", \"逢\", \"〞\", \"蹒\", \"丢\", \"试\", \"诈\", \"弩\", \"鳃\", \"餐\", \"批\", \"遭\", \"叔\", \"观\", \"叶\", \"铨\", \"姬\", \"绰\", \"五\", \"踩\", \"屡\", \"宇\", \"衍\", \"铂\", \"秒\", \"⒌\", \"姜\", \"给\", \"垃\", \"棵\", \"瞳\", \"捂\", \"层\", \"愿\", \"瓦\", \"蒋\", \"位\", \"葵\", \"佰\", \"玖\", \"温\", \"闭\", \"殊\", \"跑\", \"睹\", \"狰\", \"族\", \"肝\", \"铃\", \"暴\", \"尴\", \"饷\", \"桐\", \"胶\", \"臊\", \"尘\", \"裔\", \"肓\", \"阐\", \"赎\", \"落\", \"碱\", \"使\", \"劈\", \"叹\", \"扁\", \"评\", \"险\", \"冶\", \"鲎\", \"悯\", \"痰\", \"女\", \"穷\", \"筹\", \"苯\", \"捆\", \"航\", \"紫\", \"髦\", \"短\", \"郴\", \"挥\", \"嘘\", \"抨\", \"嘉\", \"嚎\", \"烊\", \"挝\", \"美\", \"滢\", \"衫\", \"融\", \"砺\", \"鞭\", \"霹\", \"赋\", \"泸\", \"逍\", \"镕\", \"夕\", \"拇\", \"姓\", \"ズ\", \"�\", \"傲\", \"督\", \"晾\", \"颇\", \"啃\", \"斜\", \"犁\", \"襟\", \"蓦\", \"羡\", \"丘\", \"仗\", \"怨\", \"吠\", \"凛\", \"惊\", \"佐\", \"漓\", \"遴\", \"笨\", \"件\", \"跳\", \"无\", \"\", \"男\", \"摩\", \"秉\", \"莲\", \"绕\", \"孩\", \"汕\", \"魔\", \"驾\", \"啕\", \"旌\", \"炫\", \"蚌\", \"昏\", \"偿\", \"剩\", \"佼\", \"咸\", \"蒿\", \"前\", \"確\", \"旆\", \"泌\", \"菜\", \"摄\", \"格\", \"璀\", \"图\", \"—\", \"勇\", \"憾\", \"诲\", \"销\", \"决\", \"谱\", \"仰\", \"必\", \"侧\", \"赁\", \"诅\", \"授\", \"電\", \"借\", \"臂\", \"消\", \"低\", \"帖\", \"粉\", \"忌\", \"栏\", \"鱼\", \"仍\", \"肘\", \"相\", \"刁\", \"诺\", \"蹲\", \"情\", \"练\", \"父\", \"喝\", \"粥\", \"厮\", \"恣\", \"毒\", \"线\", \"与\", \"祢\", \"辖\", \"朦\", \"狮\", \"伤\", \"增\", \"裂\", \"杂\", \"氧\", \"馆\", \"泊\", \"踹\", \"坡\", \"顷\", \"塘\", \"汀\", \"奈\", \"犰\", \"裙\", \"惴\", \"狞\", \"耶\", \"彬\", \"阵\", \"7\", \"逅\", \"谆\", \"咧\", \"盼\", \"稍\", \"侃\", \"永\", \"食\", \"楂\", \"登\", \"末\", \"漏\", \"涡\", \"匕\", \"歇\", \"蚊\", \"七\", \"夹\", \"胆\", \"誉\", \"俄\", \"趋\", \"汇\", \"泠\", \"肉\", \"盾\", \"扛\", \"墉\", \"碴\", \"闫\", \"苑\", \"噩\", \"记\", \"尚\", \"舶\", \"⑴\", \"滑\", \"方\", \"考\", \"耳\", \"念\", \"捍\", \"鳞\", \"论\", \"徊\", \"砸\", \"零\", \"篇\", \"鞍\", \"疼\", \"弈\", \"抢\", \"君\", \"语\", \"狡\", \"盏\", \"宗\", \"汶\", \"凯\", \"丫\", \"破\", \"师\", \"朱\", \"拣\", \"谓\", \"ç\", \"←\", \"摞\", \"彰\", \"残\", \"山\", \"庄\", \"镶\", \"恿\", \"投\", \"涸\", \"乍\", \"(\", \"疮\", \"信\", \"掠\", \"述\", \"骁\", \"栋\", \"跪\", \"阔\", \"均\", \"褐\", \"瑞\", \"畴\", \"渎\", \"岖\", \"擘\", \"舌\", \"兑\", \"盖\", \"睐\", \"覃\", \"愧\", \"期\", \"瑥\", \"谎\", \"6\", \"皈\", \"滚\", \"×\", \"个\", \"哗\", \"懑\", \"艾\", \"嫖\", \"曰\", \"冲\", \"列\", \"炒\", \"洼\", \"溃\", \"焕\", \"ο\", \"功\", \"快\", \"聘\", \"薛\", \"嫌\", \"津\", \"颊\", \"才\", \"检\", \"皑\", \"莓\", \"藕\", \"徇\", \"剥\", \"裕\", \"笋\", \"敞\", \"原\", \"滞\", \"乞\", \"恤\", \"治\", \"击\", \"憬\", \"涛\", \"瓶\", \"咦\", \"桶\", \"勉\", \"⒁\", \"赠\", \"咎\", \"若\", \"不\", \"迩\", \"聂\", \"钩\", \"濒\", \"t\", \"禾\", \"索\", \"芮\", \"斛\", \"吸\", \"窜\", \"刨\", \"半\", \"齐\", \"娴\", \"”\", \"暖\", \"喊\", \"撑\", \"缩\", \"舱\", \"妤\", \"碟\", \"且\", \"套\", \"俺\", \"聊\", \"乐\", \"缘\", \"咐\", \"扫\", \"戾\", \"沙\", \"酷\", \"沂\", \"劣\", \"雄\", \"黑\", \"俑\", \"霖\", \"譬\", \"皖\", \"殴\", \"措\", \"雯\", \"恐\", \"芭\", \"归\", \"整\", \"始\", \"引\", \"戸\", \"斗\", \"械\", \"瘤\", \"\", \"囚\", \"雁\", \"毯\", \"⒂\", \"3\", \"奥\", \"獗\", \"勋\", \"致\", \"拿\", \"婊\", \"羊\", \"甘\", \"药\", \"坐\", \"醇\", \"禅\", \"崎\", \"屌\", \"聆\", \"蔚\", \"清\", \"璜\", \"否\", \"频\", \"爷\", \"牌\", \"和\", \"彭\", \"扇\", \"搐\", \"室\", \"受\", \"姨\", \"脯\", \"绣\", \"肤\", \"亳\", \"及\", \"兆\", \"猪\", \"肴\", \"瞥\", \"惭\", \"耸\", \"廖\", \"谜\", \"辉\", \"识\", \"债\", \"违\", \"症\", \"穿\", \"薄\", \"灸\", \"断\", \"森\", \"涎\", \"暑\", \"逑\", \"腿\", \"歉\", \"内\", \"]\", \"痘\", \"瀚\", \"喀\", \"陨\", \"岗\", \"册\", \"愉\", \"生\", \"邱\", \"稚\", \"纷\", \"攀\", \"做\", \"年\", \"钰\", \"玮\", \"卦\", \"汝\", \"翰\", \"谭\", \"眉\", \"亿\", \"爰\", \"噴\", \"公\", \"正\", \"悉\", \"鼻\", \"斤\", \"仔\", \"厚\", \"泻\", \"移\", \"灿\", \"璧\", \"蓄\", \"喉\", \"拎\", \"纾\", \"扒\", \"冤\", \"抚\", \"胜\", \"切\", \"陕\", \"得\", \"杖\", \"撼\", \"骨\", \"堪\", \"聪\", \"毎\", \"董\", \"习\", \"常\", \"奏\", \"棚\", \"垢\", \"刑\", \"气\", \"選\", \"溉\", \"炕\", \"霈\", \"〈\", \"框\", \"震\", \"坷\", \"钝\", \"爱\", \"组\", \"学\", \"头\", \"柚\", \"江\", \"艘\", \"桅\", \"眷\", \"恋\", \"員\", \"伊\", \"塑\", \"闵\", \"掳\", \"节\", \"溺\", \"妇\", \"芙\", \"健\", \"询\", \"脊\", \"霾\", \"4\", \"撩\", \"浪\", \"巳\", \"选\", \"诫\", \"鲨\", \"魇\", \"湘\", \"沿\", \";\", \"祭\", \"束\", \"淫\", \"填\", \"铁\", \"韫\", \"奂\", \"雷\", \"馋\", \"己\", \"昭\", \"章\", \"良\", \"赞\", \"」\", \"霭\", \"吐\", \"合\", \"筑\", \"骤\", \"荡\", \"踪\", \"尺\", \"疲\", \"茫\", \"舅\", \"玫\", \"棒\", \"胰\", \"席\", \"顿\", \"驰\", \"腥\", \"涮\", \"阎\", \"颓\", \"窗\", \"参\", \"茱\", \"俞\", \"樟\", \"枉\", \"匈\", \"泥\", \"杉\", \"汐\", \"瞠\", \"诗\", \"枢\", \"流\", \"晶\", \"留\", \"匹\", \"蹭\", \"遛\", \"卓\", \"偷\", \"偻\", \"璃\", \"贡\", \"琴\", \"汤\", \"淼\", \"免\", \"椅\", \"擎\", \"峻\", \"烛\", \"馒\", \"子\", \"技\", \"枝\", \"円\", \"◆\", \"犯\", \"卧\", \"杠\", \"绅\", \"拉\", \"馕\", \"侠\", \"患\", \"妞\", \"占\", \"哭\", \"牠\", \"更\", \"凶\", \"拍\", \"娶\", \"降\", \"蜜\", \"贬\", \"绍\", \"暨\", \"您\", \"磺\", \"菲\", \"俚\", \"噢\", \"海\", \"拭\", \"阑\", \"岌\", \"仙\", \"酸\", \"医\", \"為\", \"⑩\", \"兵\", \"缆\", \"升\", \"采\", \"堕\", \"黩\", \"挡\", \"炼\", \"员\", \"傅\", \"\", \"娃\", \"颌\", \"宠\", \"王\", \"逸\", \"皿\", \"恩\", \"驶\", \"蝌\", \"际\", \"僧\", \"葱\", \"眠\", \"捷\", \"喔\", \"ト\", \"迤\", \"弓\", \"花\", \"害\", \"献\", \"屋\", \"隐\", \"铩\", \"烟\", \"培\", \"角\", \"宪\", \"成\", \"爸\", \"婉\", \"屄\", \"膛\", \"發\", \"鞠\", \"臻\", \"由\", \"逻\", \"挽\", \"锡\", \"攫\", \"炅\", \"癌\", \"铮\", \"谬\", \"岁\", \"娥\", \"砂\", \"琅\", \"涝\", \"芝\", \"祸\", \"[\", \"覆\", \"°\", \"怠\", \"窟\", \"煜\", \"犟\", \"芃\", \"糯\", \"蹊\", \"重\", \"の\", \"萍\", \"招\", \"標\", \"胥\", \"呐\", \"殆\", \"③\", \"缅\", \"蒜\", \"崽\", \"傥\", \"市\", \"飙\", \"绳\", \"愁\", \"阮\", \"亟\", \"坟\", \"诬\", \"掩\", \"仕\", \"疙\", \"获\", \"演\", \"扔\", \"厅\", \"埃\", \"翱\", \"刷\", \"城\", \"篱\", \"鲸\", \"渐\", \"岭\", \"援\", \"光\", \"虐\", \"灑\", \"-\", \"北\", \"楣\", \"却\", \"芯\", \"锣\", \"代\", \"嬉\", \"农\", \"洪\", \"差\", \"处\", \"囤\", \"耀\", \"▲\", \"佣\", \"é\", \"汁\", \"鸭\", \"放\", \"坛\", \"慮\", \"乔\", \"衣\", \"鹕\", \"讷\", \"柔\", \"最\", \"踢\", \"挠\", \"踞\", \"蜀\", \"根\", \"噬\", \"鼯\", \"散\", \"郎\", \"髻\", \"傍\", \"掀\", \"坝\", \"嗲\", \"凄\", \"肾\", \"闸\", \"跃\", \"萦\", \"i\", \"貌\", \"壓\", \"缭\", \"匿\", \"飕\", \"这\", \"监\", \"弹\", \"吨\", \"嘲\", \"样\", \"巫\", \"补\", \"恶\", \"懒\", \"陋\", \"听\", \"俊\", \"黯\", \"亚\", \"尝\", \"淆\", \"焉\", \"煎\", \"骅\", \"衷\", \"钧\", \"棣\", \"似\", \"收\", \"颁\", \"抗\", \"茶\", \"九\", \"锏\", \"铎\", \"翕\", \"爪\", \"链\", \"闺\", \"挪\", \"岔\", \"噱\", \"袍\", \"劝\", \"锁\", \"肌\", \"吁\", \"辰\", \"到\", \"寻\", \"黔\", \"褚\", \"槿\", \"周\", \"究\", \"大\", \"裆\", \"理\", \"嘴\", \"撰\", \"较\", \"积\", \"莉\", \"税\", \"赤\", \"蘑\", \"巅\", \"愈\", \"录\", \"飞\", \"自\", \"瑜\", \"泣\", \"瑰\", \"镐\", \"讽\", \"浮\", \"別\", \"谋\", \"茨\", \"宛\", \"贝\", \"沉\", \"倏\", \"翔\", \"蝶\", \"灼\", \"谦\", \"廊\", \"键\", \"液\", \"旗\", \"辫\", \"六\", \"瓜\", \"色\", \"啬\", \"希\", \"寨\", \"挖\", \"码\", \"他\", \"疹\", \"老\", \"诊\", \"槛\", \"饿\", \"汛\", \"卵\", \"菩\", \"觉\", \"村\", \"蔬\", \"煽\", \"割\", \"绸\", \"鸿\", \"豚\", \"螃\", \"日\", \"贯\", \"侦\", \"堵\", \"亭\", \"符\", \"座\", \"旧\", \"醛\", \"內\", \"5\", \"拂\", \"菌\", \"遏\", \"随\", \"刹\", \"怜\", \"嘣\", \"膊\", \"滥\", \"涣\", \"吧\", \"庆\", \"圩\", \"魏\", \"骏\", \"未\", \"派\", \"辙\", \"坤\", \"攒\", \"漉\", \"珉\", \"炮\", \"寐\", \"掺\", \"秩\", \"乃\", \"韦\", \"峭\", \"桓\", \"町\", \"哪\", \"满\", \"唤\", \"洽\", \"钮\", \"卿\", \"咖\", \"姚\", \"渤\", \"汪\", \"悟\", \"報\", \"吵\", \"窿\", \"御\", \"弛\", \"凤\", \"狗\", \"蹈\", \"ς\", \"琉\", \"畑\", \"速\", \"块\", \"讦\", \"容\", \"漪\", \"宵\", \"察\", \"『\", \"躯\", \"诱\", \"弑\", \"猛\", \"社\", \"泼\", \"渝\", \"阽\", \"帝\", \"戍\", \"黏\", \"中\", \"剁\", \"峰\", \"罪\", \"宴\", \"杀\", \"把\", \"拢\", \"皱\", \"兹\", \"街\", \"渗\", \"指\", \"颖\", \"刊\", \"狭\", \"─\", \"逮\", \"榴\", \"疴\", \"酱\", \"厘\", \"①\", \"插\", \"烬\", \"纨\", \"略\", \"r\", \"资\", \"省\", \"函\", \"噌\", \"而\", \"奶\", \"茧\", \"強\", \"拓\", \"彤\", \"恕\", \"坦\", \"约\", \"蒸\", \"竺\", \"吩\", \"笆\", \"烁\", \"烷\", \"跤\", \"揣\", \"簇\", \"鹭\", \"撬\", \"娅\", \"滨\", \"勖\", \"钜\", \"庸\", \"洋\", \"沦\", \"哉\", \"卜\", \"雇\", \"础\", \"棉\", \"婚\", \"尾\", \"陶\", \"规\", \"邻\", \"适\", \"瞻\", \"静\", \"排\", \"盯\", \"联\", \"膀\", \"霜\", \"榨\", \"次\", \"镜\", \"忘\", \"胞\", \"璇\", \"疸\", \"球\", \"贴\", \"蛔\", \"庐\", \"谑\", \"践\", \"抖\", \"混\", \"栽\", \"寥\", \"吏\", \"恙\", \"鼠\", \"拔\", \"郁\", \"谷\", \"庭\", \"书\", \"兰\", \"亡\", \"炳\", \"滋\", \"柏\", \"战\", \"澜\", \"史\", \"金\", \"欢\", \"钱\", \"摘\", \"溢\", \"吴\", \"陀\", \"熔\", \"聒\", \"扬\", \"趾\", \"婶\", \"挺\", \"姣\", \"态\", \"绘\", \"烹\", \"V\", \"季\", \"恪\", \"矢\", \"舰\", \"熄\", \"厉\", \"狐\", \"偏\", \"耻\", \"蔷\", \"择\", \"暇\", \"数\", \"激\", \"诵\", \"徘\", \"呵\", \"罹\", \"饰\", \"秘\", \"腑\", \"礼\", \"瓣\", \"宣\", \"懂\", \"耽\", \"徳\", \"量\", \"依\", \"疯\", \"篮\", \"痹\", \"柘\", \"呷\", \"科\", \"讲\", \"舐\", \"莺\", \"朽\", \"讳\", \"结\", \"翩\", \"牺\", \"智\", \"虎\", \"權\", \"伦\", \"漫\", \"候\", \"拱\", \"珠\", \"舵\", \"签\", \"倜\", \"髓\", \"沾\", \"湿\", \"蓁\", \"厨\", \"咽\", \"躁\", \"茸\", \"点\", \"卤\", \"勘\", \"锌\", \"攥\", \"详\", \"瑕\", \"蛊\", \"巡\", \"桌\", \"嘱\", \"摧\", \"西\", \"池\", \"浠\", \"稠\", \"号\", \"判\", \"难\", \"哦\", \"欺\", \"霍\", \"谔\", \"腔\", \"撷\", \"虏\", \"蚀\", \"⑧\", \"夭\", \"瀛\", \"屏\", \"翊\", \"敝\", \"漩\", \"礁\", \"箍\", \"在\", \"铝\", \"邸\", \"辨\", \"漆\", \"秋\", \"蹿\", \"鹑\", \"動\", \"玻\", \"轿\", \"抛\", \"央\", \"啐\", \"沃\", \"谧\", \"寰\", \"坊\", \"哲\", \"夺\", \"罚\", \"古\", \"概\", \"纹\", \"巩\", \"秃\", \"胧\", \"惜\", \"凸\", \"殖\", \"艇\", \"烦\", \",\", \"诨\", \"渍\", \"剧\", \"浸\", \"关\", \"丐\", \"坞\", \"壁\", \"曼\", \"看\", \"斌\", \"跋\", \"沸\", \"槃\", \"畿\", \"瘦\", \"彙\", \"燃\", \"後\", \"用\", \"纵\", \"严\", \"夸\", \"。\", \"寅\", \"帕\", \"贱\", \"徽\", \"玷\", \"倒\", \"冥\", \"厂\", \"邓\", \"纬\", \"迭\", \"幽\", \"荫\", \"τ\", \"弟\", \"霆\", \"崔\", \"绊\", \"硅\", \"撇\", \"橇\", \"呦\", \"嚣\", \"飓\", \"姆\", \"耦\", \"摔\", \"粱\", \"裴\", \"茂\", \"绚\", \"遣\", \"赵\", \"⒃\", \"基\", \"妖\", \"“\", \"旅\", \"群\", \"驳\", \"挟\", \"第\", \"剔\", \"洁\", \"篝\", \"浩\", \"沐\", \"皂\", \"豪\", \"瞪\", \"啜\", \"溅\", \"雨\", \"居\", \"趣\", \"棘\", \"眶\", \"但\", \"・\", \"拳\", \"舞\", \"糖\", \"莎\", \"澳\", \"媚\", \"伴\", \"幸\", \"聿\", \"火\", \"挨\", \"锚\", \"两\", \"配\", \"砾\", \"枚\", \"蓉\", \"你\", \"找\", \"通\", \"渡\", \"芳\", \"帐\", \"唉\", \"微\", \"酿\", \"旬\", \"宾\", \"婴\", \"皇\", \"姗\", \"待\", \"后\", \"A\", \"嘈\", \"厌\", \"谈\", \"\\u0005\", \"亮\", \"豁\", \"呕\", \"滇\", \"孱\", \"疗\", \"望\", \"斧\", \"僚\", \"袱\", \"&\", \"沏\", \"圈\", \"戚\", \"以\", \"蕉\", \"荧\", \"骼\", \"催\", \"撐\", \"刮\", \"時\", \"斩\", \"窦\", \"哺\", \"纂\", \"呼\", \"非\", \"秤\", \"迄\", \"协\", \"灶\", \"肚\", \"蒙\", \"鸦\", \"→\", \"汹\", \"橱\", \"伙\", \"助\", \"躲\", \"率\", \"卸\", \"蘸\", \"叨\", \"维\", \"了\", \"机\", \"赖\", \"橄\", \"乳\", \"趴\", \"孰\", \"飘\", \"粟\", \"认\", \"右\", \"媲\", \"亥\", \"_\", \"盗\", \"屠\", \"掖\", \"床\", \"锋\", \"辆\", \"暧\", \"昨\", \"味\", \"盎\", \"凿\", \"累\", \"據\", \"蜃\", \"临\", \"寿\", \"瑨\", \"喆\", \"益\", \"冬\", \"鹿\", \"辣\", \"吝\", \"溯\", \"雀\", \"奢\", \"粕\", \"尧\", \"外\", \"魁\", \"聚\", \"豫\", \"酋\", \"责\", \"货\", \"田\", \"崩\", \"裹\", \"翅\", \"肆\", \"忙\", \"挫\", \"毅\", \"茏\", \"嗓\", \"●\", \"目\", \"妙\", \"炊\", \"砌\", \"准\", \"焯\", \"戛\", \"艋\", \"峥\", \"揍\", \"台\", \"唯\", \"呢\", \"杰\", \"鼓\", \"早\", \"黝\", \"娜\", \"乾\", \"萎\", \"藏\", \"铲\", \"郭\", \"洛\", \"甲\", \"乏\", \"丑\", \"敦\", \"哇\", \" \", \"涕\", \"丙\", \"呻\", \"肢\", \"蛙\", \"柴\", \"世\", \"脱\", \"脚\", \"鞋\", \"氏\", \"叼\", \"抿\", \"汉\", \"纱\", \"兔\", \"歌\", \"弯\", \"偎\", \"π\", \"涤\", \"伏\", \"麾\", \"椭\", \"血\", \"鬼\", \"热\", \"臧\", \"溜\", \"扉\", \"嘎\", \"猩\", \"璎\", \"螺\", \"净\", \"憔\", \"焙\", \"疑\", \"剪\", \"缜\", \"显\", \"埂\", \"票\", \"骆\", \"夏\", \"孝\", \"任\", \"户\", \"棂\", \"肥\", \"谩\", \"干\", \"她\", \"※\", \"蝉\", \"濮\", \"班\", \"苗\", \"好\", \"℃\", \"乡\", \"绉\", \"萝\", \"初\", \"拥\", \"堂\", \"肿\", \"执\", \"萄\", \"久\", \"荤\", \"载\", \"刀\", \"醒\", \"幻\", \"诣\", \"连\", \"俩\", \"英\", \"胀\", \"茉\", \"即\", \"於\", \"岛\", \"名\", \"值\", \"嗜\", \"偶\", \"建\", \"沁\", \"绑\", \"勃\", \"搂\", \"屈\", \"麟\", \"韧\", \"叫\", \"卉\", \"钵\", \"牵\", \"喷\", \"躺\", \"便\", \"歹\", \"贤\", \"î\", \"籁\", \"测\", \"讯\", \"壤\", \"化\", \"赔\", \"延\", \"奔\", \"神\", \"滴\", \"琛\", \"戴\", \"队\", \"空\", \"券\", \"宿\", \"婺\", \"人\", \"颈\", \"匠\", \"孔\", \"请\", \"滕\", \"娼\", \"粮\", \"奎\", \"缓\", \"争\", \"没\", \"瞧\", \"吮\", \"端\", \"籍\", \"锐\", \"乙\", \"颉\", \"嘀\", \"沧\", \"仲\", \"湃\", \"绎\", \"岳\", \"寞\", \"倚\", \"惶\", \"拒\", \"有\", \"h\", \"地\", \"携\", \"预\", \"/\", \"株\", \"振\", \"月\", \"颜\", \"醍\", \"蜕\", \"侯\", \"慨\", \"洲\", \"拨\", \"揖\", \"イ\", \"蜒\", \"别\", \"椎\", \"顽\", \"靴\", \"慷\", \"阁\", \"场\", \"贫\", \"詹\", \"剖\", \"匀\", \"壑\", \"陛\", \"攘\", \"疤\", \"灯\", \"邕\", \"皙\", \"袁\", \"兮\", \"览\", \"济\", \"矣\", \"糊\", \"总\", \"鄯\", \"过\", \"愕\", \"珍\", \"坏\", \"橡\", \"讥\", \"摇\", \"盐\", \"梭\", \"钟\", \"赛\", \"洗\", \"锲\", \"性\", \"彻\", \"辩\", \"箱\", \"音\", \"窒\", \"牲\", \"案\", \"酝\", \"瘾\", \"实\", \"店\", \"贵\", \"惦\", \"甜\", \"波\", \"经\", \"寓\", \"比\", \"嘻\", \"莅\", \"%\", \"鸽\", \"–\", \"侬\", \"斥\", \"浊\", \"彗\", \"钢\", \"爵\", \"苇\", \"律\", \"朔\", \"番\", \"鹤\", \"馨\", \"潜\", \"架\", \"冯\", \"影\", \"林\", \"奘\", \"涉\", \"啼\", \"棍\", \"威\", \"柑\", \"翁\", \"淳\", \"扰\", \"明\", \"段\", \"廉\", \"氢\", \"颤\", \"作\", \"荒\", \"应\", \"榆\", \"悦\", \"淑\", \"趁\", \"谨\", \"穆\", \"痪\", \"漠\", \"渣\", \"腹\", \"提\", \"僻\", \"页\", \"斯\", \"匆\", \"驮\", \"菱\", \"综\", \"碍\", \"妨\", \"爆\", \"职\", \"睿\", \"槽\", \"闲\", \"巨\", \"昊\", \"界\", \"平\", \"肯\", \"镀\", \"惩\", \"病\", \"拖\", \"纰\", \"肺\", \"舀\", \"姐\", \"挂\", \"掘\", \"熟\", \"柯\", \"假\", \"阴\", \"捅\", \"涟\", \"姥\", \"腋\", \"矗\", \"一\", \"俪\", \"葩\", \"虔\", \"息\", \"孪\", \"渠\", \"繁\", \"石\", \"浴\", \"臀\", \"豹\", \"夥\", \"擀\", \"梗\", \"言\", \"厦\", \"伐\", \"雌\", \"剑\", \"钥\", \"垄\", \"旁\", \"畔\", \"栖\", \"托\", \"拽\", \"袜\", \"艺\", \"堰\", \"拟\", \"般\", \"冒\", \"辽\", \"秦\", \"虑\", \"圆\", \"孙\", \"道\", \"蝗\", \"川\", \"酵\", \"县\", \"窥\", \"婪\", \"羞\", \"+\", \"盲\", \"绪\", \"鼾\", \"沫\", \"讶\", \"搭\", \"楚\", \"嗣\", \"蚓\", \"旱\", \"忐\", \"潘\", \"ヨ\", \"镭\", \"划\", \"’\", \"觅\", \"郡\", \"屎\", \"倘\", \"牢\", \"弘\", \"絮\", \"定\", \"龇\", \"悔\", \"褪\", \"恰\", \"伯\", \"辞\", \"泉\", \"陡\", \"烯\", \"笛\", \"辕\", \"p\", \"媒\", \"侣\", \"宏\", \"剂\", \"锥\", \"附\", \"⑨\", \"\", \"确\", \"雏\", \"惋\", \"弱\", \"宽\", \"握\", \"瘫\", \"恨\", \"贼\", \"噪\", \"Ø\", \"晒\", \"保\", \"兢\", \"蹄\", \"教\", \"管\", \"编\", \"摸\", \"涂\", \"荏\", \"仇\", \"枷\", \"★\", \"畏\", \"勿\", \"埠\", \"近\", \"锻\", \"泱\", \"栈\", \"慑\", \"秸\", \"倨\", \"爹\", \"愚\", \"鹉\", \"剽\", \"质\", \"咯\", \"邪\", \"仁\", \"⒀\", \"盆\", \"须\", \"荟\", \"牧\", \"梦\", \"阀\", \"文\", \"查\", \"操\", \"勒\", \"背\", \"拼\", \"倡\", \"左\", \"奋\", \"岑\", \"遮\", \"锢\", \"垠\", \"脑\", \"褂\", \"蜘\", \"伉\", \"酪\", \"深\", \"权\", \"萌\", \"坪\", \"谁\", \"沽\", \"钞\", \"甫\", \"痒\", \"邢\", \"竹\", \"浙\", \"全\", \"葡\", \"度\", \"佟\", \"煮\", \"0\", \"虹\", \"忆\", \"砖\", \"賣\", \"氰\", \"野\", \"告\", \"渴\", \"抬\", \"坠\", \"淄\", \"庙\", \"绛\", \"寸\", \"薰\", \"型\", \"盟\", \"卷\", \"逊\", \"咕\", \"帘\", \"贩\", \"童\", \"曳\", \"遗\", \"敬\", \"于\", \"呀\", \"宫\", \"啤\", \"赶\", \"耘\", \"捧\", \"邬\", \"峨\", \"佳\", \"崖\", \"署\", \"舎\", \"针\", \"惚\", \"蕤\", \"印\", \"撞\", \"德\", \"儒\", \"挑\", \"硬\", \"烧\", \"装\", \"茜\", \"碑\", \"儿\", \"诧\", \"肪\", \"因\", \"据\", \"螂\", \"糠\", \"惰\", \"埋\", \"价\", \"瞎\", \"叛\", \"捕\", \"遍\", \"卑\", \"为\", \"毡\", \"吉\", \"嚼\", \"癜\", \"抒\", \"俱\", \"声\", \"润\", \"局\", \"韩\", \"袋\", \"蜡\", \"叠\", \"刚\", \"然\", \"莴\", \"尸\", \"甩\", \"恼\", \"徙\", \"憋\", \"捏\", \"】\", \"苒\", \"真\", \"妃\", \"咱\", \"芋\", \"檬\", \"鳗\", \"抉\", \"越\", \"抹\", \"倾\", \"仑\", \"冻\", \"校\", \"欣\", \"遇\", \"扎\", \"院\", \"缈\", \"厥\", \"晰\", \"粘\", \"噶\", \"隋\", \"玄\", \"返\", \"藐\", \"咪\", \"菁\", \"巢\", \"麽\", \"羚\", \"喇\", \"肇\", \"夜\", \"阪\", \"號\", \"卖\", \"逝\", \"骛\", \"弗\", \"奴\", \"\", \"夫\", \"惑\", \"红\", \"畸\", \"萃\", \"站\", \"圭\", \"广\", \"膏\", \"盈\", \"循\", \"陇\", \"熏\", \"揽\", \"牒\", \"岸\", \"吻\", \"穹\", \"稽\", \"郑\", \"迫\", \"魅\", \")\", \"奖\", \"祥\", \"瘩\", \"昂\", \"脆\", \"玉\", \"冉\", \"喜\", \"对\", \"遐\", \"睫\", \"廷\", \"可\", \"挤\", \"露\", \"诡\", \"很\", \"答\", \"梁\", \"壶\", \"鸠\", \"河\", \"匾\", \"细\", \"缝\", \"懵\", \"喧\", \"蓟\", \"萼\", \"淘\", \"终\", \"梵\", \"靠\", \"臣\", \"吱\", \"豌\", \"嘤\", \"嵘\", \"立\", \"秀\", \"醐\", \"猫\", \"罩\", \"分\", \"灾\", \"骗\", \"庇\", \"泡\", \"潦\", \"策\", \"烙\", \"翠\", \"阿\", \"猥\", \"苛\", \"描\", \"锂\", \"唏\", \"シ\", \"怪\", \"此\", \"竿\", \"高\", \"芷\", \"卢\", \"捉\", \"缄\", \"靶\", \"档\", \"丹\", \"订\", \"脉\", \"慌\", \"叩\", \"呸\", \"慎\", \"慰\", \"绞\", \"菊\", \"·\", \"淖\", \"驿\", \"犬\", \"购\", \"寒\", \"瘀\", \"碰\", \"砧\", \"酣\", \"湾\", \"圣\", \"馄\", \"甯\", \"汗\", \"狠\", \"⑸\", \"C\", \"凝\", \"帽\", \"擤\", \"尔\", \"翼\", \"祝\", \"黧\", \"翡\", \"至\", \"的\", \"辛\", \"薯\", \"嗦\", \"极\", \"魂\", \"桥\", \"服\", \"邹\", \"妄\", \"旷\", \"瑟\", \"雳\", \"盘\", \"苦\", \"秆\", \"饨\", \"审\", \"⑥\", \"矫\", \"嗨\", \"钻\", \"时\", \"昕\", \"暮\", \"掉\", \"所\", \"耿\", \"扣\", \"辱\", \"劾\", \"减\", \"侈\", \"志\", \"俭\", \"?\", \"逆\", \"运\", \"瞟\", \"婷\", \"房\", \"竟\", \"验\", \"骂\", \"芦\", \"饱\", \"播\", \"嗅\", \"桔\", \"域\", \"钉\", \"伫\", \"嚷\", \"蟀\", \"晚\", \"溘\", \"阅\", \"玛\", \"巾\", \"吟\", \"掐\", \"荼\", \"楔\", \"畅\", \"瞒\", \"萨\", \"矩\", \"柠\", \"宅\", \"熙\", \"泾\", \"训\", \"荆\", \"黢\", \"同\", \"爬\", \"裘\", \"熨\", \"坂\", \"併\", \"欧\", \"粒\", \"它\", \"惯\", \"喃\", \"○\", \"脸\", \"晤\", \"粽\", \"焦\", \"疆\", \"晴\", \"寄\", \"痫\", \"锈\", \"轻\", \"牟\", \"遂\", \"篡\", \"戒\", \"稀\", \"貂\", \"・\", \"亩\", \"遥\", \"屯\", \"隔\", \"磋\", \"祀\", \"\\u0006\", \"扭\", \"敏\", \"肩\", \"棠\", \"超\", \"霉\", \"园\", \"坚\", \"顾\", \"伍\", \"固\", \"裁\", \"哧\", \"算\", \"匮\", \"欸\", \"臃\", \"碌\", \"梢\", \"百\", \"憧\", \"疚\", \"韪\", \"专\", \"船\", \"刘\", \"苣\", \"困\", \"橘\", \"腓\", \"搏\", \"巴\", \"输\", \"募\", \"耕\", \"醋\", \"奚\", \"徒\", \"纽\", \"介\", \"物\", \"级\", \"享\", \"辈\", \"鸟\", \"敷\", \"布\", \"酥\", \"拐\", \"個\", \"■\", \"词\", \"朝\", \"仅\", \"昧\", \"赏\", \"啊\", \"欲\", \"伺\", \"交\", \"活\", \"胱\", \"惫\", \"单\", \"妒\", \"张\", \"煞\", \"帷\", \"琳\", \"瓷\", \"底\", \"侥\", \"臆\", \"芬\", \"养\", \"葫\", \"彷\", \"篓\", \"特\", \"身\", \"倪\", \"烃\", \"汰\", \"歧\", \"靛\", \"充\", \"围\", \"誓\", \"筝\", \"回\", \"私\", \"娄\", \"烂\", \"则\", \"仓\", \"式\", \"鹰\", \"坎\", \"瑑\", \"狸\", \"炭\", \"胖\", \"沛\", \"报\", \"メ\", \"晖\", \"拜\", \"琢\", \"映\", \"肛\", \"咀\", \"毕\", \"余\", \"摆\", \"赃\", \"狄\", \"响\", \"へ\", \"继\", \"腕\", \"区\", \"惧\", \"再\", \"毁\", \"役\", \"茄\", \"奇\", \"万\", \"甸\", \"莹\", \"状\", \"思\", \"棕\", \"折\", \"蚤\", \"釜\", \"克\", \"乓\", \"荻\", \"虾\", \"冰\", \"骰\", \"置\", \"尼\", \"筋\", \"哮\", \"课\", \"缚\", \"门\", \"诸\", \"勤\", \"储\", \"诙\", \"党\", \"沟\", \"猝\", \"令\", \"尊\", \"姑\", \"簧\", \"疾\", \"柿\", \"慧\", \"楼\", \"仿\", \"喂\", \"8\", \"新\", \"恍\", \"羹\", \"缥\", \"d\", \"喻\", \"浏\", \"恺\", \"账\", \"薩\", \"三\", \"瀑\", \"惘\", \"艳\", \"饭\", \"蓝\", \"持\", \"腊\", \"坯\", \"窖\", \"贸\", \"称\", \"葆\", \"幅\", \"辗\", \"奉\", \"岂\", \"〖\", \"汩\", \"門\", \"吹\", \"壕\", \"游\", \"苟\", \"揉\", \"财\", \"午\", \"柜\", \"兜\", \"辅\", \"访\", \"贺\", \"举\", \"屿\", \"动\", \"亲\", \"顺\", \"饥\", \"宙\", \"栅\", \"艰\", \"迟\", \"炬\", \"〔\", \"赂\", \"孕\", \"靖\", \"替\", \"罄\", \"限\", \"途\", \"懦\", \"会\", \"读\", \"源\", \"巷\", \"下\", \"轰\", \"府\", \"照\", \"怡\", \"癫\", \"走\", \"鞘\", \"缉\", \"呛\", \"衅\", \"囊\", \"起\", \"隆\", \"筛\", \"à\", \"迹\", \"啪\", \"氛\", \"兴\", \"損\", \"镏\", \"鲤\", \"毛\", \"哑\", \"淤\", \"磊\", \"痊\", \"劳\", \"託\", \"剿\", \"翻\", \"浚\", \"衡\", \"贷\", \"瘙\", \"母\", \"颗\", \"谀\", \"妍\", \"推\", \"粪\", \"除\", \"贪\", \"挈\", \"昔\", \"拷\", \"勾\", \"鑫\", \"白\", \"镉\", \"⑶\", \"竖\", \"旋\", \"鲍\", \"够\", \"罗\", \"掌\", \"矶\", \"舟\", \"披\", \"犷\", \"凌\", \"罐\", \"寺\", \"跌\", \"瞩\", \"幕\", \"家\", \"启\", \"妹\", \"转\", \"努\", \"蟹\", \"挎\", \"纸\", \"嘟\", \"嗪\", \"嗤\", \"忑\", \"孜\", \"事\", \"婿\", \"旳\", \"杯\", \"尿\", \"斐\", \"墨\", \"浆\", \"佬\", \"铣\", \"弊\", \"送\", \"要\", \"狙\", \"福\", \"珊\", \"拯\", \"丛\", \"瞅\", \"体\", \"傻\", \" \", \"蛇\", \"敖\", \"狳\", \"删\", \"榷\", \"绒\", \"镑\", \"发\", \"蹦\", \"呃\", \"\\u0007\", \"枣\", \"素\", \"網\", \"桃\", \""\", \"寝\", \"只\", \"淮\", \"愣\", \"苏\", \"饵\", \"土\", \"舆\", \"风\", \"颂\", \"哥\", \"乌\", \"佘\", \"朴\", \"晃\", \"抑\", \"利\", \"抄\", \"泪\", \"休\", \"湮\", \"陪\", \"递\", \"垣\", \"泵\", \"蕃\", \"崛\", \"存\", \"淹\", \"悚\", \"厕\", \"丸\", \"已\", \"扑\", \"截\", \"缺\", \"亵\", \"踱\", \"紧\", \"产\", \"疫\", \"癖\", \"雾\", \"漂\", \"ノ\", \"肠\", \"惨\", \"押\", \"殉\", \"项\", \"厝\", \"修\", \"熊\", \"當\", \"话\", \"桑\", \"系\", \"惟\", \"锄\", \"互\", \"某\", \"许\", \"狂\", \"蒂\", \"竣\", \"樱\", \"计\", \"\", \"珀\", \"盛\", \"份\", \"扶\", \"硕\", \"酒\", \"睬\", \"栓\", \"耗\", \"宁\", \"官\", \"接\", \"触\", \"桩\", \"娩\", \"瑢\", \"感\", \"银\", \"写\", \"贞\", \"裤\", \"缴\", \"炉\", \"勺\", \"《\", \"着\", \"额\", \"弥\", \"澈\", \"井\", \"藤\", \"副\", \"攻\", \"碧\", \"磅\", \"诀\", \"胸\", \"矍\", \"藉\", \"跚\", \"沓\", \"卡\", \"包\", \"榜\", \"南\", \"压\", \"达\", \"珞\", \"蜴\", \"就\", \"取\", \"哟\", \"谣\", \"兽\", \"爽\", \"膜\", \"轨\", \"浅\", \"稿\", \"á\", \"冀\", \"避\", \"仄\", \"领\", \"彦\", \"茁\", \"嫩\", \"硫\", \"⑤\", \"搁\", \"锤\", \"夯\", \"脂\", \"糟\", \"晕\", \"猖\", \"穰\", \"鄙\", \"瞄\", \"吭\", \"或\", \"武\", \"↑\", \"讨\", \"袭\", \"逼\", \"效\", \"葬\", \"忡\", \"救\", \"反\", \"邃\", \"辐\", \"意\", \"铸\", \"统\", \"涵\", \"驭\", \"狼\", \"淞\", \"穴\", \"凰\", \"靓\", \"丈\", \"狱\", \"诉\", \"付\", \"棺\", \"捡\", \"窝\", \"怕\", \"材\", \"忧\", \"赡\", \"骇\", \"蹴\", \"铛\", \"强\", \"共\", \"炸\", \"怎\", \"豆\", \"摊\", \"笔\", \"稣\", \"误\", \"搀\", \"贿\", \"煤\", \"挣\", \"少\", \"抱\", \"蜷\", \"甄\", \"伞\", \"阂\", \"怀\", \"塞\", \"京\", \"烘\", \"郝\", \"氨\", \"尹\", \"姿\", \"蔼\", \"驱\", \"被\", \"纤\", \"削\", \"镳\", \"晟\", \"迦\", \"护\", \"屑\", \"邀\", \"榄\", \"赫\", \"姊\", \"拦\", \"些\", \"!\", \"瑄\", \"去\", \"栾\", \"悲\", \"烈\", \"犄\", \"酬\", \"屣\", \"©\", \"网\", \"步\", \"〕\", \"阳\", \"小\", \"資\", \"另\", \"卍\", \"尽\", \"琪\", \"朵\", \"黛\", \"惠\", \"\\u0000\", \"诚\", \"羽\", \"么\", \"横\", \"榭\", \"吞\", \"叙\", \"旨\", \"遑\", \"ソ\", \"邂\", \"元\", \"佩\", \"轮\", \"牛\", \"侍\", \"咚\", \"霄\", \"纪\", \"岚\", \"亂\", \"祉\", \"琶\", \"脖\", \"瞬\", \"司\", \"漲\", \"\", \"梳\", \"咋\", \"炝\", \"「\", \"骚\", \"磨\", \"隙\", \"痴\", \"间\", \"品\", \"眩\", \"溶\", \"彪\", \"废\", \"标\", \"殿\", \"煌\", \"腱\", \"耍\", \"杏\", \"觑\", \"啥\", \"谍\", \"澡\", \"是\", \"胺\", \"斋\", \"二\", \"禁\", \"召\", \"邵\", \"届\", \"篷\", \"胃\", \"其\", \"暗\", \"悄\", \"予\", \"康\", \"纲\", \"绷\", \"榻\", \"呈\", \"虞\", \"哒\", \"侄\", \"辟\", \"侵\", \"舔\", \"荨\", \"曝\", \"潭\", \"绿\", \"泰\", \"租\", \"契\", \"那\", \"鳌\", \"邋\", \"燥\", \"行\", \"碾\", \"宰\", \"禧\", \"坑\", \"拾\", \"币\", \"ù\", \"楷\", \"⑦\", \"叉\", \"舒\", \"调\", \"仪\", \"句\", \"纳\", \"译\", \"萤\", \"喱\", \"渊\", \"戈\", \"阜\", \"梯\", \"鹅\", \"焚\", \"吓\", \"损\", \"眺\", \"潇\", \"拧\", \"侮\", \"善\", \"曾\", \"核\", \"失\", \"氯\", \"议\", \"首\", \"筷\", \"曙\", \"磁\", \"淌\", \"兄\", \"诠\", \"鸥\", \"2\", \"何\", \"琦\", \"鬣\", \"离\", \"腰\", \"敲\", \"氮\", \"博\", \"普\", \"务\", \"荷\", \"渔\", \"薪\", \"拌\", \"慈\", \"我\", \"竞\", \"歩\", \"馏\", \"命\", \"从\", \"娇\", \"伽\", \"鲁\", \"枕\", \"芹\", \"翌\", \"集\", \"椒\", \"闹\", \"堆\", \"版\", \"警\", \"垂\", \"廓\", \"绝\", \"育\", \"含\", \"霊\", \"靡\", \"旭\", \"圾\", \"口\", \"孵\", \"娟\", \"谊\", \"躇\", \"忪\", \"委\", \"慢\", \"轴\", \"甬\", \"妈\", \"题\", \"富\", \"商\", \"戮\", \"痛\", \"军\", \"蠢\", \"备\", \"逛\", \"玳\", \"缔\", \"直\", \"棋\", \"鹈\", \"札\", \"虱\", \"妮\", \"迷\", \"米\", \"啡\", \"碗\", \"况\", \"楞\", \"罔\", \"禄\", \"扯\", \"制\", \"踵\", \"扪\", \"友\", \"垫\", \"向\", \"境\", \"顶\", \"罢\", \"麓\", \"诶\", \"〗\", \"故\", \"嘿\", \"毋\", \"透\", \"菇\", \"椰\", \"让\", \"沼\", \"岐\", \"蔑\", \"魄\", \"凳\", \"涅\", \"具\", \"‘\", \"展\", \"蹩\", \"恢\", \"妓\", \"舍\", \"心\", \"碳\", \"探\", \"忿\", \"垛\", \"鼎\", \"业\", \"买\", \"赅\", \"搜\", \"蛋\", \"娠\", \"馍\", \"盹\", \"瑒\", \"喽\", \"a\", \"见\", \"岱\", \"锯\", \"灭\", \"雍\", \"④\", \"遵\", \"槐\", \"树\", \"⑿\", \"逾\", \"涨\", \"退\", \"刻\", \"匙\", \"错\", \"迁\", \":\", \"臭\", \"檀\", \"亨\", \"芒\", \"媳\", \"腭\", \"能\", \"赐\", \"倦\", \"皮\", \"叮\", \"优\", \"丽\", \"麻\", \"类\", \"轩\", \"还\", \"祈\", \"滔\", \"矛\", \"芥\", \"扮\", \"蚪\", \"拆\", \"赌\", \"履\", \"窘\", \"圳\", \"熬\", \"熹\", \"串\", \"踊\", \"莱\", \"睛\", \"聋\", \"忍\", \"四\", \"鸩\", \"礴\", \"汲\", \"湄\", \"面\", \"缀\", \"笃\", \"娘\", \"赣\", \"浑\", \"耩\", \"俏\", \"马\", \"凋\", \"滩\", \"们\", \"醉\", \"啸\", \"姻\", \"帆\", \"序\", \"想\", \"庚\", \"鲱\", \"摹\", \"龄\", \"挲\", \"孤\", \"馈\", \"嗔\", \"劲\", \"遁\", \"呆\", \"璨\", \"变\", \"谅\", \"戳\", \"腐\", \"虚\", \"隧\", \"焊\", \"创\", \"淇\", \"蚯\", \"鹌\", \"侨\", \"诩\", \"岩\", \"恳\", \"法\", \"碎\", \"淡\", \"掂\", \"允\", \"料\", \"尤\", \"曲\", \"敢\", \"忱\", \"幼\", \"掰\", \"樯\", \"窄\", \"来\", \"淀\", \"换\", \"祛\", \"凑\", \"喘\", \"急\", \"蚁\", \"―\", \"妆\", \"恭\", \"眼\", \"吕\", \"s\", \"鹜\", \"瓢\", \"施\", \"琼\", \"»\", \"解\", \"悖\", \"篢\", \"齿\", \"字\", \"尉\", \"佝\", \"匪\", \"哨\", \"讪\", \"叭\", \"幢\", \"易\", \"拗\", \"唆\", \"胎\", \"悼\", \"涩\", \"墒\", \"示\", \"粤\", \"祷\", \"耙\", \"疵\", \"雪\", \"妊\", \"锦\", \"踏\", \"擞\", \"嵌\", \"厄\", \"封\", \"什\", \"撅\", \"将\", \"萧\", \"柳\", \"铄\", \"呗\", \"娛\", \"砥\", \"洞\", \"设\", \"青\", \"冠\", \"俨\", \"帮\", \"歪\", \"密\", \"莘\", \"笑\", \"黄\", \"旦\", \"嘭\", \"洒\", \"浇\", \"N\", \"春\", \"卫\", \"镍\", \"搞\", \"茵\", \"昌\", \"霞\", \"暹\", \"吆\", \"狩\", \"噼\", \"龟\", \"砍\", \"停\", \"求\", \"肋\", \"鹏\", \"丧\", \"片\", \"潢\", \"沮\", \"形\", \"咨\", \"捞\", \"飚\", \"钊\", \"贾\", \"义\", \"电\", \"扳\", \"冈\", \"暄\", \"蛮\", \"瑶\", \"蝇\", \"驴\", \"捐\", \"燕\", \"牙\", \"亏\", \"企\", \"兼\", \"攸\", \"雅\", \"鸡\", \"拙\", \"懊\", \"煲\", \"疏\", \"泽\", \"楠\", \"蓬\", \"沪\", \"车\", \"骄\", \"抡\", \"岣\", \"胡\", \"添\", \"按\", \"鉴\", \"简\", \"炙\", \"织\", \"嗡\", \"铭\", \"仆\", \"箔\", \"本\", \"该\", \"脐\", \"梧\", \"释\", \"凡\", \"霏\", \"赢\", \"塔\", \"耐\", \"默\", \"迎\", \"T\", \"乎\", \"荣\", \".\", \"跨\", \"毫\", \"扼\", \"敛\", \"革\", \"韬\", \"乘\", \"缪\", \"工\", \"蔡\", \"⒋\", \"爻\", \"景\", \"胳\", \"距\", \"轼\", \"莞\", \"完\", \"桦\", \"造\", \"紊\", \"價\", \"力\", \"乖\", \"括\", \"谚\", \"说\", \"既\", \"改\", \"木\", \"辑\", \"哈\", \"止\", \"赘\", \"咳\", \"墅\", \"逶\", \"长\", \"雕\", \"逗\", \"鲜\", \"沈\", \"唠\", \"並\", \"胫\", \"昆\", \"问\", \"钓\", \"肖\", \"弦\", \"州\", \"糕\", \"吃\", \"霓\", \"库\", \"俘\", \"嫂\", \"悍\", \"软\", \"邯\", \"蟑\", \"袖\", \"蟋\", \"卻\", \"晗\", \"染\", \"污\", \"驼\", \"膝\", \"逞\", \"郅\", \"抠\", \"庶\", \"枪\", \"芜\", \"弧\", \"锒\", \"檐\", \"曦\", \"柱\", \"鹦\", \"曹\", \"奠\", \"柄\", \"怵\", \"朗\", \"睽\", \"、\", \"悬\", \"垮\", \"塌\", \"八\", \"打\", \"裸\", \"栩\", \"陌\", \"寂\", \"邮\", \"\\b\", \"往\", \"虫\", \"并\", \"乒\", \"灰\", \"屉\", \"芽\", \"涯\", \"猬\", \"苍\", \"D\", \"呜\", \"怒\", \"梅\", \"怖\", \"…\", \"杨\", \"挚\", \"炎\", \"油\", \"申\", \"边\", \"香\", \"刺\", \"锅\", \"掬\", \"睦\", \"欠\", \"牖\", \"峡\", \"秽\", \"缠\", \"ὐ\", \" \", \"泄\", \"彩\", \"娑\", \"析\", \"毙\", \"部\", \"俗\", \"入\", \"模\", \"瞰\", \"n\", \"暂\", \"吾\", \"尬\", \"杭\", \"出\", \"诟\", \"羔\", \"术\", \"眨\", \"翘\", \"玲\", \"樊\", \"埔\", \"唬\", \"诃\", \"又\", \"泳\", \"惕\", \"异\", \"哀\", \"琐\", \"珏\", \"躬\", \"窍\", \"控\", \"条\", \"趟\", \"湖\", \"晋\", \"谴\", \"屹\", \"撸\", \"草\", \"潮\", \"带\", \"吊\", \"励\", \"怔\", \"饲\", \"闪\", \"浞\", \"负\", \"杜\", \"粼\", \"现\", \"主\", \"滤\", \"历\", \"憨\", \"贮\", \"导\", \"费\", \"缸\", \"哼\", \"吼\", \"唐\", \"表\", \"蛛\", \"胚\", \"势\", \"供\", \"谢\", \"开\", \"猾\", \"纺\", \"惺\", \"当\", \"抓\", \"孽\", \"浦\", \"〝\", \"桢\", \"啦\", \"加\", \"担\", \"诞\", \"绵\", \"陷\", \"\", \"天\", \"裳\", \"麦\", \"ό\", \"浓\", \"晦\", \"络\", \"忽\", \"墓\", \"劫\", \"採\", \"陵\", \"里\", \"剐\", \"民\", \"支\", \"住\", \"隘\", \"壳\", \"燎\", \"漱\", \"唷\", \"蜥\", \"凭\", \"猎\", \"屁\", \"巧\", \"逃\", \"促\", \"隶\", \"茅\", \"歼\", \"传\", \"莫\", \"籽\", \"徐\", \"荐\", \"云\", \"阻\", \"弄\", \"胁\", \"渲\", \"嘛\", \"臼\", \"士\", \"佛\", \"范\", \"上\", \"玩\", \"扩\", \"衔\", \"摒\", \"猡\", \"败\", \"慕\", \"舛\", \"港\", \"膳\", \"饽\", \"瘠\", \"ê\", \"肮\", \"揭\", \"丁\", \"撤\", \"妥\", \"纯\", \"葛\", \"柬\", \"植\", \"穗\", \"馅\", \"宝\", \"咆\", \"惮\", \"伸\", \"焰\", \"⑷\", \"厢\", \"枯\", \"斑\", \"殷\", \"栗\", \"谛\", \"蔓\", \"之\", \"阱\", \"泯\", \"旖\", \"凉\", \"桂\", \"湛\", \"陈\", \"象\", \"倍\", \"襄\", \"唱\", \"娱\", \"器\", \"韵\", \"国\", \"征\", \"绽\", \"逐\", \"哎\", \"跟\", \"安\", \"售\", \"颠\", \"证\", \"o\", \"团\", \"饼\", \"e\", \"十\", \"寡\", \"宋\", \"彼\", \"巍\", \"径\", \"僵\", \"水\", \"尖\", \"远\", \"邦\", \"忠\", \"踌\", \"鬓\", \"多\", \"种\", \"盒\", \"进\", \"烤\", \"闾\", \"磕\", \"闻\", \"旎\", \"蔽\", \"睁\", \"颧\", \"各\", \"饮\", \"酌\", \"辜\", \"颐\", \"龙\", \"乱\", \"环\", \"筐\", \"恃\", \"〃\", \"迪\", \"松\", \"鸣\", \"华\", \"板\", \"媛\", \"缮\", \"丝\", \"掷\", \"惬\", \"拘\", \"ㄓ\", \"垒\", \"唾\", \"估\", \"馁\", \"橙\", \"夷\", \"墙\", \"粗\", \"汽\", \"梨\", \"每\", \"虽\", \"郸\", \"众\", \"邑\", \"衬\", \"敌\", \"朋\", \"视\", \"笼\", \"蜿\", \"淅\", \"亦\", \"∶\", \"研\", \"孀\", \"咔\", \"驻\", \"今\", \"悴\", \"筒\", \"袒\", \"辄\", \"死\", \"崇\", \"果\", \"峙\", \"搡\", \"精\", \"運\", \"双\", \"毗\", \"禽\", \"皆\", \"灵\", \"犀\", \"脏\", \"郜\", \"撕\", \"典\", \"旺\", \"危\", \"蚂\", \"蜂\", \"棱\", \"营\", \"孟\", \"祖\", \"复\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/fr": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1540504,
"_n_tokens": 530069,
"_n_chars": 1484970,
"_n_oov_chars": 48476,
"oov_ratio": 0.03264443052721604,
"_oov_charset": "[\"ë\", \"î\", \"“\", \"È\", \"ô\", \"–\", \"\", \"̧\", \"★\", \"\", \"Ê\", \"‘\", \"à\", \"…\", \"’\", \"🙂\", \"´\", \"•\", \"😀\", \"♕\", \"℃\", \"❤\", \"̂\", \"―\", \"́\", \"”\", \"😉\", \"®\", \"À\", \"«\", \"™\", \"»\", \"²\", \"·\", \"
\", \"ê\", \"—\", \"♠\", \"Ç\", \"É\", \"🤔\", \"ã\", \"Ô\", \"è\", \"é\", \"�\", \"ï\", \"µ\", \"″\", \"í\", \"â\", \"û\", \"q\", \"°\", \"ç\", \"œ\", \"ğ\", \"←\", \"ù\", \"‐\", \"Â\", \"Î\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/es": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1664455,
"_n_tokens": 580233,
"_n_chars": 1630297,
"_n_oov_chars": 32121,
"oov_ratio": 0.019702544996402498,
"_oov_charset": "[\"“\", \"\", \"▷\", \"–\", \"¿\", \"\", \"′\", \"🙁\", \"\", \"😦\", \"■\", \"\", \"‘\", \"à\", \"…\", \"ñ\", \"Á\", \"’\", \"🙂\", \"´\", \"😀\", \"•\", \"❤\", \"―\", \"️\", \"”\", \"😉\", \"Ó\", \"✪\", \"✖\", \"®\", \"«\", \"»\", \"²\", \"ø\", \"×\", \"·\", \"—\", \"✔\", \"©\", \"ò\", \"É\", \"М\", \"á\", \"¡\", \"é\", \"è\", \"→\", \"″\", \"ó\", \"í\", \"✓\", \"ú\", \"q\", \"°\", \"Ñ\", \"Ú\", \"ª\", \"ý\", \"👍\", \"←\", \"👏\", \"ô\", \"\", \"Í\", \"º\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/en": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1124813,
"_n_tokens": 280462,
"_n_chars": 1121360,
"_n_oov_chars": 1667,
"oov_ratio": 0.0014865877149176,
"_oov_charset": "[\"⑦\", \"“\", \"😥\", \"\", \"–\", \"\", \"‘\", \"‑\", \"…\", \"’\", \"🙂\", \"´\", \"⑧\", \"”\", \"😉\", \"—\", \"�\", \"\", \"\", \"⑩\", \"\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/zh-Hans": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 2633047,
"_n_tokens": 878811,
"_n_chars": 927311,
"_n_oov_chars": 29293,
"oov_ratio": 0.03158918636789599,
"_oov_charset": "[\"萦\", \"纰\", \"i\", \"缭\", \"舀\", \"飕\", \"捅\", \"葩\", \"孪\", \"狈\", \"戢\", \"擀\", \"赡\", \"铛\", \"翕\", \"锏\", \"噱\", \"拽\", \"搀\", \"裆\", \"嗯\", \"阂\", \"蔼\", \"鼾\", \"遢\", \"跷\", \"镳\", \"忐\", \"’\", \"倏\", \"龇\", \"犄\", \"啬\", \"屣\", \"p\", \"\\u0000\", \"⑨\", \"\", \"遑\", \"瑧\", \"惋\", \"铤\", \"嘣\", \"咚\", \"膊\", \"睑\", \"涣\", \"眯\", \"\", \"攒\", \"炝\", \"泱\", \"冽\", \"秸\", \"倨\", \"怂\", \"觑\", \"啥\", \"⒀\", \"偌\", \"炖\", \"绷\", \"讦\", \"哒\", \"咙\", \"荨\", \"邋\", \"忡\", \"阽\", \"〞\", \"剁\", \"⑦\", \"蹒\", \"疴\", \"烬\", \"纨\", \"r\", \"⒌\", \"拧\", \"蕤\", \"笆\", \"捂\", \"淌\", \"撬\", \"诧\", \"狰\", \"毡\", \"臊\", \"癜\", \"肓\", \"莴\", \"鲎\", \"忪\", \"憋\", \"蛔\", \"苒\", \"谑\", \"烊\", \"滢\", \"缈\", \"聒\", \"�\", \"晾\", \"姣\", \"啃\", \"V\", \"蓦\", \"扪\", \"骛\", \"\", \"诶\", \"\", \"‘\", \"啕\", \"蹩\", \"瘩\", \"赅\", \"馍\", \"盹\", \"`\", \"瑒\", \"喽\", \"a\", \"旆\", \"呷\", \"—\", \"⑿\", \"懵\", \"嘤\", \"吱\", \"嵘\", \"倜\", \"腭\", \"唏\", \"攥\", \"浠\", \"缄\", \"撷\", \"厮\", \"⑧\", \"鸩\", \"礴\", \"呸\", \"耩\", \"踹\", \"犰\", \"蹿\", \"鹑\", \"惴\", \"狞\", \"馄\", \"挲\", \"嗔\", \"⑸\", \"啐\", \"擤\", \"黧\", \"谧\", \"谆\", \"嗦\", \"咧\", \"楂\", \"胧\", \"鹌\", \"蚯\", \"秆\", \"饨\", \"诨\", \"⑥\", \"掂\", \"嗨\", \"掰\", \"樯\", \"碴\", \"祛\", \"―\", \"瞟\", \"s\", \"鹜\", \"⑴\", \"篢\", \"玷\", \"佝\", \"讪\", \"伫\", \"嚷\", \"蟀\", \"墒\", \"溘\", \"掐\", \"呦\", \"擞\", \"摞\", \"撅\", \"黢\", \"铄\", \"⒃\", \"呗\", \"熨\", \"“\", \"嘭\", \"N\", \"痫\", \"吆\", \"噼\", \"瑥\", \"\\u0006\", \"懑\", \"飚\", \"哧\", \"欸\", \"臃\", \"皑\", \"懊\", \"唉\", \"韪\", \"咦\", \"⒁\", \"抡\", \"岣\", \"嘈\", \"\\u0005\", \"褂\", \"嗡\", \"t\", \"孱\", \"刨\", \"沏\", \"T\", \"惫\", \"”\", \"侥\", \"⒋\", \"篓\", \"汹\", \"橱\", \"胳\", \"蘸\", \"叨\", \"\", \"瑑\", \"赘\", \"逶\", \"⒂\", \"唠\", \"胫\", \"獗\", \"婊\", \"屌\", \"郅\", \"瑨\", \"抠\", \"搐\", \"锒\", \"惭\", \"怵\", \"茏\", \"诙\", \"峥\", \"揍\", \"逑\", \"\\b\", \"黝\", \"屉\", \"猬\", \"缥\", \"d\", \"D\", \"…\", \"惘\", \" \", \"坯\", \"牖\", \"汩\", \"呻\", \"抿\", \"拎\", \"叼\", \"n\", \"诟\", \"眨\", \"偎\", \"唬\", \"霈\", \"炕\", \"窍\", \"璎\", \"憔\", \"撸\", \"缜\", \"埂\", \"怔\", \"浞\", \"棂\", \"谩\", \"粼\", \"撩\", \"啪\", \"镏\", \"魇\", \"绉\", \"韫\", \"奂\", \"馋\", \"瘙\", \"荤\", \"霭\", \"谀\", \"\", \"挈\", \"涮\", \"镉\", \"⑶\", \"剐\", \"搂\", \"瞠\", \"唷\", \"犷\", \"籁\", \"蹭\", \"遛\", \"偻\", \"挎\", \"嗤\", \"忑\", \"旳\", \"馒\", \"铣\", \"馕\", \"猡\", \"肮\", \"饽\", \"瞅\", \" \", \"狳\", \"吮\", \"嘀\", \"呃\", \"\\u0007\", \"h\", \"噢\", \"⑷\", \"阑\", \"愣\", \"泯\", \"旖\", \"⑩\", \"黩\", \"哎\", \"\", \"o\", \"e\", \"皙\", \"踱\", \"迤\", \"铩\", \"屄\", \"踌\", \"鬓\", \"磕\", \"锲\", \"\", \"旎\", \"酝\", \"睁\", \"颧\", \"睬\", \"犟\", \"芃\", \"惦\", \"瑢\", \"崽\", \"傥\", \"–\", \"惬\", \"疙\", \"ㄓ\", \"馁\", \"跚\", \"矍\", \"∶\", \"哟\", \"咔\", \"悴\", \"搡\", \"茁\", \"鹕\", \"鼯\", \"吭\", \"嗲\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/fr": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1540504,
"_n_tokens": 396708,
"_n_chars": 1484970,
"_n_oov_chars": 7207,
"oov_ratio": 0.0048532966995966246,
"_oov_charset": "[\"“\", \"–\", \"\", \"\", \"‘\", \"…\", \"’\", \"🙂\", \"´\", \"😀\", \"̂\", \"❤\", \"―\", \"”\", \"😉\", \"
\", \"—\", \"🤔\", \"�\", \"‐\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/es": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1664455,
"_n_tokens": 405970,
"_n_chars": 1630297,
"_n_oov_chars": 2192,
"oov_ratio": 0.0013445402892847131,
"_oov_charset": "[\"“\", \"\", \"▷\", \"–\", \"\", \"\", \"😦\", \"🙁\", \"\", \"‘\", \"…\", \"’\", \"🙂\", \"´\", \"😀\", \"❤\", \"―\", \"️\", \"”\", \"😉\", \"✪\", \"✖\", \"—\", \"✔\", \"✓\", \"👏\", \"👍\", \"\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/en": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1124813,
"_n_tokens": 271691,
"_n_chars": 1121360,
"_n_oov_chars": 32702,
"oov_ratio": 0.029162802311478917,
"_oov_charset": "[\"“\", \"D\", \"S\", \"R\", \"😥\", \"\", \"–\", \"\", \"‘\", \"W\", \"…\", \"‑\", \"’\", \"ñ\", \"🙂\", \"´\", \"Z\", \"V\", \"”\", \"U\", \"😉\", \"J\", \"H\", \"—\", \"K\", \"N\", \"C\", \"Y\", \"A\", \"é\", \"ï\", \"è\", \"�\", \"ó\", \"\", \"M\", \"F\", \"Q\", \"L\", \"I\", \"T\", \"O\", \"P\", \"B\", \"G\", \"⑩\", \"X\", \"\", \"E\", \"\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/zh-Hans": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 2633047,
"_n_tokens": 878021,
"_n_chars": 927311,
"_n_oov_chars": 34293,
"oov_ratio": 0.03698112068119541,
"_oov_charset": "[\"“\", \"D\", \"撸\", \"嘭\", \"纰\", \"飕\", \"N\", \"舀\", \"怔\", \"à\", \"吆\", \"W\", \"忪\", \"憋\", \"粼\", \"Z\", \"苒\", \"镏\", \"噼\", \"绉\", \"烊\", \"瑥\", \"\\u0006\", \"馋\", \"擀\", \"懑\", \"哧\", \"缈\", \"N\", \"聒\", \"锏\", \"ズ\", \"欸\", \"A\", \"�\", \"臃\", \"\", \"ό\", \"M\", \"ě\", \"皑\", \"唉\", \"搀\", \"Q\", \"V\", \"⑶\", \"剐\", \"搂\", \"蓦\", \"韪\", \"扪\", \"骛\", \"T\", \"瞠\", \"咦\", \"裆\", \"\", \"⒁\", \"岣\", \"诶\", \"A\", \"î\", \"S\", \"\\u0005\", \"\", \"蹭\", \"遛\", \"鼾\", \"偻\", \"遢\", \"挎\", \"‘\", \"忐\", \"啕\", \"忑\", \"’\", \"旳\", \"沏\", \"蹩\", \"倏\", \"V\", \"T\", \"”\", \"赅\", \"馕\", \"龇\", \"馍\", \"盹\", \"`\", \"瑒\", \"喽\", \"旆\", \"猡\", \"饽\", \"H\", \"ê\", \"—\", \"瞅\", \"屣\", \" \", \"⑿\", \"⒋\", \"Y\", \"嘀\", \"篓\", \"嘤\", \"\\u0000\", \"\\u0007\", \"⑨\", \"F\", \"\", \"⑷\", \"瑧\", \"I\", \"愣\", \"G\", \"旖\", \"B\", \"嘣\", \"⑩\", \"X\", \"Ø\", \"\", \"唏\", \"瑑\", \"黩\", \"逶\", \"R\", \"⒂\", \"攥\", \"眯\", \"\", \"\", \"唠\", \"炝\", \"倨\", \"婊\", \"踱\", \"鸩\", \"觑\", \"呸\", \"⒀\", \"抠\", \"瑨\", \"J\", \"偌\", \"耩\", \"⒃\", \"锒\", \"铩\", \"屄\", \"踌\", \"C\", \"锲\", \"蹿\", \"惴\", \"狞\", \"馄\", \"挲\", \"\", \"旎\", \"怵\", \"⑸\", \"C\", \"啐\", \"擤\", \"茏\", \"黧\", \"L\", \"颧\", \"谆\", \"嗦\", \"犟\", \"邋\", \"惦\", \"ù\", \"阽\", \"E\", \"\\b\", \"饨\", \"傥\", \"蹒\", \"屉\", \"–\", \"诨\", \"掂\", \"惬\", \"缥\", \"D\", \"吭\", \"…\", \"疴\", \"ㄓ\", \"樯\", \"馁\", \"跚\", \"纨\", \" \", \"牖\", \"―\", \"瞟\", \"U\", \"鹜\", \"汩\", \"ὐ\", \"⒌\", \"⑴\", \"拧\", \"篢\", \"抿\", \"拎\", \"佝\", \"捂\", \"∶\", \"K\", \"á\", \"é\", \"墒\", \"溘\", \"搡\", \"偎\", \"狰\", \"擞\", \"臊\", \"ç\", \"P\", \"O\", \"摞\", \"撅\", \"黢\", \"铄\", \"癜\", \"璎\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/fr": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1540504,
"_n_tokens": 379266,
"_n_chars": 1484970,
"_n_oov_chars": 73934,
"oov_ratio": 0.049788211209654064,
"_oov_charset": "[\"ë\", \"î\", \"D\", \"R\", \"S\", \"“\", \"È\", \"ô\", \"–\", \"\", \"̧\", \"\", \"‐\", \"Ê\", \"‘\", \"à\", \"W\", \"…\", \"’\", \"🙂\", \"´\", \"Z\", \"😀\", \"̂\", \"V\", \"❤\", \"―\", \"́\", \"U\", \"”\", \"😉\", \"À\", \"J\", \"ü\", \"H\", \"
\", \"ê\", \"—\", \"Ç\", \"K\", \"N\", \"C\", \"É\", \"🤔\", \"Ô\", \"è\", \"é\", \"A\", \"ï\", \"Y\", \"�\", \"ã\", \"í\", \"M\", \"â\", \"û\", \"F\", \"Q\", \"L\", \"I\", \"ç\", \"T\", \"P\", \"O\", \"B\", \"G\", \"ù\", \"X\", \"ğ\", \"Â\", \"ä\", \"E\", \"Î\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/es": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1664455,
"_n_tokens": 385564,
"_n_chars": 1630297,
"_n_oov_chars": 70457,
"oov_ratio": 0.04321727881484171,
"_oov_charset": "[\"D\", \"“\", \"S\", \"R\", \"\", \"▷\", \"–\", \"\", \"\", \"😦\", \"🙁\", \"\", \"ô\", \"‘\", \"à\", \"W\", \"ñ\", \"…\", \"Á\", \"’\", \"🙂\", \"´\", \"Z\", \"😀\", \"V\", \"❤\", \"―\", \"️\", \"U\", \"”\", \"😉\", \"Ó\", \"✪\", \"✖\", \"J\", \"ü\", \"ö\", \"H\", \"—\", \"✔\", \"K\", \"N\", \"C\", \"É\", \"ò\", \"á\", \"Y\", \"A\", \"é\", \"è\", \"М\", \"ó\", \"í\", \"M\", \"✓\", \"ú\", \"F\", \"Q\", \"L\", \"Ñ\", \"Ú\", \"I\", \"👏\", \"ý\", \"👍\", \"T\", \"P\", \"O\", \"B\", \"G\", \"\", \"X\", \"Í\", \"E\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/en": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1124813,
"_n_tokens": 260575,
"_n_chars": 1121360,
"_n_oov_chars": 31075,
"oov_ratio": 0.027711885567525147,
"_oov_charset": "[\"⑦\", \"D\", \"S\", \"R\", \"😥\", \"\", \"\", \"W\", \"ñ\", \"🙂\", \"Z\", \"⑧\", \"V\", \"U\", \"😉\", \"J\", \"H\", \"K\", \"N\", \"C\", \"Y\", \"A\", \"é\", \"ï\", \"è\", \"�\", \"ó\", \"\", \"M\", \"F\", \"Q\", \"L\", \"⑤\", \"I\", \"T\", \"O\", \"P\", \"B\", \"G\", \"⑩\", \"X\", \"\", \"③\", \"E\", \"\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/zh-Hans": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2633047,
"_n_tokens": 878554,
"_n_chars": 927311,
"_n_oov_chars": 573790,
"oov_ratio": 0.618767597925615,
"_oov_charset": "[\"搅\", \"稻\", \"缕\", \"膨\", \"杆\", \"痕\", \"抽\", \"滓\", \"办\", \"淋\", \"址\", \"郊\", \"霸\", \"墟\", \"惹\", \"先\", \"沥\", \"构\", \"徨\", \"恒\", \"著\", \"狈\", \"戢\", \"竭\", \"畜\", \"擂\", \"吗\", \"奸\", \"壮\", \"伟\", \"东\", \"蕴\", \"羁\", \"ě\", \"射\", \"Q\", \"咏\", \"撒\", \"蕾\", \"窃\", \"倩\", \"劑\", \"腾\", \"突\", \"等\", \"犹\", \"嗯\", \"渺\", \"龚\", \"愤\", \"赚\", \"矮\", \"股\", \"知\", \"擦\", \"伪\", \"罕\", \"甚\", \"掏\", \"遢\", \"跷\", \"簿\", \"赴\", \"者\", \"猴\", \"障\", \"俯\", \"客\", \"擅\", \"程\", \"宸\", \"款\", \"褒\", \"腺\", \"续\", \"迈\", \"哄\", \"涌\", \"骸\", \"路\", \"谐\", \"茎\", \"睡\", \"晨\", \"嫁\", \"庞\", \"跻\", \"苹\", \"衰\", \"脾\", \"圜\", \"讼\", \"揪\", \"钦\", \"嫉\", \"Y\", \"承\", \"婆\", \"饶\", \"搬\", \"壹\", \"澎\", \"箭\", \"防\", \"几\", \"泛\", \"溪\", \"9\", \"弃\", \"骑\", \"堤\", \"鹃\", \"槌\", \"唇\", \"刃\", \"瑧\", \"捺\", \"铤\", \"鄂\", \"丰\", \"宜\", \"需\", \"阶\", \"懈\", \"戏\", \"妻\", \"踝\", \"冷\", \"睑\", \"昵\", \"眯\", \"薇\", \"闷\", \"晓\", \"冽\", \"像\", \"渥\", \"追\", \"寇\", \"注\", \"怯\", \"烫\", \"怂\", \"矿\", \"轶\", \"咬\", \"【\", \"咒\", \"肃\", \"独\", \"绩\", \"帅\", \"偌\", \"铜\", \"例\", \"迅\", \"足\", \"悠\", \"守\", \"澄\", \"炖\", \"粹\", \"稳\", \"铺\", \"牡\", \"灌\", \"闯\", \"属\", \"黎\", \"陆\", \"帜\", \"衿\", \"咙\", \"绥\", \"1\", \"如\", \"腻\", \"②\", \"画\", \"堡\", \"猜\", \"凹\", \"抵\", \"祟\", \"纠\", \"逢\", \"〞\", \"蹒\", \"丢\", \"试\", \"诈\", \"弩\", \"餐\", \"批\", \"遭\", \"叔\", \"观\", \"叶\", \"铨\", \"姬\", \"绰\", \"踩\", \"屡\", \"衍\", \"铂\", \"秒\", \"⒌\", \"姜\", \"给\", \"垃\", \"棵\", \"瞳\", \"捂\", \"层\", \"愿\", \"瓦\", \"蒋\", \"位\", \"葵\", \"佰\", \"玖\", \"殊\", \"温\", \"闭\", \"跑\", \"睹\", \"狰\", \"族\", \"肝\", \"铃\", \"暴\", \"尴\", \"饷\", \"桐\", \"胶\", \"臊\", \"尘\", \"裔\", \"肓\", \"阐\", \"赎\", \"落\", \"碱\", \"使\", \"劈\", \"叹\", \"扁\", \"评\", \"险\", \"冶\", \"鲎\", \"悯\", \"痰\", \"穷\", \"筹\", \"苯\", \"捆\", \"Z\", \"航\", \"紫\", \"髦\", \"短\", \"郴\", \"挥\", \"嘘\", \"抨\", \"嘉\", \"嚎\", \"烊\", \"挝\", \"滢\", \"砺\", \"衫\", \"融\", \"鞭\", \"霹\", \"赋\", \"泸\", \"逍\", \"镕\", \"夕\", \"拇\", \"姓\", \"ズ\", \"�\", \"傲\", \"督\", \"晾\", \"颇\", \"啃\", \"斜\", \"犁\", \"襟\", \"蓦\", \"羡\", \"丘\", \"仗\", \"怨\", \"吠\", \"凛\", \"惊\", \"漓\", \"遴\", \"笨\", \"件\", \"跳\", \"无\", \"\", \"摩\", \"秉\", \"莲\", \"绕\", \"孩\", \"汕\", \"魔\", \"驾\", \"啕\", \"旌\", \"炫\", \"蚌\", \"昏\", \"偿\", \"剩\", \"佼\", \"咸\", \"蒿\", \"確\", \"旆\", \"泌\", \"菜\", \"摄\", \"格\", \"璀\", \"图\", \"勇\", \"憾\", \"诲\", \"销\", \"决\", \"谱\", \"仰\", \"必\", \"侧\", \"赁\", \"诅\", \"授\", \"電\", \"借\", \"臂\", \"消\", \"低\", \"帖\", \"粉\", \"忌\", \"栏\", \"鱼\", \"仍\", \"肘\", \"刁\", \"诺\", \"蹲\", \"情\", \"练\", \"父\", \"喝\", \"粥\", \"厮\", \"恣\", \"毒\", \"线\", \"与\", \"祢\", \"辖\", \"朦\", \"狮\", \"伤\", \"增\", \"裂\", \"杂\", \"氧\", \"馆\", \"泊\", \"踹\", \"坡\", \"顷\", \"塘\", \"汀\", \"犰\", \"裙\", \"惴\", \"狞\", \"耶\", \"彬\", \"阵\", \"7\", \"逅\", \"谆\", \"咧\", \"盼\", \"稍\", \"侃\", \"楂\", \"登\", \"末\", \"漏\", \"涡\", \"匕\", \"歇\", \"蚊\", \"七\", \"夹\", \"胆\", \"誉\", \"俄\", \"趋\", \"汇\", \"泠\", \"肉\", \"盾\", \"扛\", \"墉\", \"碴\", \"闫\", \"苑\", \"噩\", \"记\", \"舶\", \"⑴\", \"滑\", \"考\", \"鳞\", \"念\", \"捍\", \"论\", \"徊\", \"砸\", \"零\", \"篇\", \"鞍\", \"疼\", \"弈\", \"抢\", \"君\", \"语\", \"狡\", \"盏\", \"汶\", \"凯\", \"丫\", \"破\", \"师\", \"朱\", \"拣\", \"谓\", \"ç\", \"摞\", \"彰\", \"残\", \"镶\", \"庄\", \"恿\", \"投\", \"涸\", \"乍\", \"疮\", \"掠\", \"述\", \"骁\", \"栋\", \"跪\", \"阔\", \"均\", \"褐\", \"瑞\", \"畴\", \"渎\", \"岖\", \"擘\", \"舌\", \"兑\", \"盖\", \"睐\", \"覃\", \"愧\", \"期\", \"瑥\", \"谎\", \"6\", \"皈\", \"滚\", \"个\", \"哗\", \"懑\", \"艾\", \"嫖\", \"曰\", \"冲\", \"列\", \"炒\", \"洼\", \"溃\", \"焕\", \"功\", \"快\", \"聘\", \"薛\", \"嫌\", \"津\", \"颊\", \"才\", \"检\", \"皑\", \"莓\", \"藕\", \"徇\", \"剥\", \"裕\", \"笋\", \"敞\", \"恤\", \"滞\", \"乞\", \"憬\", \"击\", \"涛\", \"瓶\", \"咦\", \"桶\", \"勉\", \"⒁\", \"赠\", \"咎\", \"若\", \"迩\", \"聂\", \"钩\", \"濒\", \"t\", \"索\", \"芮\", \"斛\", \"吸\", \"窜\", \"刨\", \"半\", \"齐\", \"娴\", \"暖\", \"喊\", \"撑\", \"缩\", \"舱\", \"妤\", \"碟\", \"且\", \"套\", \"俺\", \"聊\", \"乐\", \"缘\", \"咐\", \"扫\", \"戾\", \"沙\", \"酷\", \"沂\", \"劣\", \"黑\", \"俑\", \"霖\", \"譬\", \"皖\", \"殴\", \"措\", \"雯\", \"恐\", \"芭\", \"归\", \"整\", \"始\", \"引\", \"斗\", \"械\", \"瘤\", \"\", \"囚\", \"雁\", \"毯\", \"⒂\", \"3\", \"奥\", \"獗\", \"勋\", \"致\", \"拿\", \"婊\", \"羊\", \"甘\", \"药\", \"坐\", \"醇\", \"禅\", \"屌\", \"聆\", \"蔚\", \"璜\", \"否\", \"频\", \"爷\", \"牌\", \"彭\", \"搐\", \"扇\", \"室\", \"受\", \"姨\", \"脯\", \"绣\", \"肤\", \"亳\", \"及\", \"兆\", \"猪\", \"肴\", \"瞥\", \"惭\", \"耸\", \"廖\", \"谜\", \"辉\", \"识\", \"债\", \"违\", \"症\", \"穿\", \"薄\", \"灸\", \"断\", \"涎\", \"逑\", \"暑\", \"腿\", \"歉\", \"喀\", \"]\", \"痘\", \"瀚\", \"陨\", \"岗\", \"册\", \"愉\", \"邱\", \"稚\", \"纷\", \"攀\", \"做\", \"钰\", \"玮\", \"卦\", \"汝\", \"翰\", \"谭\", \"眉\", \"亿\", \"爰\", \"噴\", \"悉\", \"鼻\", \"斤\", \"仔\", \"厚\", \"泻\", \"移\", \"灿\", \"璧\", \"蓄\", \"喉\", \"拎\", \"纾\", \"扒\", \"冤\", \"抚\", \"胜\", \"切\", \"陕\", \"得\", \"杖\", \"撼\", \"骨\", \"堪\", \"聪\", \"毎\", \"董\", \"习\", \"常\", \"奏\", \"棚\", \"垢\", \"刑\", \"气\", \"P\", \"選\", \"溉\", \"炕\", \"霈\", \"框\", \"震\", \"坷\", \"钝\", \"爱\", \"组\", \"头\", \"桅\", \"柚\", \"艘\", \"眷\", \"恋\", \"員\", \"塑\", \"闵\", \"掳\", \"节\", \"溺\", \"妇\", \"芙\", \"询\", \"脊\", \"霾\", \"4\", \"撩\", \"浪\", \"巳\", \"选\", \"诫\", \"鲨\", \"魇\", \"湘\", \"沿\", \";\", \"祭\", \"束\", \"淫\", \"填\", \"铁\", \"韫\", \"奂\", \"雷\", \"馋\", \"己\", \"霭\", \"赞\", \"吐\", \"筑\", \"骤\", \"荡\", \"踪\", \"尺\", \"疲\", \"茫\", \"舅\", \"玫\", \"棒\", \"胰\", \"席\", \"顿\", \"驰\", \"腥\", \"涮\", \"阎\", \"颓\", \"窗\", \"参\", \"茱\", \"俞\", \"樟\", \"枉\", \"匈\", \"泥\", \"杉\", \"汐\", \"瞠\", \"诗\", \"枢\", \"流\", \"晶\", \"留\", \"匹\", \"蹭\", \"遛\", \"卓\", \"偷\", \"偻\", \"璃\", \"贡\", \"琴\", \"汤\", \"淼\", \"免\", \"椅\", \"擎\", \"峻\", \"烛\", \"馒\", \"技\", \"枝\", \"円\", \"◆\", \"犯\", \"卧\", \"杠\", \"绅\", \"拉\", \"馕\", \"侠\", \"患\", \"妞\", \"占\", \"哭\", \"牠\", \"更\", \"凶\", \"拍\", \"娶\", \"降\", \"蜜\", \"贬\", \"绍\", \"暨\", \"您\", \"磺\", \"菲\", \"俚\", \"噢\", \"拭\", \"岌\", \"阑\", \"仙\", \"酸\", \"医\", \"為\", \"⑩\", \"兵\", \"缆\", \"升\", \"采\", \"堕\", \"黩\", \"挡\", \"炼\", \"员\", \"傅\", \"\", \"娃\", \"颌\", \"宠\", \"逸\", \"皿\", \"恩\", \"驶\", \"蝌\", \"际\", \"僧\", \"葱\", \"眠\", \"捷\", \"喔\", \"迤\", \"弓\", \"J\", \"害\", \"献\", \"屋\", \"隐\", \"铩\", \"烟\", \"培\", \"角\", \"宪\", \"爸\", \"婉\", \"屄\", \"膛\", \"發\", \"鞠\", \"臻\", \"由\", \"逻\", \"挽\", \"锡\", \"攫\", \"炅\", \"癌\", \"铮\", \"谬\", \"岁\", \"娥\", \"砂\", \"琅\", \"涝\", \"芝\", \"L\", \"[\", \"覆\", \"祸\", \"怠\", \"窟\", \"煜\", \"犟\", \"芃\", \"糯\", \"蹊\", \"重\", \"萍\", \"招\", \"標\", \"胥\", \"呐\", \"殆\", \"③\", \"缅\", \"蒜\", \"崽\", \"傥\", \"市\", \"飙\", \"绳\", \"愁\", \"阮\", \"亟\", \"坟\", \"诬\", \"掩\", \"仕\", \"疙\", \"获\", \"演\", \"扔\", \"厅\", \"埃\", \"翱\", \"刷\", \"鲸\", \"篱\", \"渐\", \"岭\", \"援\", \"虐\", \"灑\", \"楣\", \"却\", \"芯\", \"锣\", \"嬉\", \"农\", \"洪\", \"差\", \"处\", \"囤\", \"耀\", \"K\", \"▲\", \"佣\", \"é\", \"汁\", \"鸭\", \"放\", \"坛\", \"慮\", \"乔\", \"衣\", \"鹕\", \"讷\", \"柔\", \"最\", \"踢\", \"挠\", \"踞\", \"蜀\", \"根\", \"噬\", \"鼯\", \"散\", \"髻\", \"傍\", \"掀\", \"坝\", \"嗲\", \"凄\", \"肾\", \"闸\", \"跃\", \"萦\", \"i\", \"貌\", \"壓\", \"缭\", \"匿\", \"飕\", \"这\", \"监\", \"弹\", \"吨\", \"嘲\", \"样\", \"巫\", \"补\", \"恶\", \"懒\", \"陋\", \"听\", \"俊\", \"黯\", \"亚\", \"尝\", \"淆\", \"焉\", \"煎\", \"骅\", \"衷\", \"钧\", \"棣\", \"似\", \"收\", \"颁\", \"抗\", \"N\", \"九\", \"茶\", \"锏\", \"铎\", \"翕\", \"链\", \"闺\", \"挪\", \"岔\", \"爪\", \"噱\", \"袍\", \"劝\", \"锁\", \"肌\", \"吁\", \"辰\", \"到\", \"寻\", \"黔\", \"褚\", \"槿\", \"周\", \"究\", \"裆\", \"理\", \"嘴\", \"撰\", \"较\", \"积\", \"莉\", \"税\", \"赤\", \"蘑\", \"巅\", \"愈\", \"录\", \"飞\", \"自\", \"瑜\", \"泣\", \"瑰\", \"镐\", \"讽\", \"浮\", \"別\", \"谋\", \"茨\", \"宛\", \"贝\", \"沉\", \"倏\", \"翔\", \"蝶\", \"灼\", \"谦\", \"廊\", \"键\", \"液\", \"旗\", \"辫\", \"六\", \"瓜\", \"色\", \"啬\", \"希\", \"寨\", \"挖\", \"码\", \"他\", \"疹\", \"老\", \"诊\", \"槛\", \"饿\", \"汛\", \"卵\", \"菩\", \"觉\", \"蔬\", \"煽\", \"绸\", \"割\", \"豚\", \"鸿\", \"螃\", \"贯\", \"侦\", \"亭\", \"堵\", \"符\", \"座\", \"旧\", \"醛\", \"內\", \"5\", \"拂\", \"菌\", \"遏\", \"随\", \"刹\", \"怜\", \"嘣\", \"膊\", \"滥\", \"涣\", \"吧\", \"庆\", \"圩\", \"魏\", \"骏\", \"未\", \"派\", \"辙\", \"坤\", \"攒\", \"漉\", \"珉\", \"炮\", \"寐\", \"掺\", \"秩\", \"乃\", \"韦\", \"峭\", \"桓\", \"町\", \"哪\", \"满\", \"唤\", \"洽\", \"钮\", \"卿\", \"咖\", \"姚\", \"渤\", \"汪\", \"悟\", \"報\", \"吵\", \"C\", \"窿\", \"弛\", \"凤\", \"狗\", \"蹈\", \"琉\", \"畑\", \"速\", \"块\", \"讦\", \"容\", \"漪\", \"宵\", \"察\", \"躯\", \"诱\", \"弑\", \"猛\", \"泼\", \"渝\", \"阽\", \"戍\", \"黏\", \"剁\", \"峰\", \"罪\", \"宴\", \"杀\", \"把\", \"拢\", \"皱\", \"兹\", \"渗\", \"指\", \"颖\", \"刊\", \"狭\", \"逮\", \"榴\", \"疴\", \"酱\", \"厘\", \"①\", \"插\", \"烬\", \"纨\", \"略\", \"r\", \"资\", \"函\", \"鳃\", \"噌\", \"而\", \"奶\", \"茧\", \"強\", \"拓\", \"彤\", \"恕\", \"坦\", \"约\", \"蒸\", \"竺\", \"吩\", \"笆\", \"烁\", \"烷\", \"跤\", \"揣\", \"簇\", \"鹭\", \"撬\", \"娅\", \"滨\", \"勖\", \"钜\", \"庸\", \"洋\", \"沦\", \"哉\", \"卜\", \"雇\", \"础\", \"棉\", \"婚\", \"尾\", \"陶\", \"O\", \"规\", \"邻\", \"适\", \"瞻\", \"静\", \"排\", \"盯\", \"联\", \"膀\", \"霜\", \"榨\", \"次\", \"镜\", \"忘\", \"胞\", \"璇\", \"疸\", \"球\", \"贴\", \"蛔\", \"庐\", \"谑\", \"践\", \"抖\", \"混\", \"栽\", \"寥\", \"吏\", \"恙\", \"鼠\", \"拔\", \"郁\", \"庭\", \"书\", \"兰\", \"亡\", \"炳\", \"滋\", \"柏\", \"战\", \"澜\", \"欢\", \"钱\", \"摘\", \"溢\", \"陀\", \"吴\", \"熔\", \"聒\", \"扬\", \"趾\", \"婶\", \"挺\", \"姣\", \"态\", \"绘\", \"烹\", \"V\", \"季\", \"恪\", \"矢\", \"舰\", \"熄\", \"T\", \"厉\", \"狐\", \"偏\", \"耻\", \"蔷\", \"择\", \"暇\", \"数\", \"激\", \"诵\", \"徘\", \"呵\", \"罹\", \"饰\", \"秘\", \"腑\", \"礼\", \"瓣\", \"懂\", \"耽\", \"徳\", \"量\", \"依\", \"疯\", \"篮\", \"痹\", \"柘\", \"呷\", \"科\", \"讲\", \"舐\", \"莺\", \"朽\", \"讳\", \"结\", \"翩\", \"牺\", \"虎\", \"權\", \"伦\", \"漫\", \"候\", \"拱\", \"珠\", \"舵\", \"签\", \"倜\", \"髓\", \"沾\", \"湿\", \"蓁\", \"厨\", \"咽\", \"躁\", \"茸\", \"点\", \"卤\", \"勘\", \"锌\", \"攥\", \"详\", \"瑕\", \"蛊\", \"巡\", \"桌\", \"嘱\", \"摧\", \"浠\", \"池\", \"稠\", \"号\", \"判\", \"难\", \"哦\", \"欺\", \"霍\", \"谔\", \"腔\", \"撷\", \"虏\", \"蚀\", \"⑧\", \"夭\", \"瀛\", \"屏\", \"翊\", \"敝\", \"漩\", \"礁\", \"箍\", \"在\", \"铝\", \"邸\", \"辨\", \"漆\", \"蹿\", \"鹑\", \"動\", \"玻\", \"轿\", \"抛\", \"央\", \"啐\", \"沃\", \"谧\", \"寰\", \"坊\", \"哲\", \"夺\", \"罚\", \"概\", \"纹\", \"巩\", \"秃\", \"胧\", \"惜\", \"凸\", \"殖\", \"艇\", \"烦\", \"诨\", \"渍\", \"剧\", \"浸\", \"关\", \"丐\", \"坞\", \"壁\", \"曼\", \"看\", \"斌\", \"跋\", \"沸\", \"槃\", \"畿\", \"瘦\", \"彙\", \"燃\", \"用\", \"纵\", \"严\", \"夸\", \"寅\", \"帕\", \"贱\", \"徽\", \"玷\", \"倒\", \"冥\", \"厂\", \"邓\", \"纬\", \"迭\", \"幽\", \"荫\", \"弟\", \"霆\", \"崔\", \"绊\", \"硅\", \"撇\", \"橇\", \"呦\", \"嚣\", \"飓\", \"姆\", \"耦\", \"摔\", \"粱\", \"裴\", \"茂\", \"绚\", \"遣\", \"赵\", \"⒃\", \"基\", \"妖\", \"旅\", \"群\", \"驳\", \"挟\", \"第\", \"W\", \"洁\", \"篝\", \"剔\", \"浩\", \"沐\", \"皂\", \"豪\", \"瞪\", \"啜\", \"溅\", \"雨\", \"居\", \"趣\", \"棘\", \"眶\", \"但\", \"・\", \"拳\", \"舞\", \"糖\", \"莎\", \"澳\", \"媚\", \"伴\", \"聿\", \"锚\", \"挨\", \"两\", \"配\", \"砾\", \"枚\", \"蓉\", \"你\", \"找\", \"通\", \"渡\", \"芳\", \"帐\", \"唉\", \"微\", \"酿\", \"旬\", \"宾\", \"婴\", \"姗\", \"待\", \"后\", \"A\", \"嘈\", \"厌\", \"谈\", \"\\u0005\", \"亮\", \"豁\", \"呕\", \"滇\", \"孱\", \"疗\", \"望\", \"斧\", \"僚\", \"袱\", \"&\", \"沏\", \"圈\", \"戚\", \"以\", \"蕉\", \"荧\", \"骼\", \"催\", \"撐\", \"刮\", \"時\", \"斩\", \"窦\", \"哺\", \"H\", \"纂\", \"呼\", \"非\", \"秤\", \"迄\", \"协\", \"灶\", \"肚\", \"蒙\", \"鸦\", \"汹\", \"橱\", \"伙\", \"助\", \"躲\", \"率\", \"卸\", \"蘸\", \"叨\", \"维\", \"了\", \"机\", \"赖\", \"橄\", \"乳\", \"趴\", \"孰\", \"飘\", \"粟\", \"认\", \"右\", \"媲\", \"亥\", \"_\", \"盗\", \"屠\", \"掖\", \"床\", \"锋\", \"辆\", \"暧\", \"昨\", \"味\", \"盎\", \"凿\", \"累\", \"據\", \"蜃\", \"临\", \"寿\", \"瑨\", \"喆\", \"益\", \"冬\", \"鹿\", \"辣\", \"吝\", \"溯\", \"雀\", \"奢\", \"粕\", \"尧\", \"魁\", \"聚\", \"豫\", \"酋\", \"责\", \"货\", \"崩\", \"裹\", \"翅\", \"肆\", \"忙\", \"挫\", \"毅\", \"茏\", \"嗓\", \"妙\", \"炊\", \"砌\", \"准\", \"焯\", \"戛\", \"艋\", \"峥\", \"揍\", \"E\", \"台\", \"唯\", \"呢\", \"杰\", \"鼓\", \"早\", \"黝\", \"娜\", \"乾\", \"萎\", \"藏\", \"铲\", \"郭\", \"洛\", \"甲\", \"乏\", \"丑\", \"敦\", \"哇\", \" \", \"涕\", \"丙\", \"呻\", \"肢\", \"蛙\", \"柴\", \"鞋\", \"脱\", \"脚\", \"叼\", \"抿\", \"汉\", \"纱\", \"兔\", \"弯\", \"偎\", \"涤\", \"伏\", \"麾\", \"椭\", \"血\", \"鬼\", \"热\", \"臧\", \"溜\", \"扉\", \"嘎\", \"猩\", \"璎\", \"螺\", \"净\", \"憔\", \"焙\", \"疑\", \"剪\", \"缜\", \"显\", \"埂\", \"票\", \"骆\", \"孝\", \"任\", \"户\", \"棂\", \"肥\", \"谩\", \"干\", \"她\", \"※\", \"蝉\", \"濮\", \"班\", \"苗\", \"好\", \"℃\", \"乡\", \"绉\", \"萝\", \"初\", \"拥\", \"肿\", \"执\", \"萄\", \"荤\", \"载\", \"刀\", \"幻\", \"醒\", \"诣\", \"连\", \"俩\", \"胀\", \"茉\", \"即\", \"於\", \"岛\", \"值\", \"嗜\", \"偶\", \"建\", \"沁\", \"绑\", \"勃\", \"搂\", \"屈\", \"麟\", \"韧\", \"叫\", \"卉\", \"钵\", \"牵\", \"喷\", \"躺\", \"便\", \"歹\", \"贤\", \"î\", \"籁\", \"测\", \"讯\", \"壤\", \"化\", \"赔\", \"延\", \"奔\", \"滴\", \"琛\", \"戴\", \"队\", \"券\", \"婺\", \"颈\", \"匠\", \"孔\", \"请\", \"滕\", \"娼\", \"粮\", \"奎\", \"缓\", \"争\", \"没\", \"瞧\", \"吮\", \"端\", \"籍\", \"锐\", \"乙\", \"颉\", \"嘀\", \"沧\", \"仲\", \"湃\", \"绎\", \"岳\", \"寞\", \"倚\", \"惶\", \"拒\", \"h\", \"携\", \"预\", \"I\", \"株\", \"振\", \"颜\", \"醍\", \"蜕\", \"侯\", \"慨\", \"洲\", \"拨\", \"揖\", \"蜒\", \"别\", \"椎\", \"顽\", \"靴\", \"慷\", \"阁\", \"场\", \"贫\", \"詹\", \"剖\", \"匀\", \"壑\", \"陛\", \"攘\", \"疤\", \"灯\", \"邕\", \"皙\", \"袁\", \"兮\", \"览\", \"济\", \"矣\", \"糊\", \"总\", \"鄯\", \"过\", \"愕\", \"珍\", \"坏\", \"橡\", \"讥\", \"摇\", \"盐\", \"梭\", \"钟\", \"赛\", \"洗\", \"锲\", \"性\", \"彻\", \"辩\", \"箱\", \"音\", \"窒\", \"牲\", \"案\", \"酝\", \"瘾\", \"实\", \"店\", \"贵\", \"惦\", \"甜\", \"波\", \"经\", \"寓\", \"嘻\", \"莅\", \"%\", \"鸽\", \"侬\", \"斥\", \"浊\", \"彗\", \"钢\", \"爵\", \"苇\", \"律\", \"朔\", \"番\", \"鹤\", \"馨\", \"潜\", \"架\", \"冯\", \"影\", \"奘\", \"啼\", \"涉\", \"棍\", \"威\", \"柑\", \"翁\", \"淳\", \"U\", \"扰\", \"段\", \"廉\", \"氢\", \"颤\", \"作\", \"荒\", \"应\", \"榆\", \"悦\", \"淑\", \"趁\", \"谨\", \"穆\", \"痪\", \"漠\", \"渣\", \"腹\", \"提\", \"僻\", \"页\", \"斯\", \"匆\", \"驮\", \"菱\", \"综\", \"碍\", \"妨\", \"爆\", \"职\", \"睿\", \"槽\", \"闲\", \"巨\", \"昊\", \"界\", \"肯\", \"镀\", \"惩\", \"病\", \"拖\", \"纰\", \"肺\", \"舀\", \"姐\", \"挂\", \"掘\", \"熟\", \"柯\", \"假\", \"阴\", \"捅\", \"涟\", \"姥\", \"腋\", \"矗\", \"俪\", \"葩\", \"虔\", \"息\", \"孪\", \"渠\", \"繁\", \"浴\", \"臀\", \"豹\", \"夥\", \"擀\", \"梗\", \"言\", \"厦\", \"伐\", \"雌\", \"剑\", \"钥\", \"A\", \"垄\", \"旁\", \"畔\", \"栖\", \"托\", \"拽\", \"袜\", \"艺\", \"堰\", \"拟\", \"般\", \"冒\", \"辽\", \"秦\", \"虑\", \"圆\", \"孙\", \"蝗\", \"酵\", \"县\", \"窥\", \"婪\", \"羞\", \"+\", \"盲\", \"绪\", \"鼾\", \"沫\", \"讶\", \"搭\", \"楚\", \"嗣\", \"蚓\", \"旱\", \"忐\", \"潘\", \"ヨ\", \"镭\", \"划\", \"觅\", \"屎\", \"倘\", \"牢\", \"絮\", \"龇\", \"悔\", \"褪\", \"恰\", \"伯\", \"辞\", \"泉\", \"陡\", \"烯\", \"笛\", \"辕\", \"p\", \"媒\", \"侣\", \"宏\", \"剂\", \"锥\", \"附\", \"⑨\", \"\", \"确\", \"雏\", \"惋\", \"弱\", \"宽\", \"握\", \"瘫\", \"恨\", \"贼\", \"噪\", \"Ø\", \"晒\", \"兢\", \"蹄\", \"教\", \"管\", \"编\", \"摸\", \"涂\", \"荏\", \"仇\", \"枷\", \"畏\", \"勿\", \"埠\", \"近\", \"锻\", \"泱\", \"栈\", \"慑\", \"秸\", \"倨\", \"爹\", \"愚\", \"鹉\", \"剽\", \"质\", \"咯\", \"邪\", \"⒀\", \"盆\", \"须\", \"荟\", \"牧\", \"梦\", \"阀\", \"查\", \"操\", \"勒\", \"背\", \"拼\", \"倡\", \"左\", \"奋\", \"岑\", \"遮\", \"锢\", \"垠\", \"脑\", \"蜘\", \"伉\", \"酪\", \"深\", \"权\", \"萌\", \"坪\", \"谁\", \"沽\", \"钞\", \"甫\", \"痒\", \"邢\", \"佟\", \"浙\", \"全\", \"葡\", \"度\", \"煮\", \"0\", \"虹\", \"忆\", \"砖\", \"賣\", \"氰\", \"告\", \"渴\", \"抬\", \"坠\", \"淄\", \"庙\", \"绛\", \"寸\", \"薰\", \"型\", \"盟\", \"卷\", \"逊\", \"咕\", \"帘\", \"贩\", \"童\", \"曳\", \"遗\", \"敬\", \"于\", \"呀\", \"宫\", \"啤\", \"赶\", \"耘\", \"捧\", \"邬\", \"峨\", \"佳\", \"崖\", \"署\", \"舎\", \"针\", \"惚\", \"蕤\", \"印\", \"撞\", \"儒\", \"挑\", \"硬\", \"烧\", \"装\", \"茜\", \"碑\", \"儿\", \"诧\", \"肪\", \"因\", \"据\", \"螂\", \"糠\", \"惰\", \"埋\", \"价\", \"瞎\", \"叛\", \"捕\", \"遍\", \"卑\", \"为\", \"毡\", \"嚼\", \"癜\", \"抒\", \"俱\", \"声\", \"润\", \"局\", \"韩\", \"袋\", \"蜡\", \"叠\", \"刚\", \"然\", \"莴\", \"尸\", \"甩\", \"恼\", \"徙\", \"憋\", \"捏\", \"】\", \"苒\", \"鳗\", \"妃\", \"咱\", \"芋\", \"檬\", \"抉\", \"越\", \"抹\", \"倾\", \"仑\", \"冻\", \"校\", \"欣\", \"遇\", \"扎\", \"院\", \"缈\", \"厥\", \"晰\", \"粘\", \"噶\", \"隋\", \"玄\", \"返\", \"藐\", \"咪\", \"菁\", \"巢\", \"麽\", \"羚\", \"喇\", \"肇\", \"夜\", \"阪\", \"號\", \"卖\", \"逝\", \"骛\", \"弗\", \"奴\", \"\", \"惑\", \"红\", \"畸\", \"萃\", \"站\", \"圭\", \"膏\", \"盈\", \"循\", \"陇\", \"熏\", \"揽\", \"牒\", \"岸\", \"吻\", \"穹\", \"稽\", \"郑\", \"迫\", \"魅\", \"奖\", \"祥\", \"瘩\", \"昂\", \"脆\", \"玉\", \"冉\", \"喜\", \"对\", \"遐\", \"睫\", \"廷\", \"可\", \"挤\", \"露\", \"诡\", \"很\", \"答\", \"梁\", \"壶\", \"鸠\", \"匾\", \"细\", \"缝\", \"懵\", \"喧\", \"蓟\", \"萼\", \"淘\", \"终\", \"梵\", \"靠\", \"臣\", \"吱\", \"豌\", \"嘤\", \"嵘\", \"醐\", \"猫\", \"罩\", \"灾\", \"骗\", \"庇\", \"泡\", \"潦\", \"策\", \"烙\", \"翠\", \"猥\", \"苛\", \"描\", \"锂\", \"唏\", \"怪\", \"此\", \"竿\", \"芷\", \"卢\", \"捉\", \"缄\", \"靶\", \"档\", \"丹\", \"订\", \"脉\", \"慌\", \"叩\", \"呸\", \"慎\", \"慰\", \"绞\", \"菊\", \"淖\", \"驿\", \"购\", \"寒\", \"瘀\", \"碰\", \"砧\", \"酣\", \"湾\", \"圣\", \"馄\", \"甯\", \"汗\", \"狠\", \"⑸\", \"C\", \"凝\", \"帽\", \"擤\", \"尔\", \"翼\", \"祝\", \"黧\", \"翡\", \"至\", \"辛\", \"薯\", \"嗦\", \"邹\", \"极\", \"魂\", \"桥\", \"服\", \"妄\", \"旷\", \"瑟\", \"雳\", \"盘\", \"苦\", \"秆\", \"饨\", \"审\", \"⑥\", \"矫\", \"嗨\", \"钻\", \"时\", \"昕\", \"暮\", \"掉\", \"所\", \"耿\", \"扣\", \"辱\", \"劾\", \"减\", \"侈\", \"俭\", \"逆\", \"运\", \"瞟\", \"婷\", \"房\", \"竟\", \"验\", \"骂\", \"芦\", \"饱\", \"播\", \"嗅\", \"桔\", \"域\", \"钉\", \"伫\", \"嚷\", \"蟀\", \"晚\", \"溘\", \"阅\", \"玛\", \"巾\", \"吟\", \"掐\", \"荼\", \"楔\", \"畅\", \"瞒\", \"萨\", \"矩\", \"柠\", \"宅\", \"熙\", \"泾\", \"训\", \"荆\", \"黢\", \"爬\", \"裘\", \"熨\", \"併\", \"D\", \"欧\", \"粒\", \"它\", \"惯\", \"喃\", \"○\", \"脸\", \"晤\", \"粽\", \"焦\", \"疆\", \"晴\", \"寄\", \"痫\", \"锈\", \"轻\", \"牟\", \"遂\", \"篡\", \"戒\", \"稀\", \"貂\", \"亩\", \"遥\", \"屯\", \"隔\", \"磋\", \"祀\", \"\\u0006\", \"扭\", \"敏\", \"肩\", \"棠\", \"超\", \"霉\", \"园\", \"坚\", \"顾\", \"伍\", \"固\", \"裁\", \"哧\", \"算\", \"匮\", \"欸\", \"臃\", \"碌\", \"梢\", \"百\", \"憧\", \"疚\", \"韪\", \"专\", \"船\", \"刘\", \"苣\", \"困\", \"橘\", \"腓\", \"搏\", \"巴\", \"输\", \"募\", \"耕\", \"醋\", \"奚\", \"徒\", \"纽\", \"鸟\", \"物\", \"级\", \"享\", \"辈\", \"敷\", \"酥\", \"布\", \"個\", \"拐\", \"褂\", \"词\", \"仅\", \"昧\", \"赏\", \"啊\", \"欲\", \"伺\", \"交\", \"活\", \"胱\", \"惫\", \"单\", \"妒\", \"张\", \"煞\", \"帷\", \"琳\", \"瓷\", \"底\", \"侥\", \"臆\", \"芬\", \"养\", \"葫\", \"彷\", \"篓\", \"特\", \"身\", \"倪\", \"烃\", \"汰\", \"歧\", \"靛\", \"充\", \"围\", \"誓\", \"筝\", \"回\", \"私\", \"娄\", \"烂\", \"则\", \"仓\", \"式\", \"鹰\", \"坎\", \"瑑\", \"狸\", \"炭\", \"胖\", \"沛\", \"报\", \"晖\", \"拜\", \"琢\", \"映\", \"肛\", \"咀\", \"毕\", \"余\", \"摆\", \"赃\", \"狄\", \"响\", \"继\", \"腕\", \"惧\", \"再\", \"毁\", \"役\", \"茄\", \"奇\", \"万\", \"甸\", \"莹\", \"状\", \"思\", \"棕\", \"折\", \"蚤\", \"釜\", \"克\", \"乓\", \"荻\", \"虾\", \"冰\", \"骰\", \"置\", \"尼\", \"筋\", \"哮\", \"课\", \"缚\", \"门\", \"诸\", \"勤\", \"储\", \"诙\", \"党\", \"沟\", \"猝\", \"令\", \"尊\", \"姑\", \"簧\", \"疾\", \"柿\", \"慧\", \"楼\", \"仿\", \"喂\", \"8\", \"恍\", \"缥\", \"羹\", \"d\", \"恺\", \"喻\", \"浏\", \"账\", \"薩\", \"瀑\", \"惘\", \"艳\", \"饭\", \"蓝\", \"持\", \"腊\", \"坯\", \"窖\", \"贸\", \"称\", \"葆\", \"幅\", \"辗\", \"奉\", \"岂\", \"〖\", \"汩\", \"吹\", \"壕\", \"游\", \"苟\", \"揉\", \"财\", \"午\", \"柜\", \"兜\", \"辅\", \"访\", \"贺\", \"举\", \"屿\", \"动\", \"亲\", \"顺\", \"饥\", \"宙\", \"栅\", \"艰\", \"迟\", \"炬\", \"〔\", \"赂\", \"孕\", \"靖\", \"替\", \"罄\", \"限\", \"途\", \"懦\", \"读\", \"源\", \"巷\", \"癫\", \"轰\", \"府\", \"照\", \"怡\", \"鞘\", \"走\", \"缉\", \"呛\", \"衅\", \"囊\", \"起\", \"隆\", \"筛\", \"à\", \"迹\", \"啪\", \"氛\", \"兴\", \"損\", \"镏\", \"鲤\", \"毛\", \"哑\", \"淤\", \"磊\", \"痊\", \"劳\", \"託\", \"剿\", \"翻\", \"浚\", \"衡\", \"贷\", \"瘙\", \"母\", \"颗\", \"谀\", \"妍\", \"推\", \"粪\", \"除\", \"贪\", \"挈\", \"昔\", \"拷\", \"勾\", \"鑫\", \"镉\", \"⑶\", \"竖\", \"旋\", \"鲍\", \"够\", \"罗\", \"掌\", \"矶\", \"舟\", \"披\", \"犷\", \"凌\", \"罐\", \"S\", \"跌\", \"瞩\", \"幕\", \"启\", \"妹\", \"转\", \"努\", \"蟹\", \"挎\", \"纸\", \"嘟\", \"嗪\", \"嗤\", \"忑\", \"孜\", \"婿\", \"旳\", \"佬\", \"杯\", \"尿\", \"斐\", \"墨\", \"浆\", \"铣\", \"弊\", \"送\", \"要\", \"狙\", \"珊\", \"拯\", \"丛\", \"瞅\", \"体\", \"傻\", \" \", \"蛇\", \"敖\", \"狳\", \"删\", \"榷\", \"绒\", \"镑\", \"发\", \"蹦\", \"呃\", \"\\u0007\", \"枣\", \"素\", \"網\", \"桃\", \""\", \"寝\", \"只\", \"淮\", \"愣\", \"苏\", \"饵\", \"X\", \"舆\", \"风\", \"颂\", \"哥\", \"乌\", \"佘\", \"R\", \"朴\", \"晃\", \"抑\", \"利\", \"抄\", \"泪\", \"休\", \"湮\", \"陪\", \"递\", \"垣\", \"泵\", \"蕃\", \"崛\", \"存\", \"淹\", \"悚\", \"厕\", \"丸\", \"已\", \"扑\", \"截\", \"缺\", \"亵\", \"踱\", \"紧\", \"产\", \"疫\", \"癖\", \"雾\", \"漂\", \"肠\", \"惨\", \"押\", \"殉\", \"项\", \"厝\", \"修\", \"熊\", \"當\", \"话\", \"桑\", \"系\", \"惟\", \"锄\", \"互\", \"某\", \"许\", \"狂\", \"蒂\", \"竣\", \"樱\", \"计\", \"\", \"珀\", \"盛\", \"份\", \"扶\", \"硕\", \"酒\", \"睬\", \"栓\", \"耗\", \"宁\", \"官\", \"接\", \"触\", \"桩\", \"娩\", \"瑢\", \"感\", \"银\", \"写\", \"贞\", \"裤\", \"缴\", \"炉\", \"勺\", \"着\", \"额\", \"弥\", \"澈\", \"副\", \"攻\", \"碧\", \"磅\", \"诀\", \"胸\", \"矍\", \"藉\", \"跚\", \"沓\", \"卡\", \"包\", \"榜\", \"压\", \"达\", \"珞\", \"蜴\", \"就\", \"取\", \"哟\", \"谣\", \"兽\", \"爽\", \"膜\", \"轨\", \"浅\", \"稿\", \"á\", \"冀\", \"避\", \"仄\", \"领\", \"彦\", \"茁\", \"嫩\", \"硫\", \"⑤\", \"搁\", \"锤\", \"夯\", \"脂\", \"糟\", \"晕\", \"猖\", \"穰\", \"鄙\", \"瞄\", \"吭\", \"或\", \"讨\", \"袭\", \"逼\", \"效\", \"葬\", \"忡\", \"救\", \"反\", \"邃\", \"辐\", \"意\", \"铸\", \"统\", \"涵\", \"驭\", \"狼\", \"淞\", \"穴\", \"凰\", \"靓\", \"丈\", \"狱\", \"诉\", \"付\", \"棺\", \"捡\", \"窝\", \"怕\", \"材\", \"忧\", \"赡\", \"骇\", \"蹴\", \"铛\", \"强\", \"共\", \"炸\", \"怎\", \"豆\", \"摊\", \"笔\", \"稣\", \"误\", \"搀\", \"贿\", \"煤\", \"挣\", \"少\", \"抱\", \"蜷\", \"甄\", \"伞\", \"阂\", \"怀\", \"塞\", \"烘\", \"郝\", \"氨\", \"尹\", \"姿\", \"蔼\", \"驱\", \"被\", \"纤\", \"削\", \"镳\", \"晟\", \"迦\", \"护\", \"屑\", \"邀\", \"榄\", \"赫\", \"姊\", \"拦\", \"些\", \"瑄\", \"去\", \"栾\", \"悲\", \"烈\", \"犄\", \"酬\", \"屣\", \"网\", \"步\", \"〕\", \"阳\", \"資\", \"另\", \"卍\", \"尽\", \"琪\", \"朵\", \"黛\", \"惠\", \"\\u0000\", \"诚\", \"F\", \"羽\", \"么\", \"横\", \"榭\", \"吞\", \"叙\", \"旨\", \"遑\", \"ソ\", \"邂\", \"G\", \"B\", \"霄\", \"佩\", \"轮\", \"牛\", \"咚\", \"岚\", \"亂\", \"纪\", \"祉\", \"琶\", \"脖\", \"瞬\", \"漲\", \"\", \"梳\", \"咋\", \"炝\", \"骚\", \"磨\", \"隙\", \"痴\", \"间\", \"品\", \"眩\", \"溶\", \"彪\", \"废\", \"标\", \"殿\", \"煌\", \"腱\", \"耍\", \"杏\", \"觑\", \"啥\", \"谍\", \"澡\", \"是\", \"胺\", \"斋\", \"邵\", \"禁\", \"召\", \"届\", \"篷\", \"胃\", \"其\", \"暗\", \"悄\", \"予\", \"康\", \"纲\", \"绷\", \"榻\", \"呈\", \"虞\", \"哒\", \"侄\", \"辟\", \"侵\", \"舔\", \"荨\", \"曝\", \"潭\", \"绿\", \"泰\", \"租\", \"契\", \"那\", \"鳌\", \"邋\", \"燥\", \"碾\", \"禧\", \"宰\", \"坑\", \"ù\", \"拾\", \"币\", \"楷\", \"⑦\", \"叉\", \"舒\", \"调\", \"仪\", \"句\", \"纳\", \"译\", \"萤\", \"喱\", \"渊\", \"戈\", \"阜\", \"梯\", \"鹅\", \"焚\", \"吓\", \"损\", \"眺\", \"潇\", \"拧\", \"侮\", \"善\", \"曾\", \"核\", \"失\", \"氯\", \"议\", \"首\", \"筷\", \"曙\", \"磁\", \"淌\", \"兄\", \"诠\", \"鸥\", \"2\", \"何\", \"琦\", \"鬣\", \"离\", \"腰\", \"敲\", \"氮\", \"普\", \"荷\", \"务\", \"渔\", \"拌\", \"薪\", \"慈\", \"竞\", \"歩\", \"馏\", \"命\", \"从\", \"娇\", \"伽\", \"鲁\", \"枕\", \"芹\", \"翌\", \"集\", \"椒\", \"闹\", \"堆\", \"警\", \"廓\", \"垂\", \"绝\", \"育\", \"含\", \"霊\", \"靡\", \"旭\", \"圾\", \"孵\", \"忪\", \"娟\", \"谊\", \"躇\", \"委\", \"慢\", \"轴\", \"甬\", \"妈\", \"题\", \"富\", \"商\", \"戮\", \"痛\", \"军\", \"蠢\", \"备\", \"逛\", \"玳\", \"缔\", \"直\", \"棋\", \"鹈\", \"札\", \"虱\", \"妮\", \"迷\", \"米\", \"啡\", \"碗\", \"况\", \"楞\", \"罔\", \"禄\", \"扯\", \"制\", \"踵\", \"扪\", \"友\", \"垫\", \"向\", \"境\", \"顶\", \"罢\", \"麓\", \"诶\", \"〗\", \"故\", \"嘿\", \"毋\", \"透\", \"菇\", \"椰\", \"让\", \"沼\", \"岐\", \"蔑\", \"魄\", \"凳\", \"涅\", \"具\", \"展\", \"蹩\", \"恢\", \"妓\", \"舍\", \"碳\", \"探\", \"忿\", \"垛\", \"鼎\", \"业\", \"买\", \"赅\", \"搜\", \"蛋\", \"娠\", \"馍\", \"盹\", \"瑒\", \"喽\", \"a\", \"见\", \"岱\", \"锯\", \"灭\", \"雍\", \"④\", \"遵\", \"槐\", \"树\", \"⑿\", \"逾\", \"涨\", \"退\", \"刻\", \"匙\", \"错\", \"迁\", \"臭\", \"檀\", \"亨\", \"芒\", \"媳\", \"腭\", \"能\", \"赐\", \"倦\", \"皮\", \"叮\", \"优\", \"丽\", \"麻\", \"类\", \"轩\", \"还\", \"祈\", \"滔\", \"矛\", \"芥\", \"扮\", \"蚪\", \"拆\", \"赌\", \"履\", \"窘\", \"圳\", \"熬\", \"熹\", \"串\", \"踊\", \"莱\", \"睛\", \"聋\", \"忍\", \"汲\", \"鸩\", \"礴\", \"湄\", \"缀\", \"笃\", \"娘\", \"赣\", \"浑\", \"耩\", \"俏\", \"马\", \"凋\", \"滩\", \"们\", \"醉\", \"啸\", \"姻\", \"帆\", \"序\", \"想\", \"庚\", \"鲱\", \"摹\", \"龄\", \"挲\", \"孤\", \"馈\", \"嗔\", \"劲\", \"遁\", \"呆\", \"璨\", \"变\", \"谅\", \"戳\", \"腐\", \"虚\", \"隧\", \"焊\", \"创\", \"淇\", \"蚯\", \"鹌\", \"侨\", \"诩\", \"岩\", \"恳\", \"碎\", \"淡\", \"掂\", \"允\", \"料\", \"尤\", \"敢\", \"忱\", \"幼\", \"掰\", \"樯\", \"窄\", \"来\", \"淀\", \"换\", \"祛\", \"凑\", \"喘\", \"急\", \"蚁\", \"妆\", \"恭\", \"眼\", \"吕\", \"s\", \"鹜\", \"瓢\", \"施\", \"琼\", \"篢\", \"解\", \"悖\", \"齿\", \"字\", \"尉\", \"佝\", \"匪\", \"哨\", \"讪\", \"叭\", \"幢\", \"易\", \"拗\", \"唆\", \"胎\", \"悼\", \"涩\", \"墒\", \"粤\", \"祷\", \"耙\", \"疵\", \"雪\", \"妊\", \"锦\", \"踏\", \"擞\", \"嵌\", \"厄\", \"封\", \"什\", \"撅\", \"将\", \"萧\", \"柳\", \"铄\", \"呗\", \"娛\", \"砥\", \"洞\", \"设\", \"冠\", \"俨\", \"帮\", \"歪\", \"密\", \"莘\", \"笑\", \"黄\", \"旦\", \"嘭\", \"洒\", \"浇\", \"N\", \"卫\", \"镍\", \"搞\", \"茵\", \"昌\", \"霞\", \"暹\", \"吆\", \"狩\", \"噼\", \"龟\", \"砍\", \"停\", \"求\", \"肋\", \"鹏\", \"丧\", \"片\", \"潢\", \"沮\", \"形\", \"咨\", \"捞\", \"飚\", \"钊\", \"贾\", \"义\", \"电\", \"扳\", \"冈\", \"暄\", \"蛮\", \"瑶\", \"蝇\", \"驴\", \"捐\", \"燕\", \"牙\", \"亏\", \"M\", \"企\", \"兼\", \"攸\", \"雅\", \"鸡\", \"拙\", \"懊\", \"煲\", \"疏\", \"泽\", \"楠\", \"蓬\", \"沪\", \"车\", \"骄\", \"抡\", \"岣\", \"胡\", \"添\", \"按\", \"鉴\", \"简\", \"炙\", \"织\", \"嗡\", \"铭\", \"仆\", \"箔\", \"该\", \"脐\", \"梧\", \"释\", \"凡\", \"霏\", \"赢\", \"塔\", \"耐\", \"默\", \"V\", \"迎\", \"T\", \"乎\", \"荣\", \"跨\", \"毫\", \"扼\", \"敛\", \"革\", \"韬\", \"乘\", \"缪\", \"工\", \"蔡\", \"⒋\", \"爻\", \"景\", \"胳\", \"距\", \"轼\", \"莞\", \"完\", \"桦\", \"造\", \"紊\", \"價\", \"乖\", \"括\", \"谚\", \"说\", \"既\", \"改\", \"辑\", \"哈\", \"赘\", \"咳\", \"墅\", \"逶\", \"长\", \"雕\", \"逗\", \"鲜\", \"沈\", \"唠\", \"並\", \"胫\", \"昆\", \"问\", \"钓\", \"肖\", \"弦\", \"糕\", \"吃\", \"霓\", \"库\", \"俘\", \"嫂\", \"悍\", \"软\", \"邯\", \"蟑\", \"袖\", \"蟋\", \"卻\", \"晗\", \"染\", \"污\", \"驼\", \"膝\", \"逞\", \"郅\", \"抠\", \"庶\", \"枪\", \"芜\", \"弧\", \"锒\", \"檐\", \"曦\", \"柱\", \"鹦\", \"曹\", \"奠\", \"柄\", \"怵\", \"朗\", \"睽\", \"悬\", \"垮\", \"塌\", \"裸\", \"打\", \"栩\", \"陌\", \"寂\", \"邮\", \"\\b\", \"往\", \"虫\", \"并\", \"乒\", \"灰\", \"屉\", \"芽\", \"涯\", \"猬\", \"苍\", \"D\", \"呜\", \"怒\", \"梅\", \"怖\", \"杨\", \"挚\", \"炎\", \"油\", \"申\", \"边\", \"刺\", \"锅\", \"掬\", \"睦\", \"欠\", \"牖\", \"峡\", \"秽\", \"缠\", \"ὐ\", \"娑\", \"泄\", \"彩\", \"析\", \"毙\", \"俗\", \"入\", \"模\", \"瞰\", \"n\", \"暂\", \"吾\", \"尬\", \"杭\", \"诟\", \"羔\", \"术\", \"眨\", \"翘\", \"玲\", \"樊\", \"埔\", \"唬\", \"诃\", \"又\", \"泳\", \"惕\", \"异\", \"哀\", \"琐\", \"珏\", \"躬\", \"窍\", \"控\", \"条\", \"趟\", \"湖\", \"晋\", \"谴\", \"屹\", \"撸\", \"草\", \"潮\", \"带\", \"吊\", \"励\", \"怔\", \"饲\", \"闪\", \"浞\", \"负\", \"杜\", \"粼\", \"现\", \"滤\", \"历\", \"憨\", \"贮\", \"导\", \"费\", \"缸\", \"哼\", \"吼\", \"唐\", \"表\", \"蛛\", \"胚\", \"势\", \"供\", \"谢\", \"开\", \"猾\", \"纺\", \"惺\", \"当\", \"抓\", \"孽\", \"浦\", \"〝\", \"桢\", \"啦\", \"担\", \"诞\", \"绵\", \"陷\", \"\", \"裳\", \"麦\", \"ό\", \"浓\", \"晦\", \"络\", \"忽\", \"墓\", \"劫\", \"採\", \"陵\", \"剐\", \"支\", \"住\", \"隘\", \"壳\", \"燎\", \"漱\", \"唷\", \"蜥\", \"凭\", \"猎\", \"屁\", \"巧\", \"逃\", \"促\", \"隶\", \"茅\", \"歼\", \"传\", \"莫\", \"籽\", \"徐\", \"荐\", \"云\", \"阻\", \"弄\", \"胁\", \"渲\", \"嘛\", \"臼\", \"佛\", \"范\", \"玩\", \"扩\", \"衔\", \"摒\", \"猡\", \"败\", \"慕\", \"舛\", \"港\", \"膳\", \"饽\", \"瘠\", \"ê\", \"肮\", \"揭\", \"丁\", \"撤\", \"妥\", \"纯\", \"葛\", \"柬\", \"植\", \"穗\", \"馅\", \"宝\", \"咆\", \"惮\", \"伸\", \"焰\", \"⑷\", \"厢\", \"枯\", \"斑\", \"殷\", \"栗\", \"谛\", \"蔓\", \"阱\", \"泯\", \"旖\", \"凉\", \"桂\", \"湛\", \"陈\", \"象\", \"倍\", \"襄\", \"唱\", \"娱\", \"器\", \"韵\", \"征\", \"绽\", \"逐\", \"哎\", \"跟\", \"颠\", \"售\", \"证\", \"o\", \"团\", \"饼\", \"e\", \"寡\", \"宋\", \"彼\", \"巍\", \"径\", \"僵\", \"尖\", \"远\", \"邦\", \"踌\", \"鬓\", \"多\", \"种\", \"盒\", \"进\", \"烤\", \"闾\", \"磕\", \"闻\", \"旎\", \"蔽\", \"睁\", \"颧\", \"各\", \"饮\", \"酌\", \"辜\", \"颐\", \"龙\", \"乱\", \"环\", \"筐\", \"恃\", \"〃\", \"迪\", \"鸣\", \"华\", \"板\", \"媛\", \"缮\", \"丝\", \"掷\", \"惬\", \"拘\", \"ㄓ\", \"垒\", \"唾\", \"估\", \"馁\", \"橙\", \"夷\", \"墙\", \"粗\", \"汽\", \"梨\", \"每\", \"虽\", \"郸\", \"众\", \"邑\", \"衬\", \"敌\", \"朋\", \"视\", \"笼\", \"蜿\", \"淅\", \"亦\", \"∶\", \"研\", \"孀\", \"咔\", \"驻\", \"今\", \"悴\", \"筒\", \"袒\", \"辄\", \"死\", \"崇\", \"果\", \"峙\", \"搡\", \"精\", \"運\", \"双\", \"毗\", \"禽\", \"皆\", \"灵\", \"犀\", \"脏\", \"郜\", \"撕\", \"典\", \"旺\", \"危\", \"蚂\", \"蜂\", \"棱\", \"营\", \"孟\", \"祖\", \"复\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/fr": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1540504,
"_n_tokens": 484075,
"_n_chars": 1484970,
"_n_oov_chars": 66759,
"oov_ratio": 0.04495646376694479,
"_oov_charset": "[\"ë\", \"î\", \"D\", \"R\", \"S\", \"È\", \"ô\", \"\", \"̧\", \"\", \"Ê\", \"à\", \"W\", \"🙂\", \"Z\", \"😀\", \"♕\", \"℃\", \"V\", \"❤\", \"̂\", \"́\", \"U\", \"😉\", \"À\", \"J\", \"ü\", \"H\", \"
\", \"ê\", \"Ç\", \"K\", \"N\", \"C\", \"É\", \"🤔\", \"Ô\", \"è\", \"é\", \"A\", \"ï\", \"Y\", \"�\", \"ã\", \"í\", \"M\", \"â\", \"û\", \"F\", \"Q\", \"L\", \"I\", \"ç\", \"T\", \"P\", \"O\", \"B\", \"G\", \"ù\", \"X\", \"ğ\", \"Â\", \"ä\", \"E\", \"Î\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/es": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1664455,
"_n_tokens": 538042,
"_n_chars": 1630297,
"_n_oov_chars": 68333,
"oov_ratio": 0.041914448717012914,
"_oov_charset": "[\"D\", \"\", \"S\", \"R\", \"▷\", \"\", \"\", \"ô\", \"😦\", \"🙁\", \"\", \"à\", \"W\", \"ñ\", \"Á\", \"🙂\", \"Z\", \"😀\", \"V\", \"❤\", \"️\", \"U\", \"😉\", \"Ó\", \"✪\", \"✖\", \"J\", \"ü\", \"ö\", \"H\", \"✔\", \"K\", \"N\", \"C\", \"É\", \"ò\", \"á\", \"Y\", \"A\", \"é\", \"è\", \"М\", \"ó\", \"í\", \"M\", \"✓\", \"ú\", \"F\", \"Q\", \"L\", \"Ñ\", \"Ú\", \"I\", \"👏\", \"ý\", \"👍\", \"T\", \"P\", \"O\", \"B\", \"G\", \"\", \"X\", \"Í\", \"E\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/en": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1124813,
"_n_tokens": 280104,
"_n_chars": 1121360,
"_n_oov_chars": 136,
"oov_ratio": 0.00012128130127702077,
"_oov_charset": "[\"⑦\", \"😥\", \"\", \"{\", \"\", \"~\", \"…\", \"‑\", \"ñ\", \"🙂\", \"´\", \"⑧\", \"😉\", \"^\", \"}\", \"¡\", \"�\", \"¦\", \"ï\", \"\", \"⑤\", \"\", \"⑩\", \"③\", \"<\", \"\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/zh-Hans": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2633047,
"_n_tokens": 163519,
"_n_chars": 927311,
"_n_oov_chars": 865446,
"oov_ratio": 0.9332855967415462,
"_oov_charset": "[\"搅\", \"千\", \"太\", \"稻\", \"缕\", \"膨\", \"星\", \"杆\", \"痕\", \"抽\", \"滓\", \"办\", \"淋\", \"址\", \"郊\", \"霸\", \"墟\", \"惹\", \"先\", \"沥\", \"构\", \"徨\", \"恒\", \"著\", \"狈\", \"都\", \"戢\", \"竭\", \"畜\", \"擂\", \"吗\", \"奸\", \"壮\", \"α\", \"伟\", \"东\", \"政\", \"蕴\", \"羁\", \"ě\", \"射\", \"咏\", \"撒\", \"蕾\", \"窃\", \"倩\", \"劑\", \"腾\", \"突\", \"等\", \"犹\", \"嗯\", \"渺\", \"龚\", \"愤\", \"赚\", \"矮\", \"股\", \"~\", \"知\", \"擦\", \"伪\", \"罕\", \"甚\", \"掏\", \"遢\", \"李\", \"跷\", \"手\", \"簿\", \"赴\", \"者\", \"猴\", \"障\", \"俯\", \"客\", \"擅\", \"程\", \"宸\", \"款\", \"褒\", \"腺\", \"续\", \"迈\", \"哄\", \"涌\", \"骸\", \"路\", \"谐\", \"茎\", \"睡\", \"晨\", \"嫁\", \"庞\", \"跻\", \"苹\", \"衰\", \"脾\", \"》\", \"圜\", \"讼\", \"揪\", \"钦\", \"嫉\", \"壹\", \"承\", \"婆\", \"饶\", \"搬\", \"澎\", \"箭\", \"防\", \"几\", \"泛\", \"溪\", \"9\", \"弃\", \"骑\", \"堤\", \"鹃\", \"槌\", \"唇\", \"刃\", \"瑧\", \"捺\", \"铤\", \"鄂\", \"丰\", \"宜\", \"需\", \"阶\", \"懈\", \"戏\", \"妻\", \"踝\", \"冷\", \"睑\", \"昵\", \"眯\", \"薇\", \"闷\", \"晓\", \"冽\", \"像\", \"渥\", \"追\", \"寇\", \"注\", \"怯\", \"烫\", \"怂\", \"矿\", \"〉\", \"轶\", \"咬\", \"【\", \"也\", \"咒\", \"肃\", \"镇\", \"』\", \"独\", \"绩\", \"帅\", \"偌\", \"铜\", \"例\", \"▪\", \"迅\", \"足\", \"悠\", \"守\", \"澄\", \"炖\", \"粹\", \"稳\", \"铺\", \"牡\", \"灌\", \"闯\", \"属\", \"黎\", \"陆\", \"帜\", \"衿\", \"咙\", \"绥\", \"1\", \"如\", \"腻\", \"②\", \"画\", \"堡\", \"猜\", \"凹\", \"抵\", \"祟\", \"纠\", \"逢\", \"〞\", \"蹒\", \"丢\", \"试\", \"诈\", \"弩\", \"鳃\", \"餐\", \"{\", \"批\", \"遭\", \"叔\", \"观\", \"叶\", \"铨\", \"姬\", \"绰\", \"五\", \"踩\", \"屡\", \"宇\", \"衍\", \"铂\", \"秒\", \"⒌\", \"姜\", \"给\", \"垃\", \"棵\", \"瞳\", \"捂\", \"层\", \"愿\", \"瓦\", \"蒋\", \"位\", \"葵\", \"佰\", \"玖\", \"温\", \"闭\", \"殊\", \"跑\", \"睹\", \"狰\", \"族\", \"肝\", \"铃\", \"暴\", \"尴\", \"饷\", \"桐\", \"胶\", \"臊\", \"尘\", \"裔\", \"肓\", \"阐\", \"赎\", \"落\", \"碱\", \"使\", \"劈\", \"叹\", \"扁\", \"评\", \"险\", \"冶\", \"鲎\", \"悯\", \"痰\", \"女\", \"穷\", \"筹\", \"苯\", \"捆\", \"航\", \"紫\", \"髦\", \"短\", \"郴\", \"挥\", \"嘘\", \"抨\", \"嘉\", \"嚎\", \"烊\", \"挝\", \"美\", \"滢\", \"衫\", \"融\", \"砺\", \"鞭\", \"霹\", \"赋\", \"泸\", \"逍\", \"镕\", \"夕\", \"拇\", \"姓\", \"ズ\", \"�\", \"傲\", \"督\", \"晾\", \"颇\", \"啃\", \"斜\", \"犁\", \"襟\", \"蓦\", \"羡\", \"丘\", \"仗\", \"怨\", \"吠\", \"凛\", \"惊\", \"佐\", \"漓\", \"遴\", \"笨\", \"件\", \"跳\", \"无\", \"\", \"男\", \"摩\", \"秉\", \"莲\", \"绕\", \"孩\", \"汕\", \"魔\", \"驾\", \"啕\", \"旌\", \"炫\", \"蚌\", \"昏\", \"偿\", \"剩\", \"佼\", \"咸\", \"蒿\", \"前\", \"確\", \"旆\", \"泌\", \"菜\", \"摄\", \"格\", \"璀\", \"图\", \"勇\", \"憾\", \"诲\", \"销\", \"决\", \"谱\", \"仰\", \"必\", \"侧\", \"赁\", \"诅\", \"授\", \"電\", \"借\", \"臂\", \"消\", \"低\", \"帖\", \"粉\", \"忌\", \"栏\", \"鱼\", \"仍\", \"肘\", \"相\", \"刁\", \"诺\", \"蹲\", \"情\", \"练\", \"父\", \"喝\", \"粥\", \"厮\", \"恣\", \"毒\", \"线\", \"与\", \"祢\", \"辖\", \"朦\", \"狮\", \"伤\", \"增\", \"裂\", \"杂\", \"氧\", \"馆\", \"泊\", \"踹\", \"坡\", \"顷\", \"塘\", \"汀\", \"奈\", \"犰\", \"裙\", \"惴\", \"狞\", \"耶\", \"彬\", \"阵\", \"7\", \"逅\", \"谆\", \"咧\", \"盼\", \"稍\", \"侃\", \"永\", \"食\", \"楂\", \"登\", \"末\", \"漏\", \"涡\", \"匕\", \"歇\", \"蚊\", \"七\", \"夹\", \"胆\", \"誉\", \"俄\", \"趋\", \"汇\", \"泠\", \"肉\", \"盾\", \"扛\", \"墉\", \"碴\", \"闫\", \"苑\", \"噩\", \"记\", \"尚\", \"舶\", \"⑴\", \"滑\", \"方\", \"考\", \"耳\", \"念\", \"捍\", \"鳞\", \"论\", \"徊\", \"砸\", \"零\", \"篇\", \"鞍\", \"疼\", \"弈\", \"抢\", \"君\", \"语\", \"狡\", \"盏\", \"宗\", \"汶\", \"凯\", \"丫\", \"破\", \"师\", \"朱\", \"拣\", \"谓\", \"←\", \"摞\", \"彰\", \"残\", \"山\", \"庄\", \"镶\", \"恿\", \"投\", \"涸\", \"乍\", \"(\", \"疮\", \"信\", \"掠\", \"述\", \"骁\", \"栋\", \"跪\", \"阔\", \"均\", \"褐\", \"瑞\", \"畴\", \"渎\", \"岖\", \"擘\", \"舌\", \"兑\", \"盖\", \"睐\", \"覃\", \"愧\", \"期\", \"瑥\", \"谎\", \"6\", \"皈\", \"滚\", \"×\", \"个\", \"哗\", \"懑\", \"艾\", \"嫖\", \"曰\", \"冲\", \"列\", \"炒\", \"洼\", \"溃\", \"焕\", \"ο\", \"功\", \"快\", \"聘\", \"薛\", \"嫌\", \"津\", \"颊\", \"才\", \"检\", \"皑\", \"莓\", \"藕\", \"徇\", \"剥\", \"裕\", \"笋\", \"敞\", \"原\", \"滞\", \"乞\", \"恤\", \"治\", \"击\", \"憬\", \"涛\", \"瓶\", \"咦\", \"桶\", \"勉\", \"⒁\", \"赠\", \"咎\", \"若\", \"不\", \"迩\", \"聂\", \"钩\", \"濒\", \"t\", \"禾\", \"索\", \"芮\", \"斛\", \"吸\", \"窜\", \"刨\", \"半\", \"齐\", \"娴\", \"暖\", \"喊\", \"撑\", \"缩\", \"舱\", \"妤\", \"碟\", \"且\", \"套\", \"俺\", \"聊\", \"乐\", \"缘\", \"咐\", \"扫\", \"戾\", \"沙\", \"酷\", \"沂\", \"劣\", \"雄\", \"黑\", \"俑\", \"霖\", \"譬\", \"皖\", \"殴\", \"措\", \"雯\", \"恐\", \"芭\", \"归\", \"整\", \"始\", \"引\", \"戸\", \"斗\", \"械\", \"瘤\", \"\", \"囚\", \"雁\", \"毯\", \"⒂\", \"3\", \"奥\", \"獗\", \"勋\", \"致\", \"拿\", \"婊\", \"羊\", \"甘\", \"药\", \"坐\", \"醇\", \"禅\", \"崎\", \"屌\", \"聆\", \"蔚\", \"清\", \"璜\", \"否\", \"频\", \"爷\", \"牌\", \"和\", \"彭\", \"扇\", \"搐\", \"室\", \"受\", \"姨\", \"脯\", \"绣\", \"肤\", \"亳\", \"及\", \"兆\", \"猪\", \"肴\", \"瞥\", \"惭\", \"耸\", \"廖\", \"谜\", \"辉\", \"识\", \"债\", \"违\", \"症\", \"穿\", \"薄\", \"灸\", \"断\", \"森\", \"涎\", \"暑\", \"逑\", \"腿\", \"歉\", \"内\", \"]\", \"痘\", \"瀚\", \"喀\", \"陨\", \"岗\", \"册\", \"愉\", \"生\", \"邱\", \"稚\", \"纷\", \"攀\", \"做\", \"年\", \"钰\", \"玮\", \"卦\", \"汝\", \"翰\", \"谭\", \"眉\", \"亿\", \"爰\", \"噴\", \"公\", \"正\", \"悉\", \"鼻\", \"斤\", \"仔\", \"厚\", \"泻\", \"移\", \"灿\", \"璧\", \"蓄\", \"喉\", \"拎\", \"纾\", \"扒\", \"冤\", \"抚\", \"胜\", \"切\", \"陕\", \"得\", \"杖\", \"撼\", \"骨\", \"堪\", \"聪\", \"毎\", \"董\", \"习\", \"常\", \"奏\", \"棚\", \"垢\", \"刑\", \"气\", \"選\", \"溉\", \"炕\", \"霈\", \"〈\", \"框\", \"震\", \"坷\", \"钝\", \"爱\", \"组\", \"学\", \"头\", \"柚\", \"江\", \"艘\", \"桅\", \"眷\", \"恋\", \"員\", \"伊\", \"塑\", \"闵\", \"掳\", \"节\", \"溺\", \"妇\", \"芙\", \"健\", \"询\", \"脊\", \"霾\", \"4\", \"撩\", \"浪\", \"巳\", \"选\", \"诫\", \"鲨\", \"魇\", \"湘\", \"沿\", \";\", \"祭\", \"束\", \"淫\", \"填\", \"铁\", \"韫\", \"奂\", \"雷\", \"馋\", \"己\", \"昭\", \"章\", \"良\", \"赞\", \"」\", \"霭\", \"吐\", \"合\", \"筑\", \"骤\", \"荡\", \"踪\", \"尺\", \"疲\", \"茫\", \"舅\", \"玫\", \"棒\", \"胰\", \"席\", \"顿\", \"驰\", \"腥\", \"涮\", \"阎\", \"颓\", \"窗\", \"参\", \"茱\", \"俞\", \"樟\", \"枉\", \"匈\", \"泥\", \"杉\", \"汐\", \"瞠\", \"诗\", \"枢\", \"流\", \"晶\", \"留\", \"匹\", \"蹭\", \"遛\", \"卓\", \"偷\", \"偻\", \"璃\", \"贡\", \"琴\", \"汤\", \"淼\", \"免\", \"椅\", \"擎\", \"峻\", \"烛\", \"馒\", \"子\", \"技\", \"枝\", \"円\", \"◆\", \"犯\", \"卧\", \"杠\", \"绅\", \"拉\", \"馕\", \"侠\", \"患\", \"妞\", \"占\", \"哭\", \"牠\", \"更\", \"凶\", \"拍\", \"娶\", \"降\", \"蜜\", \"贬\", \"绍\", \"暨\", \"您\", \"磺\", \"菲\", \"俚\", \"噢\", \"海\", \"拭\", \"阑\", \"岌\", \"仙\", \"酸\", \"医\", \"為\", \"⑩\", \"兵\", \"缆\", \"升\", \"采\", \"堕\", \"黩\", \"挡\", \"炼\", \"员\", \"傅\", \"\", \"娃\", \"颌\", \"宠\", \"王\", \"逸\", \"皿\", \"恩\", \"驶\", \"蝌\", \"际\", \"僧\", \"葱\", \"眠\", \"捷\", \"喔\", \"ト\", \"迤\", \"弓\", \"花\", \"害\", \"献\", \"屋\", \"隐\", \"铩\", \"烟\", \"培\", \"角\", \"宪\", \"成\", \"爸\", \"婉\", \"屄\", \"膛\", \"發\", \"鞠\", \"臻\", \"由\", \"逻\", \"挽\", \"锡\", \"攫\", \"炅\", \"癌\", \"铮\", \"谬\", \"岁\", \"娥\", \"砂\", \"琅\", \"涝\", \"芝\", \"祸\", \"[\", \"覆\", \"怠\", \"窟\", \"煜\", \"犟\", \"芃\", \"糯\", \"蹊\", \"重\", \"の\", \"萍\", \"招\", \"標\", \"胥\", \"呐\", \"殆\", \"③\", \"缅\", \"蒜\", \"崽\", \"傥\", \"市\", \"飙\", \"绳\", \"愁\", \"阮\", \"亟\", \"坟\", \"诬\", \"掩\", \"仕\", \"疙\", \"获\", \"演\", \"扔\", \"厅\", \"埃\", \"翱\", \"刷\", \"城\", \"篱\", \"鲸\", \"渐\", \"岭\", \"援\", \"光\", \"虐\", \"灑\", \"-\", \"北\", \"楣\", \"却\", \"芯\", \"锣\", \"代\", \"嬉\", \"农\", \"洪\", \"差\", \"}\", \"处\", \"囤\", \"耀\", \"▲\", \"佣\", \"汁\", \"鸭\", \"放\", \"坛\", \"慮\", \"乔\", \"衣\", \"鹕\", \"讷\", \"柔\", \"最\", \"踢\", \"挠\", \"踞\", \"蜀\", \"根\", \"噬\", \"鼯\", \"散\", \"郎\", \"髻\", \"傍\", \"掀\", \"坝\", \"嗲\", \"凄\", \"肾\", \"闸\", \"跃\", \"萦\", \"i\", \"貌\", \"壓\", \"缭\", \"匿\", \"飕\", \"这\", \"监\", \"弹\", \"吨\", \"嘲\", \"样\", \"巫\", \"补\", \"恶\", \"懒\", \"陋\", \"听\", \"俊\", \"黯\", \"亚\", \"尝\", \"淆\", \"焉\", \"煎\", \"骅\", \"衷\", \"钧\", \"棣\", \"似\", \"收\", \"颁\", \"抗\", \"茶\", \"九\", \"锏\", \"铎\", \"翕\", \"爪\", \"链\", \"闺\", \"挪\", \"岔\", \"噱\", \"袍\", \"劝\", \"锁\", \"肌\", \"吁\", \"辰\", \"到\", \"寻\", \"黔\", \"褚\", \"槿\", \"周\", \"究\", \"大\", \"裆\", \"理\", \"嘴\", \"撰\", \"较\", \"积\", \"莉\", \"税\", \"赤\", \"蘑\", \"巅\", \"愈\", \"录\", \"飞\", \"自\", \"瑜\", \"泣\", \"瑰\", \"镐\", \"讽\", \"浮\", \"別\", \"谋\", \"茨\", \"宛\", \"贝\", \"沉\", \"倏\", \"翔\", \"蝶\", \"灼\", \"谦\", \"廊\", \"键\", \"液\", \"旗\", \"辫\", \"六\", \"瓜\", \"色\", \"啬\", \"希\", \"寨\", \"挖\", \"码\", \"他\", \"疹\", \"老\", \"诊\", \"槛\", \"饿\", \"汛\", \"卵\", \"菩\", \"觉\", \"村\", \"蔬\", \"煽\", \"割\", \"绸\", \"鸿\", \"豚\", \"螃\", \"日\", \"贯\", \"侦\", \"堵\", \"亭\", \"符\", \"座\", \"旧\", \"醛\", \"內\", \"5\", \"拂\", \"菌\", \"遏\", \"随\", \"刹\", \"怜\", \"<\", \"膊\", \"滥\", \"涣\", \"吧\", \"庆\", \"圩\", \"魏\", \"骏\", \"未\", \"派\", \"辙\", \"坤\", \"攒\", \"漉\", \"珉\", \"炮\", \"寐\", \"掺\", \"秩\", \"乃\", \"韦\", \"峭\", \"桓\", \"町\", \"哪\", \"满\", \"唤\", \"洽\", \"钮\", \"卿\", \"咖\", \"姚\", \"渤\", \"汪\", \"悟\", \"報\", \"吵\", \"窿\", \"御\", \"弛\", \"凤\", \"狗\", \"蹈\", \"ς\", \"琉\", \"畑\", \"速\", \"块\", \"讦\", \"容\", \"漪\", \"宵\", \"察\", \"『\", \"躯\", \"诱\", \"弑\", \"猛\", \"社\", \"泼\", \"渝\", \"阽\", \"帝\", \"戍\", \"黏\", \"中\", \"剁\", \"峰\", \"罪\", \"宴\", \"杀\", \"把\", \"拢\", \"皱\", \"兹\", \"街\", \"渗\", \"指\", \"颖\", \"刊\", \"狭\", \"─\", \"逮\", \"榴\", \"疴\", \"酱\", \"厘\", \"①\", \"插\", \"烬\", \"纨\", \"略\", \"r\", \"资\", \"省\", \"函\", \"噌\", \"而\", \"奶\", \"茧\", \"強\", \"拓\", \"彤\", \"恕\", \"坦\", \"约\", \"蒸\", \"竺\", \"吩\", \"笆\", \"烁\", \"烷\", \"跤\", \"揣\", \"簇\", \"鹭\", \"撬\", \"娅\", \"滨\", \"勖\", \"钜\", \"庸\", \"洋\", \"沦\", \"哉\", \"卜\", \"雇\", \"础\", \"棉\", \"婚\", \"尾\", \"陶\", \"规\", \"邻\", \"适\", \"瞻\", \"静\", \"排\", \"盯\", \"联\", \"膀\", \"霜\", \"榨\", \"次\", \"镜\", \"忘\", \"胞\", \"璇\", \"疸\", \"球\", \"贴\", \"蛔\", \"庐\", \"谑\", \"践\", \"抖\", \"混\", \"栽\", \"寥\", \"吏\", \"恙\", \"鼠\", \"拔\", \"郁\", \"谷\", \"庭\", \"书\", \"兰\", \"亡\", \"炳\", \"滋\", \"柏\", \"战\", \"澜\", \"史\", \"金\", \"欢\", \"钱\", \"摘\", \"溢\", \"吴\", \"陀\", \"熔\", \"聒\", \"扬\", \"趾\", \"婶\", \"挺\", \"姣\", \"态\", \"绘\", \"烹\", \"V\", \"季\", \"恪\", \"矢\", \"舰\", \"熄\", \"厉\", \"狐\", \"偏\", \"耻\", \"蔷\", \"择\", \"暇\", \"数\", \"激\", \"诵\", \"徘\", \"呵\", \"罹\", \"饰\", \"秘\", \"腑\", \"礼\", \"瓣\", \"宣\", \"懂\", \"耽\", \"徳\", \"量\", \"依\", \"疯\", \"篮\", \"痹\", \"柘\", \"呷\", \"科\", \"讲\", \"舐\", \"莺\", \"朽\", \"讳\", \"结\", \"翩\", \"牺\", \"智\", \"虎\", \"權\", \"伦\", \"漫\", \"候\", \"拱\", \"珠\", \"舵\", \"签\", \"倜\", \"髓\", \"沾\", \"湿\", \"蓁\", \"厨\", \"咽\", \"躁\", \"茸\", \"点\", \"卤\", \"勘\", \"锌\", \"嘣\", \"攥\", \"详\", \"瑕\", \"蛊\", \"巡\", \"桌\", \"嘱\", \"摧\", \"西\", \"池\", \"浠\", \"稠\", \"号\", \"判\", \"难\", \"哦\", \"欺\", \"霍\", \"谔\", \"腔\", \"撷\", \"虏\", \"蚀\", \"⑧\", \"夭\", \"瀛\", \"屏\", \"翊\", \"敝\", \"漩\", \"礁\", \"箍\", \"在\", \"铝\", \"邸\", \"辨\", \"漆\", \"秋\", \"蹿\", \"鹑\", \"動\", \"玻\", \"轿\", \"抛\", \"央\", \"啐\", \"沃\", \"谧\", \"寰\", \"坊\", \"哲\", \"夺\", \"罚\", \"古\", \"概\", \"纹\", \"巩\", \"秃\", \"胧\", \"惜\", \"凸\", \"殖\", \"艇\", \"烦\", \",\", \"诨\", \"渍\", \"剧\", \"浸\", \"关\", \"丐\", \"坞\", \"壁\", \"曼\", \"看\", \"斌\", \"跋\", \"沸\", \"槃\", \"畿\", \"瘦\", \"彙\", \"燃\", \"後\", \"用\", \"纵\", \"严\", \"夸\", \"。\", \"寅\", \"帕\", \"贱\", \"徽\", \"玷\", \"倒\", \"冥\", \"厂\", \"邓\", \"纬\", \"迭\", \"幽\", \"荫\", \"τ\", \"弟\", \"霆\", \"崔\", \"绊\", \"硅\", \"撇\", \"橇\", \"呦\", \"嚣\", \"飓\", \"姆\", \"耦\", \"摔\", \"粱\", \"裴\", \"茂\", \"绚\", \"遣\", \"赵\", \"⒃\", \"基\", \"妖\", \"旅\", \"群\", \"驳\", \"挟\", \"第\", \"剔\", \"洁\", \"篝\", \"浩\", \"沐\", \"皂\", \"豪\", \"瞪\", \"啜\", \"溅\", \"雨\", \"居\", \"趣\", \"棘\", \"眶\", \"但\", \"・\", \"拳\", \"舞\", \"糖\", \"莎\", \"澳\", \"媚\", \"伴\", \"幸\", \"聿\", \"火\", \"挨\", \"锚\", \"两\", \"配\", \"砾\", \"枚\", \"蓉\", \"你\", \"找\", \"通\", \"渡\", \"芳\", \"帐\", \"唉\", \"微\", \"酿\", \"旬\", \"宾\", \"婴\", \"皇\", \"姗\", \"待\", \"后\", \"A\", \"嘈\", \"厌\", \"谈\", \"\\u0005\", \"亮\", \"豁\", \"呕\", \"滇\", \"孱\", \"疗\", \"望\", \"斧\", \"僚\", \"袱\", \"&\", \"沏\", \"圈\", \"戚\", \"以\", \"蕉\", \"荧\", \"骼\", \"催\", \"撐\", \"刮\", \"時\", \"斩\", \"窦\", \"哺\", \"纂\", \"呼\", \"非\", \"秤\", \"迄\", \"协\", \"灶\", \"肚\", \"蒙\", \"鸦\", \"→\", \"汹\", \"橱\", \"伙\", \"助\", \"躲\", \"率\", \"卸\", \"蘸\", \"叨\", \"维\", \"了\", \"机\", \"赖\", \"橄\", \"乳\", \"趴\", \"孰\", \"飘\", \"粟\", \"认\", \"右\", \"媲\", \"亥\", \"_\", \"盗\", \"屠\", \"掖\", \"床\", \"锋\", \"辆\", \"暧\", \"昨\", \"味\", \"盎\", \"凿\", \"累\", \"據\", \"蜃\", \"临\", \"寿\", \"瑨\", \"喆\", \"益\", \"冬\", \"鹿\", \"辣\", \"吝\", \"溯\", \"雀\", \"奢\", \"粕\", \"尧\", \"外\", \"魁\", \"聚\", \"豫\", \"酋\", \"责\", \"货\", \"田\", \"崩\", \"裹\", \"翅\", \"肆\", \"忙\", \"挫\", \"毅\", \"茏\", \"嗓\", \"●\", \"目\", \"妙\", \"炊\", \"砌\", \"准\", \"焯\", \"戛\", \"艋\", \"峥\", \"揍\", \"台\", \"唯\", \"呢\", \"杰\", \"鼓\", \"早\", \"黝\", \"娜\", \"乾\", \"萎\", \"藏\", \"铲\", \"郭\", \"洛\", \"甲\", \"乏\", \"丑\", \"敦\", \"哇\", \" \", \"涕\", \"丙\", \"^\", \"呻\", \"肢\", \"蛙\", \"柴\", \"世\", \"脱\", \"脚\", \"鞋\", \"氏\", \"叼\", \"抿\", \"汉\", \"纱\", \"兔\", \"歌\", \"弯\", \"偎\", \"π\", \"涤\", \"伏\", \"麾\", \"椭\", \"血\", \"鬼\", \"热\", \"臧\", \"溜\", \"扉\", \"嘎\", \"猩\", \"璎\", \"螺\", \"净\", \"憔\", \"焙\", \"疑\", \"剪\", \"缜\", \"显\", \"埂\", \"票\", \"骆\", \"夏\", \"孝\", \"任\", \"户\", \"棂\", \"肥\", \"谩\", \"干\", \"她\", \"※\", \"蝉\", \"濮\", \"班\", \"苗\", \"好\", \"℃\", \"乡\", \"绉\", \"萝\", \"初\", \"拥\", \"堂\", \"肿\", \"执\", \"萄\", \"久\", \"荤\", \"载\", \"刀\", \"醒\", \"幻\", \"诣\", \"连\", \"俩\", \"英\", \"胀\", \"茉\", \"即\", \"於\", \"岛\", \"名\", \"值\", \"嗜\", \"偶\", \"建\", \"沁\", \"绑\", \"勃\", \"搂\", \"屈\", \"麟\", \"韧\", \"叫\", \"卉\", \"钵\", \"牵\", \"喷\", \"躺\", \"便\", \"歹\", \"贤\", \"籁\", \"测\", \"讯\", \"壤\", \"化\", \"赔\", \"延\", \"奔\", \"神\", \"滴\", \"琛\", \"戴\", \"队\", \"空\", \"券\", \"宿\", \"婺\", \"人\", \"颈\", \"匠\", \"孔\", \"请\", \"滕\", \"娼\", \"粮\", \"奎\", \"缓\", \"争\", \"没\", \"瞧\", \"吮\", \"端\", \"籍\", \"锐\", \"乙\", \"颉\", \"嘀\", \"沧\", \"仲\", \"湃\", \"绎\", \"岳\", \"寞\", \"倚\", \"惶\", \"拒\", \"有\", \"h\", \"地\", \"携\", \"预\", \"/\", \"株\", \"振\", \"月\", \"颜\", \"醍\", \"蜕\", \"侯\", \"慨\", \"洲\", \"拨\", \"揖\", \"イ\", \"蜒\", \"别\", \"椎\", \"顽\", \"靴\", \"慷\", \"阁\", \"场\", \"贫\", \"詹\", \"剖\", \"匀\", \"壑\", \"陛\", \"攘\", \"疤\", \"灯\", \"邕\", \"皙\", \"袁\", \"兮\", \"览\", \"济\", \"矣\", \"糊\", \"总\", \"鄯\", \"过\", \"愕\", \"珍\", \"坏\", \"橡\", \"讥\", \"摇\", \"盐\", \"梭\", \"钟\", \"赛\", \"洗\", \"锲\", \"性\", \"彻\", \"辩\", \"箱\", \"音\", \"窒\", \"牲\", \"案\", \"酝\", \"瘾\", \"实\", \"店\", \"贵\", \"惦\", \"甜\", \"波\", \"经\", \"寓\", \"比\", \"嘻\", \"莅\", \"%\", \"鸽\", \"侬\", \"斥\", \"浊\", \"彗\", \"钢\", \"爵\", \"苇\", \"律\", \"朔\", \"番\", \"鹤\", \"馨\", \"潜\", \"架\", \"冯\", \"影\", \"林\", \"奘\", \"涉\", \"啼\", \"棍\", \"威\", \"柑\", \"翁\", \"淳\", \"扰\", \"明\", \"段\", \"廉\", \"氢\", \"颤\", \"作\", \"荒\", \"应\", \"榆\", \"悦\", \"淑\", \"趁\", \"谨\", \"穆\", \"痪\", \"漠\", \"渣\", \"腹\", \"提\", \"僻\", \"页\", \"斯\", \"匆\", \"驮\", \"菱\", \"综\", \"碍\", \"妨\", \"爆\", \"职\", \"睿\", \"槽\", \"闲\", \"巨\", \"昊\", \"界\", \"平\", \"肯\", \"镀\", \"惩\", \"病\", \"拖\", \"纰\", \"肺\", \"舀\", \"姐\", \"挂\", \"掘\", \"熟\", \"柯\", \"假\", \"阴\", \"捅\", \"涟\", \"姥\", \"腋\", \"矗\", \"一\", \"俪\", \"葩\", \"虔\", \"息\", \"孪\", \"渠\", \"繁\", \"石\", \"浴\", \"臀\", \"豹\", \"夥\", \"擀\", \"梗\", \"言\", \"厦\", \"伐\", \"雌\", \"剑\", \"钥\", \"垄\", \"旁\", \"畔\", \"栖\", \"托\", \"拽\", \"袜\", \"艺\", \"堰\", \"拟\", \"般\", \"冒\", \"辽\", \"秦\", \"虑\", \"圆\", \"孙\", \"道\", \"蝗\", \"川\", \"酵\", \"县\", \"窥\", \"婪\", \"羞\", \"+\", \"盲\", \"绪\", \"鼾\", \"沫\", \"讶\", \"搭\", \"楚\", \"嗣\", \"蚓\", \"旱\", \"忐\", \"潘\", \"ヨ\", \"镭\", \"划\", \"觅\", \"郡\", \"屎\", \"倘\", \"牢\", \"弘\", \"絮\", \"定\", \"龇\", \"悔\", \"褪\", \"恰\", \"伯\", \"辞\", \"泉\", \"陡\", \"烯\", \"笛\", \"辕\", \"p\", \"媒\", \"侣\", \"宏\", \"剂\", \"锥\", \"附\", \"⑨\", \"\", \"确\", \"雏\", \"惋\", \"弱\", \"宽\", \"握\", \"瘫\", \"恨\", \"贼\", \"噪\", \"Ø\", \"晒\", \"保\", \"兢\", \"蹄\", \"教\", \"管\", \"编\", \"摸\", \"涂\", \"荏\", \"仇\", \"枷\", \"★\", \"畏\", \"勿\", \"埠\", \"近\", \"锻\", \"泱\", \"栈\", \"慑\", \"秸\", \"倨\", \"爹\", \"愚\", \"鹉\", \"剽\", \"质\", \"咯\", \"邪\", \"仁\", \"⒀\", \"盆\", \"须\", \"荟\", \"牧\", \"梦\", \"阀\", \"文\", \"查\", \"操\", \"勒\", \"背\", \"拼\", \"倡\", \"左\", \"奋\", \"岑\", \"遮\", \"锢\", \"垠\", \"脑\", \"褂\", \"蜘\", \"伉\", \"酪\", \"深\", \"权\", \"萌\", \"坪\", \"谁\", \"沽\", \"钞\", \"甫\", \"痒\", \"邢\", \"竹\", \"浙\", \"全\", \"葡\", \"度\", \"佟\", \"煮\", \"0\", \"虹\", \"忆\", \"砖\", \"賣\", \"氰\", \"野\", \"告\", \"渴\", \"抬\", \"坠\", \"淄\", \"庙\", \"绛\", \"寸\", \"薰\", \"型\", \"盟\", \"卷\", \"逊\", \"咕\", \"帘\", \"贩\", \"童\", \"曳\", \"遗\", \"敬\", \"于\", \"呀\", \"宫\", \"啤\", \"赶\", \"耘\", \"捧\", \"邬\", \"峨\", \"佳\", \"崖\", \"署\", \"舎\", \"针\", \"惚\", \"蕤\", \"印\", \"撞\", \"德\", \"儒\", \"挑\", \"硬\", \"烧\", \"装\", \"茜\", \"碑\", \"儿\", \"诧\", \"肪\", \"因\", \"据\", \"螂\", \"糠\", \"惰\", \"埋\", \"价\", \"瞎\", \"叛\", \"捕\", \"遍\", \"卑\", \"为\", \"毡\", \"吉\", \"嚼\", \"癜\", \"抒\", \"俱\", \"声\", \"润\", \"局\", \"韩\", \"袋\", \"蜡\", \"叠\", \"刚\", \"然\", \"莴\", \"尸\", \"甩\", \"恼\", \"徙\", \"憋\", \"捏\", \"】\", \"苒\", \"真\", \"妃\", \"咱\", \"芋\", \"檬\", \"鳗\", \"抉\", \"越\", \"抹\", \"倾\", \"仑\", \"冻\", \"校\", \"欣\", \"遇\", \"扎\", \"院\", \"缈\", \"厥\", \"晰\", \"粘\", \"噶\", \"隋\", \"玄\", \"返\", \"藐\", \"咪\", \"菁\", \"巢\", \"麽\", \"羚\", \"喇\", \"肇\", \"夜\", \"阪\", \"號\", \"卖\", \"逝\", \"骛\", \"弗\", \"奴\", \"\", \"夫\", \"惑\", \"红\", \"畸\", \"萃\", \"站\", \"圭\", \"广\", \"膏\", \"盈\", \"循\", \"陇\", \"熏\", \"揽\", \"牒\", \"岸\", \"吻\", \"穹\", \"稽\", \"郑\", \"迫\", \"魅\", \")\", \"奖\", \"祥\", \"瘩\", \"昂\", \"脆\", \"玉\", \"冉\", \"喜\", \"对\", \"遐\", \"睫\", \"廷\", \"可\", \"挤\", \"露\", \"诡\", \"很\", \"答\", \"梁\", \"壶\", \"鸠\", \"河\", \"匾\", \"细\", \"缝\", \"懵\", \"喧\", \"蓟\", \"萼\", \"淘\", \"终\", \"梵\", \"靠\", \"臣\", \"吱\", \"豌\", \"嘤\", \"嵘\", \"立\", \"秀\", \"醐\", \"猫\", \"罩\", \"分\", \"灾\", \"骗\", \"庇\", \"泡\", \"潦\", \"策\", \"烙\", \"翠\", \"阿\", \"猥\", \"苛\", \"描\", \"锂\", \"唏\", \"シ\", \"怪\", \"此\", \"竿\", \"高\", \"芷\", \"卢\", \"捉\", \"缄\", \"靶\", \"档\", \"丹\", \"订\", \"脉\", \"慌\", \"叩\", \"呸\", \"慎\", \"慰\", \"绞\", \"菊\", \"·\", \"淖\", \"驿\", \"犬\", \"购\", \"寒\", \"瘀\", \"碰\", \"砧\", \"酣\", \"湾\", \"圣\", \"馄\", \"甯\", \"汗\", \"狠\", \"⑸\", \"C\", \"凝\", \"帽\", \"擤\", \"尔\", \"翼\", \"祝\", \"黧\", \"翡\", \"至\", \"的\", \"辛\", \"薯\", \"嗦\", \"极\", \"魂\", \"桥\", \"服\", \"邹\", \"妄\", \"旷\", \"瑟\", \"雳\", \"盘\", \"苦\", \"秆\", \"饨\", \"审\", \"⑥\", \"矫\", \"嗨\", \"钻\", \"时\", \"~\", \"昕\", \"暮\", \"掉\", \"所\", \"耿\", \"扣\", \"辱\", \"劾\", \"减\", \"侈\", \"志\", \"俭\", \"?\", \"逆\", \"运\", \"瞟\", \"婷\", \"房\", \"竟\", \"验\", \"骂\", \"芦\", \"饱\", \"播\", \"嗅\", \"桔\", \"域\", \"钉\", \"伫\", \"嚷\", \"蟀\", \"晚\", \"溘\", \"阅\", \"玛\", \"\\\\\", \"吟\", \"巾\", \"荼\", \"掐\", \"楔\", \"畅\", \"瞒\", \"萨\", \"矩\", \"柠\", \"宅\", \"熙\", \"泾\", \"训\", \"荆\", \"黢\", \"同\", \"爬\", \"裘\", \"熨\", \"坂\", \"併\", \"欧\", \"粒\", \"它\", \"惯\", \"喃\", \"○\", \"脸\", \"晤\", \"粽\", \"焦\", \"疆\", \"晴\", \"寄\", \"痫\", \"锈\", \"轻\", \"牟\", \"遂\", \"篡\", \"戒\", \"稀\", \"貂\", \"・\", \"亩\", \"遥\", \"屯\", \"隔\", \"磋\", \"祀\", \"\\u0006\", \"扭\", \"敏\", \"肩\", \"棠\", \"超\", \"霉\", \"园\", \"坚\", \"顾\", \"伍\", \"固\", \"裁\", \"哧\", \"算\", \"匮\", \"欸\", \"臃\", \"碌\", \"梢\", \"百\", \"憧\", \"疚\", \"韪\", \"专\", \"船\", \"刘\", \"苣\", \"困\", \"橘\", \"腓\", \"搏\", \"巴\", \"输\", \"募\", \"耕\", \"醋\", \"奚\", \"徒\", \"纽\", \"介\", \"物\", \"级\", \"享\", \"辈\", \"鸟\", \"敷\", \"布\", \"酥\", \"拐\", \"個\", \"■\", \"词\", \"朝\", \"仅\", \"昧\", \"赏\", \"啊\", \"欲\", \"伺\", \"交\", \"活\", \"胱\", \"惫\", \"单\", \"妒\", \"张\", \"煞\", \"帷\", \"琳\", \"瓷\", \"底\", \"侥\", \"臆\", \"芬\", \"养\", \"葫\", \"彷\", \"篓\", \"特\", \"身\", \"倪\", \"烃\", \"汰\", \"歧\", \"靛\", \"充\", \"围\", \"誓\", \"筝\", \"回\", \"私\", \"娄\", \"烂\", \"则\", \"仓\", \"式\", \"鹰\", \"坎\", \"瑑\", \"狸\", \"炭\", \"胖\", \"沛\", \"报\", \"メ\", \"晖\", \"拜\", \"琢\", \"映\", \"肛\", \"咀\", \"毕\", \"余\", \"摆\", \"赃\", \"狄\", \"响\", \"へ\", \"继\", \"腕\", \"区\", \"惧\", \"再\", \"毁\", \"役\", \"茄\", \"奇\", \"万\", \"甸\", \"莹\", \"状\", \"思\", \"棕\", \"折\", \"蚤\", \"釜\", \"克\", \"乓\", \"荻\", \"虾\", \"冰\", \"骰\", \"置\", \"尼\", \"筋\", \"哮\", \"课\", \"缚\", \"门\", \"诸\", \"勤\", \"储\", \"诙\", \"党\", \"沟\", \"猝\", \"令\", \"尊\", \"姑\", \"簧\", \"疾\", \"柿\", \"慧\", \"楼\", \"仿\", \"喂\", \"8\", \"新\", \"恍\", \"羹\", \"缥\", \"d\", \"喻\", \"浏\", \"恺\", \"账\", \"薩\", \"三\", \"瀑\", \"惘\", \"艳\", \"饭\", \"蓝\", \"持\", \"腊\", \"坯\", \"窖\", \"贸\", \"称\", \"葆\", \"幅\", \"辗\", \"奉\", \"岂\", \"〖\", \"汩\", \"門\", \"吹\", \"壕\", \"游\", \"苟\", \"揉\", \"财\", \"午\", \"柜\", \"兜\", \"辅\", \"访\", \"贺\", \"举\", \"屿\", \"动\", \"亲\", \"顺\", \"饥\", \"宙\", \"栅\", \"艰\", \"迟\", \"炬\", \"〔\", \"赂\", \"孕\", \"靖\", \"替\", \"罄\", \"限\", \"途\", \"懦\", \"会\", \"读\", \"源\", \"巷\", \"下\", \"轰\", \"府\", \"照\", \"怡\", \"癫\", \"走\", \"鞘\", \"缉\", \"呛\", \"衅\", \"囊\", \"起\", \"隆\", \"筛\", \"迹\", \"啪\", \"氛\", \"兴\", \"損\", \"镏\", \"鲤\", \"毛\", \"哑\", \"淤\", \"磊\", \"痊\", \"劳\", \"託\", \"剿\", \"翻\", \"浚\", \"衡\", \"贷\", \"瘙\", \"母\", \"颗\", \"谀\", \"妍\", \"推\", \"粪\", \"除\", \"贪\", \"挈\", \"昔\", \"拷\", \"勾\", \"鑫\", \"白\", \"镉\", \"⑶\", \"竖\", \"旋\", \"鲍\", \"够\", \"罗\", \"掌\", \"矶\", \"舟\", \"披\", \"犷\", \"凌\", \"罐\", \"寺\", \"跌\", \"瞩\", \"幕\", \"家\", \"启\", \"妹\", \"转\", \"努\", \"蟹\", \"挎\", \"纸\", \"嘟\", \"嗪\", \"嗤\", \"忑\", \"孜\", \"事\", \"婿\", \"旳\", \"杯\", \"尿\", \"斐\", \"墨\", \"浆\", \"佬\", \"铣\", \"弊\", \"送\", \"要\", \"狙\", \"福\", \"珊\", \"拯\", \"丛\", \"瞅\", \"体\", \"傻\", \" \", \"蛇\", \"敖\", \"狳\", \"删\", \"榷\", \"绒\", \"镑\", \"发\", \"蹦\", \"呃\", \"\\u0007\", \"枣\", \"素\", \"網\", \"桃\", \""\", \"寝\", \"只\", \"淮\", \"愣\", \"苏\", \"饵\", \"土\", \"舆\", \"风\", \"颂\", \"哥\", \"乌\", \"佘\", \"朴\", \"晃\", \"抑\", \"利\", \"抄\", \"泪\", \"休\", \"湮\", \"陪\", \"递\", \"垣\", \"泵\", \"蕃\", \"崛\", \"存\", \"淹\", \"悚\", \"厕\", \"丸\", \"已\", \"扑\", \"截\", \"缺\", \"亵\", \"踱\", \"紧\", \"产\", \"疫\", \"癖\", \"雾\", \"漂\", \"ノ\", \"肠\", \"惨\", \"押\", \"殉\", \"项\", \"厝\", \"修\", \"熊\", \"當\", \"话\", \"桑\", \"系\", \"惟\", \"锄\", \"互\", \"某\", \"许\", \"狂\", \"蒂\", \"竣\", \"樱\", \"计\", \"\", \"珀\", \"盛\", \"份\", \"扶\", \"硕\", \"酒\", \"睬\", \"栓\", \"耗\", \"宁\", \"官\", \"接\", \"触\", \"桩\", \"娩\", \"瑢\", \"感\", \"银\", \"写\", \"贞\", \"裤\", \"缴\", \"炉\", \"勺\", \"《\", \"着\", \"额\", \"弥\", \"澈\", \"井\", \"藤\", \"副\", \"攻\", \"碧\", \"磅\", \"诀\", \"胸\", \"矍\", \"藉\", \"跚\", \"沓\", \"卡\", \"包\", \"榜\", \"南\", \"压\", \"达\", \"珞\", \"蜴\", \"就\", \"取\", \"哟\", \"谣\", \"兽\", \"爽\", \"膜\", \"轨\", \"浅\", \"稿\", \"冀\", \"避\", \"仄\", \"领\", \"彦\", \"茁\", \"嫩\", \"硫\", \"⑤\", \"搁\", \"锤\", \"夯\", \"脂\", \"糟\", \"晕\", \"猖\", \"穰\", \"鄙\", \"瞄\", \"吭\", \"或\", \"武\", \"↑\", \"讨\", \"袭\", \"逼\", \"效\", \"葬\", \"忡\", \"救\", \"反\", \"邃\", \"辐\", \"意\", \"铸\", \"统\", \"涵\", \"驭\", \"狼\", \"淞\", \"穴\", \"凰\", \"靓\", \"丈\", \"狱\", \"诉\", \"付\", \"棺\", \"捡\", \"窝\", \"怕\", \"材\", \"忧\", \"赡\", \"骇\", \"蹴\", \"铛\", \"强\", \"共\", \"炸\", \"怎\", \"豆\", \"摊\", \"笔\", \"稣\", \"误\", \"搀\", \"贿\", \"煤\", \"挣\", \"少\", \"抱\", \"蜷\", \"甄\", \"伞\", \"阂\", \"怀\", \"塞\", \"京\", \"烘\", \"郝\", \"氨\", \"尹\", \"姿\", \"蔼\", \"驱\", \"被\", \"纤\", \"削\", \"镳\", \"晟\", \"迦\", \"护\", \"屑\", \"邀\", \"榄\", \"赫\", \"姊\", \"拦\", \"些\", \"!\", \"瑄\", \"去\", \"栾\", \"悲\", \"烈\", \"犄\", \"酬\", \"屣\", \"©\", \"网\", \"步\", \"〕\", \"阳\", \"小\", \"資\", \"另\", \"卍\", \"尽\", \"琪\", \"朵\", \"黛\", \"惠\", \"\\u0000\", \"诚\", \"羽\", \"么\", \"横\", \"榭\", \"吞\", \"叙\", \"旨\", \"遑\", \"ソ\", \"邂\", \"元\", \"佩\", \"轮\", \"牛\", \"侍\", \"咚\", \"霄\", \"纪\", \"岚\", \"亂\", \"祉\", \"琶\", \"脖\", \"瞬\", \"司\", \"漲\", \"\", \"梳\", \"咋\", \"炝\", \"「\", \"骚\", \"磨\", \"隙\", \"痴\", \"间\", \"品\", \"眩\", \"溶\", \"彪\", \"废\", \"标\", \"殿\", \"煌\", \"腱\", \"耍\", \"杏\", \"觑\", \"啥\", \"谍\", \"澡\", \"是\", \"胺\", \"斋\", \"二\", \"禁\", \"召\", \"邵\", \"届\", \"篷\", \"胃\", \"其\", \"暗\", \"悄\", \"予\", \"康\", \"纲\", \"绷\", \"榻\", \"呈\", \"虞\", \"哒\", \"侄\", \"辟\", \"侵\", \"舔\", \"荨\", \"曝\", \"潭\", \"绿\", \"泰\", \"租\", \"契\", \"那\", \"鳌\", \"邋\", \"燥\", \"行\", \"碾\", \"宰\", \"禧\", \"坑\", \"拾\", \"币\", \"楷\", \"⑦\", \"叉\", \"舒\", \"调\", \"仪\", \"句\", \"纳\", \"译\", \"萤\", \"喱\", \"渊\", \"戈\", \"阜\", \"梯\", \"鹅\", \"焚\", \"吓\", \"损\", \"眺\", \"潇\", \"拧\", \"侮\", \"善\", \"曾\", \"核\", \"失\", \"氯\", \"议\", \"首\", \"筷\", \"曙\", \"磁\", \"淌\", \"兄\", \"诠\", \"鸥\", \"2\", \"何\", \"琦\", \"鬣\", \"离\", \"腰\", \"敲\", \"氮\", \"博\", \"普\", \"务\", \"荷\", \"渔\", \"薪\", \"拌\", \"慈\", \"我\", \"竞\", \"歩\", \"馏\", \"命\", \"从\", \"娇\", \"伽\", \"鲁\", \"枕\", \"芹\", \"翌\", \"集\", \"椒\", \"闹\", \"堆\", \"版\", \"警\", \"垂\", \"廓\", \"绝\", \"育\", \"含\", \"霊\", \"靡\", \"旭\", \"圾\", \"口\", \"孵\", \"娟\", \"谊\", \"躇\", \"忪\", \"委\", \"慢\", \"轴\", \"甬\", \"妈\", \"题\", \"富\", \"商\", \"戮\", \"痛\", \"军\", \"蠢\", \"备\", \"逛\", \"玳\", \"缔\", \"直\", \"棋\", \"鹈\", \"札\", \"虱\", \"妮\", \"迷\", \"米\", \"啡\", \"碗\", \"况\", \"楞\", \"罔\", \"禄\", \"扯\", \"制\", \"踵\", \"扪\", \"友\", \"垫\", \"向\", \"境\", \"顶\", \"罢\", \"麓\", \"诶\", \"〗\", \"故\", \"嘿\", \"毋\", \"透\", \"菇\", \"椰\", \"让\", \"沼\", \"岐\", \"蔑\", \"魄\", \"凳\", \"涅\", \"具\", \"展\", \"蹩\", \"恢\", \"妓\", \"舍\", \"心\", \"碳\", \"探\", \"忿\", \"垛\", \"鼎\", \"业\", \"买\", \"赅\", \"搜\", \"蛋\", \"娠\", \"馍\", \"盹\", \"`\", \"瑒\", \"喽\", \"a\", \"见\", \"岱\", \"锯\", \"灭\", \"雍\", \"④\", \"遵\", \"槐\", \"树\", \"⑿\", \"逾\", \"涨\", \"退\", \"刻\", \"匙\", \"错\", \"迁\", \":\", \"臭\", \"檀\", \"亨\", \"芒\", \"媳\", \"腭\", \"能\", \"赐\", \"倦\", \"皮\", \"叮\", \"优\", \"丽\", \"麻\", \"类\", \"轩\", \"还\", \"祈\", \"滔\", \"矛\", \"芥\", \"扮\", \"蚪\", \"拆\", \"赌\", \"履\", \"窘\", \"圳\", \"熬\", \"熹\", \"串\", \"踊\", \"莱\", \"睛\", \"聋\", \"忍\", \"四\", \"鸩\", \"礴\", \"汲\", \"湄\", \"面\", \"缀\", \"笃\", \"娘\", \"赣\", \"浑\", \"耩\", \"俏\", \"马\", \"凋\", \"滩\", \"们\", \"醉\", \"啸\", \"姻\", \"帆\", \"序\", \"想\", \"庚\", \"鲱\", \"摹\", \"龄\", \"挲\", \"孤\", \"馈\", \"嗔\", \"劲\", \"遁\", \"呆\", \"璨\", \"变\", \"谅\", \"戳\", \"腐\", \"虚\", \"隧\", \"焊\", \"创\", \"淇\", \"蚯\", \"鹌\", \"侨\", \"诩\", \"岩\", \"恳\", \"法\", \"碎\", \"淡\", \"掂\", \"允\", \"料\", \"尤\", \"曲\", \"敢\", \"忱\", \"幼\", \"掰\", \"樯\", \"窄\", \"来\", \"淀\", \"换\", \"祛\", \"凑\", \"喘\", \"急\", \"蚁\", \"―\", \"妆\", \"恭\", \"眼\", \"吕\", \"s\", \"鹜\", \"瓢\", \"施\", \"琼\", \"篢\", \"解\", \"悖\", \"齿\", \"字\", \"尉\", \"佝\", \"匪\", \"哨\", \"讪\", \"叭\", \"幢\", \"易\", \"拗\", \"唆\", \"胎\", \"悼\", \"涩\", \"墒\", \"示\", \"粤\", \"祷\", \"耙\", \"疵\", \"雪\", \"妊\", \"锦\", \"踏\", \"擞\", \"嵌\", \"厄\", \"封\", \"什\", \"撅\", \"将\", \"萧\", \"柳\", \"铄\", \"呗\", \"娛\", \"砥\", \"洞\", \"设\", \"青\", \"冠\", \"俨\", \"帮\", \"歪\", \"密\", \"莘\", \"笑\", \"黄\", \"旦\", \"嘭\", \"洒\", \"浇\", \"N\", \"春\", \"卫\", \"镍\", \"搞\", \"茵\", \"昌\", \"霞\", \"暹\", \"吆\", \"狩\", \"噼\", \"龟\", \"砍\", \"停\", \"求\", \"肋\", \"鹏\", \"丧\", \"片\", \"潢\", \"沮\", \"形\", \"咨\", \"捞\", \"飚\", \"钊\", \"贾\", \"义\", \"电\", \"扳\", \"冈\", \"暄\", \"蛮\", \"瑶\", \"蝇\", \"驴\", \"捐\", \"燕\", \"牙\", \"亏\", \"企\", \"兼\", \"攸\", \"雅\", \"鸡\", \"拙\", \"懊\", \"煲\", \"疏\", \"泽\", \"楠\", \"蓬\", \"沪\", \"车\", \"骄\", \"抡\", \"岣\", \"胡\", \"添\", \"按\", \"鉴\", \"简\", \"炙\", \"织\", \"嗡\", \"铭\", \"仆\", \"箔\", \"本\", \"该\", \"脐\", \"梧\", \"释\", \"凡\", \"霏\", \"赢\", \"塔\", \"耐\", \"默\", \"迎\", \"T\", \"乎\", \"荣\", \".\", \"跨\", \"毫\", \"扼\", \"敛\", \"革\", \"韬\", \"乘\", \"缪\", \"工\", \"蔡\", \"⒋\", \"爻\", \"景\", \"胳\", \"距\", \"轼\", \"莞\", \"完\", \"桦\", \"造\", \"紊\", \"價\", \"力\", \"乖\", \"括\", \"谚\", \"说\", \"既\", \"改\", \"木\", \"辑\", \"哈\", \"止\", \"赘\", \"咳\", \"墅\", \"逶\", \"长\", \"雕\", \"逗\", \"鲜\", \"沈\", \"唠\", \"並\", \"胫\", \"昆\", \"问\", \"钓\", \"肖\", \"弦\", \"州\", \"糕\", \"吃\", \"霓\", \"库\", \"俘\", \"嫂\", \"悍\", \"软\", \"邯\", \"蟑\", \"袖\", \"蟋\", \"卻\", \"晗\", \"染\", \"污\", \"驼\", \"膝\", \"逞\", \"郅\", \"抠\", \"庶\", \"枪\", \"芜\", \"弧\", \"锒\", \"檐\", \"曦\", \"柱\", \"鹦\", \"曹\", \"奠\", \"柄\", \"怵\", \"朗\", \"睽\", \"、\", \"悬\", \"垮\", \"塌\", \"八\", \"打\", \"裸\", \"栩\", \"陌\", \"寂\", \"邮\", \"\\b\", \"往\", \"虫\", \"并\", \"乒\", \"灰\", \"屉\", \"芽\", \"涯\", \"猬\", \"苍\", \"D\", \"呜\", \"怒\", \"梅\", \"怖\", \"…\", \"杨\", \"挚\", \"炎\", \"油\", \"申\", \"边\", \"香\", \"刺\", \"锅\", \"掬\", \"睦\", \"欠\", \"牖\", \"峡\", \"秽\", \"缠\", \"ὐ\", \" \", \"泄\", \"彩\", \"娑\", \"析\", \"毙\", \"部\", \"俗\", \"入\", \"模\", \"瞰\", \"n\", \"暂\", \"吾\", \"尬\", \"杭\", \"出\", \"诟\", \"羔\", \"术\", \"眨\", \"翘\", \"玲\", \"樊\", \"埔\", \"唬\", \"诃\", \"又\", \"泳\", \"惕\", \"异\", \"哀\", \"琐\", \"珏\", \"躬\", \"窍\", \"控\", \"条\", \"趟\", \"湖\", \"晋\", \"谴\", \"屹\", \"撸\", \"草\", \"潮\", \"带\", \"吊\", \"励\", \"怔\", \"饲\", \"闪\", \"浞\", \"负\", \"杜\", \"粼\", \"现\", \"主\", \"滤\", \"历\", \"憨\", \"贮\", \"导\", \"费\", \"缸\", \"哼\", \"吼\", \"唐\", \"表\", \"蛛\", \"胚\", \"势\", \"供\", \"谢\", \"开\", \"猾\", \"纺\", \"惺\", \"当\", \"抓\", \"孽\", \"浦\", \"〝\", \"桢\", \"啦\", \"加\", \"担\", \"诞\", \"绵\", \"陷\", \"\", \"天\", \"裳\", \"麦\", \"ό\", \"浓\", \"晦\", \"络\", \"忽\", \"墓\", \"劫\", \"採\", \"陵\", \"里\", \"剐\", \"民\", \"支\", \"住\", \"隘\", \"壳\", \"燎\", \"漱\", \"唷\", \"蜥\", \"凭\", \"猎\", \"屁\", \"巧\", \"逃\", \"促\", \"隶\", \"茅\", \"歼\", \"传\", \"莫\", \"籽\", \"徐\", \"荐\", \"云\", \"阻\", \"弄\", \"胁\", \"渲\", \"嘛\", \"臼\", \"士\", \"佛\", \"范\", \"上\", \"玩\", \"扩\", \"衔\", \"摒\", \"猡\", \"败\", \"慕\", \"舛\", \"港\", \"膳\", \"饽\", \"瘠\", \"肮\", \"揭\", \"丁\", \"撤\", \"妥\", \"纯\", \"葛\", \"柬\", \"植\", \"穗\", \"馅\", \"宝\", \"咆\", \"惮\", \"伸\", \"焰\", \"⑷\", \"厢\", \"枯\", \"斑\", \"殷\", \"栗\", \"谛\", \"蔓\", \"之\", \"阱\", \"泯\", \"旖\", \"凉\", \"桂\", \"湛\", \"陈\", \"象\", \"倍\", \"襄\", \"唱\", \"娱\", \"器\", \"韵\", \"国\", \"征\", \"绽\", \"逐\", \"哎\", \"跟\", \"安\", \"售\", \"颠\", \"证\", \"o\", \"团\", \"饼\", \"e\", \"十\", \"寡\", \"宋\", \"彼\", \"巍\", \"径\", \"僵\", \"水\", \"尖\", \"远\", \"邦\", \"忠\", \"踌\", \"鬓\", \"多\", \"种\", \"盒\", \"进\", \"烤\", \"闾\", \"磕\", \"闻\", \"旎\", \"蔽\", \"睁\", \"颧\", \"各\", \"饮\", \"酌\", \"辜\", \"颐\", \"龙\", \"乱\", \"环\", \"筐\", \"恃\", \"〃\", \"迪\", \"松\", \"鸣\", \"华\", \"板\", \"媛\", \"缮\", \"丝\", \"掷\", \"惬\", \"拘\", \"ㄓ\", \"垒\", \"唾\", \"估\", \"馁\", \"橙\", \"夷\", \"墙\", \"粗\", \"汽\", \"梨\", \"每\", \"虽\", \"郸\", \"众\", \"邑\", \"衬\", \"敌\", \"朋\", \"视\", \"笼\", \"蜿\", \"淅\", \"亦\", \"∶\", \"研\", \"孀\", \"咔\", \"驻\", \"今\", \"悴\", \"筒\", \"袒\", \"辄\", \"死\", \"崇\", \"果\", \"峙\", \"搡\", \"精\", \"運\", \"双\", \"毗\", \"禽\", \"皆\", \"灵\", \"犀\", \"脏\", \"郜\", \"撕\", \"典\", \"旺\", \"危\", \"蚂\", \"蜂\", \"棱\", \"营\", \"孟\", \"祖\", \"复\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/fr": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1540504,
"_n_tokens": 466133,
"_n_chars": 1484970,
"_n_oov_chars": 1615,
"oov_ratio": 0.001087564058533169,
"_oov_charset": "[\"ë\", \"È\", \"̧\", \"★\", \"\", \"{\", \"Ê\", \"~\", \"…\", \"🙂\", \"´\", \"😀\", \"♕\", \"℃\", \"❤\", \"§\", \"̂\", \"―\", \"́\", \"😉\", \"^\", \"À\", \"™\", \"²\", \"}\", \"·\", \"
\", \"♠\", \"Ç\", \"🤔\", \"ã\", \"Ô\", \"µ\", \"�\", \"ï\", \"″\", \"í\", \"\\\\\", \"œ\", \"ğ\", \"←\", \"‐\", \"Â\", \"<\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/es": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1664455,
"_n_tokens": 696400,
"_n_chars": 1630297,
"_n_oov_chars": 11598,
"oov_ratio": 0.007114041183906981,
"_oov_charset": "[\"\", \"▷\", \"¿\", \"\", \"😦\", \"🙁\", \"\", \"■\", \"{\", \"…\", \"ñ\", \"Á\", \"🙂\", \"´\", \"😀\", \"❤\", \"―\", \"️\", \"😉\", \"^\", \"Ó\", \"✪\", \"✖\", \"²\", \"ø\", \"}\", \"·\", \"×\", \"✔\", \"©\", \"ò\", \"М\", \"¡\", \"→\", \"″\", \"í\", \"\\\\\", \"✓\", \"ú\", \"Ñ\", \"Ú\", \"ª\", \"ý\", \"👍\", \"←\", \"👏\", \"\", \"Í\", \"º\", \"<\"]",
"lossless": false
},
"google/byt5-small @ cc100/en": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1124813,
"_n_tokens": 1124813,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/zh-Hans": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 2633047,
"_n_tokens": 2633047,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/fr": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1540504,
"_n_tokens": 1540504,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/es": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1664455,
"_n_tokens": 1664455,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/gemma-7b @ cc100/en": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1124813,
"_n_tokens": 258010,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/zh-Hans": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2633047,
"_n_tokens": 631795,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/fr": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1540504,
"_n_tokens": 364551,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/es": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1664455,
"_n_tokens": 361321,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/mobilebert-uncased @ cc100/en": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1124813,
"_n_tokens": 260575,
"_n_chars": 1121360,
"_n_oov_chars": 31075,
"oov_ratio": 0.027711885567525147,
"_oov_charset": "[\"⑦\", \"D\", \"S\", \"R\", \"😥\", \"\", \"\", \"W\", \"ñ\", \"🙂\", \"Z\", \"⑧\", \"V\", \"U\", \"😉\", \"J\", \"H\", \"K\", \"N\", \"C\", \"Y\", \"A\", \"é\", \"ï\", \"è\", \"�\", \"ó\", \"\", \"M\", \"F\", \"Q\", \"L\", \"⑤\", \"I\", \"T\", \"O\", \"P\", \"B\", \"G\", \"⑩\", \"X\", \"\", \"③\", \"E\", \"\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/zh-Hans": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2633047,
"_n_tokens": 878554,
"_n_chars": 927311,
"_n_oov_chars": 573790,
"oov_ratio": 0.618767597925615,
"_oov_charset": "[\"搅\", \"稻\", \"缕\", \"膨\", \"杆\", \"痕\", \"抽\", \"滓\", \"办\", \"淋\", \"址\", \"郊\", \"霸\", \"墟\", \"惹\", \"先\", \"沥\", \"构\", \"徨\", \"恒\", \"著\", \"狈\", \"戢\", \"竭\", \"畜\", \"擂\", \"吗\", \"奸\", \"壮\", \"伟\", \"东\", \"蕴\", \"羁\", \"ě\", \"射\", \"Q\", \"咏\", \"撒\", \"蕾\", \"窃\", \"倩\", \"劑\", \"腾\", \"突\", \"等\", \"犹\", \"嗯\", \"渺\", \"龚\", \"愤\", \"赚\", \"矮\", \"股\", \"知\", \"擦\", \"伪\", \"罕\", \"甚\", \"掏\", \"遢\", \"跷\", \"簿\", \"赴\", \"者\", \"猴\", \"障\", \"俯\", \"客\", \"擅\", \"程\", \"宸\", \"款\", \"褒\", \"腺\", \"续\", \"迈\", \"哄\", \"涌\", \"骸\", \"路\", \"谐\", \"茎\", \"睡\", \"晨\", \"嫁\", \"庞\", \"跻\", \"苹\", \"衰\", \"脾\", \"圜\", \"讼\", \"揪\", \"钦\", \"嫉\", \"Y\", \"承\", \"婆\", \"饶\", \"搬\", \"壹\", \"澎\", \"箭\", \"防\", \"几\", \"泛\", \"溪\", \"9\", \"弃\", \"骑\", \"堤\", \"鹃\", \"槌\", \"唇\", \"刃\", \"瑧\", \"捺\", \"铤\", \"鄂\", \"丰\", \"宜\", \"需\", \"阶\", \"懈\", \"戏\", \"妻\", \"踝\", \"冷\", \"睑\", \"昵\", \"眯\", \"薇\", \"闷\", \"晓\", \"冽\", \"像\", \"渥\", \"追\", \"寇\", \"注\", \"怯\", \"烫\", \"怂\", \"矿\", \"轶\", \"咬\", \"【\", \"咒\", \"肃\", \"独\", \"绩\", \"帅\", \"偌\", \"铜\", \"例\", \"迅\", \"足\", \"悠\", \"守\", \"澄\", \"炖\", \"粹\", \"稳\", \"铺\", \"牡\", \"灌\", \"闯\", \"属\", \"黎\", \"陆\", \"帜\", \"衿\", \"咙\", \"绥\", \"1\", \"如\", \"腻\", \"②\", \"画\", \"堡\", \"猜\", \"凹\", \"抵\", \"祟\", \"纠\", \"逢\", \"〞\", \"蹒\", \"丢\", \"试\", \"诈\", \"弩\", \"餐\", \"批\", \"遭\", \"叔\", \"观\", \"叶\", \"铨\", \"姬\", \"绰\", \"踩\", \"屡\", \"衍\", \"铂\", \"秒\", \"⒌\", \"姜\", \"给\", \"垃\", \"棵\", \"瞳\", \"捂\", \"层\", \"愿\", \"瓦\", \"蒋\", \"位\", \"葵\", \"佰\", \"玖\", \"殊\", \"温\", \"闭\", \"跑\", \"睹\", \"狰\", \"族\", \"肝\", \"铃\", \"暴\", \"尴\", \"饷\", \"桐\", \"胶\", \"臊\", \"尘\", \"裔\", \"肓\", \"阐\", \"赎\", \"落\", \"碱\", \"使\", \"劈\", \"叹\", \"扁\", \"评\", \"险\", \"冶\", \"鲎\", \"悯\", \"痰\", \"穷\", \"筹\", \"苯\", \"捆\", \"Z\", \"航\", \"紫\", \"髦\", \"短\", \"郴\", \"挥\", \"嘘\", \"抨\", \"嘉\", \"嚎\", \"烊\", \"挝\", \"滢\", \"砺\", \"衫\", \"融\", \"鞭\", \"霹\", \"赋\", \"泸\", \"逍\", \"镕\", \"夕\", \"拇\", \"姓\", \"ズ\", \"�\", \"傲\", \"督\", \"晾\", \"颇\", \"啃\", \"斜\", \"犁\", \"襟\", \"蓦\", \"羡\", \"丘\", \"仗\", \"怨\", \"吠\", \"凛\", \"惊\", \"漓\", \"遴\", \"笨\", \"件\", \"跳\", \"无\", \"\", \"摩\", \"秉\", \"莲\", \"绕\", \"孩\", \"汕\", \"魔\", \"驾\", \"啕\", \"旌\", \"炫\", \"蚌\", \"昏\", \"偿\", \"剩\", \"佼\", \"咸\", \"蒿\", \"確\", \"旆\", \"泌\", \"菜\", \"摄\", \"格\", \"璀\", \"图\", \"勇\", \"憾\", \"诲\", \"销\", \"决\", \"谱\", \"仰\", \"必\", \"侧\", \"赁\", \"诅\", \"授\", \"電\", \"借\", \"臂\", \"消\", \"低\", \"帖\", \"粉\", \"忌\", \"栏\", \"鱼\", \"仍\", \"肘\", \"刁\", \"诺\", \"蹲\", \"情\", \"练\", \"父\", \"喝\", \"粥\", \"厮\", \"恣\", \"毒\", \"线\", \"与\", \"祢\", \"辖\", \"朦\", \"狮\", \"伤\", \"增\", \"裂\", \"杂\", \"氧\", \"馆\", \"泊\", \"踹\", \"坡\", \"顷\", \"塘\", \"汀\", \"犰\", \"裙\", \"惴\", \"狞\", \"耶\", \"彬\", \"阵\", \"7\", \"逅\", \"谆\", \"咧\", \"盼\", \"稍\", \"侃\", \"楂\", \"登\", \"末\", \"漏\", \"涡\", \"匕\", \"歇\", \"蚊\", \"七\", \"夹\", \"胆\", \"誉\", \"俄\", \"趋\", \"汇\", \"泠\", \"肉\", \"盾\", \"扛\", \"墉\", \"碴\", \"闫\", \"苑\", \"噩\", \"记\", \"舶\", \"⑴\", \"滑\", \"考\", \"鳞\", \"念\", \"捍\", \"论\", \"徊\", \"砸\", \"零\", \"篇\", \"鞍\", \"疼\", \"弈\", \"抢\", \"君\", \"语\", \"狡\", \"盏\", \"汶\", \"凯\", \"丫\", \"破\", \"师\", \"朱\", \"拣\", \"谓\", \"ç\", \"摞\", \"彰\", \"残\", \"镶\", \"庄\", \"恿\", \"投\", \"涸\", \"乍\", \"疮\", \"掠\", \"述\", \"骁\", \"栋\", \"跪\", \"阔\", \"均\", \"褐\", \"瑞\", \"畴\", \"渎\", \"岖\", \"擘\", \"舌\", \"兑\", \"盖\", \"睐\", \"覃\", \"愧\", \"期\", \"瑥\", \"谎\", \"6\", \"皈\", \"滚\", \"个\", \"哗\", \"懑\", \"艾\", \"嫖\", \"曰\", \"冲\", \"列\", \"炒\", \"洼\", \"溃\", \"焕\", \"功\", \"快\", \"聘\", \"薛\", \"嫌\", \"津\", \"颊\", \"才\", \"检\", \"皑\", \"莓\", \"藕\", \"徇\", \"剥\", \"裕\", \"笋\", \"敞\", \"恤\", \"滞\", \"乞\", \"憬\", \"击\", \"涛\", \"瓶\", \"咦\", \"桶\", \"勉\", \"⒁\", \"赠\", \"咎\", \"若\", \"迩\", \"聂\", \"钩\", \"濒\", \"t\", \"索\", \"芮\", \"斛\", \"吸\", \"窜\", \"刨\", \"半\", \"齐\", \"娴\", \"暖\", \"喊\", \"撑\", \"缩\", \"舱\", \"妤\", \"碟\", \"且\", \"套\", \"俺\", \"聊\", \"乐\", \"缘\", \"咐\", \"扫\", \"戾\", \"沙\", \"酷\", \"沂\", \"劣\", \"黑\", \"俑\", \"霖\", \"譬\", \"皖\", \"殴\", \"措\", \"雯\", \"恐\", \"芭\", \"归\", \"整\", \"始\", \"引\", \"斗\", \"械\", \"瘤\", \"\", \"囚\", \"雁\", \"毯\", \"⒂\", \"3\", \"奥\", \"獗\", \"勋\", \"致\", \"拿\", \"婊\", \"羊\", \"甘\", \"药\", \"坐\", \"醇\", \"禅\", \"屌\", \"聆\", \"蔚\", \"璜\", \"否\", \"频\", \"爷\", \"牌\", \"彭\", \"搐\", \"扇\", \"室\", \"受\", \"姨\", \"脯\", \"绣\", \"肤\", \"亳\", \"及\", \"兆\", \"猪\", \"肴\", \"瞥\", \"惭\", \"耸\", \"廖\", \"谜\", \"辉\", \"识\", \"债\", \"违\", \"症\", \"穿\", \"薄\", \"灸\", \"断\", \"涎\", \"逑\", \"暑\", \"腿\", \"歉\", \"喀\", \"]\", \"痘\", \"瀚\", \"陨\", \"岗\", \"册\", \"愉\", \"邱\", \"稚\", \"纷\", \"攀\", \"做\", \"钰\", \"玮\", \"卦\", \"汝\", \"翰\", \"谭\", \"眉\", \"亿\", \"爰\", \"噴\", \"悉\", \"鼻\", \"斤\", \"仔\", \"厚\", \"泻\", \"移\", \"灿\", \"璧\", \"蓄\", \"喉\", \"拎\", \"纾\", \"扒\", \"冤\", \"抚\", \"胜\", \"切\", \"陕\", \"得\", \"杖\", \"撼\", \"骨\", \"堪\", \"聪\", \"毎\", \"董\", \"习\", \"常\", \"奏\", \"棚\", \"垢\", \"刑\", \"气\", \"P\", \"選\", \"溉\", \"炕\", \"霈\", \"框\", \"震\", \"坷\", \"钝\", \"爱\", \"组\", \"头\", \"桅\", \"柚\", \"艘\", \"眷\", \"恋\", \"員\", \"塑\", \"闵\", \"掳\", \"节\", \"溺\", \"妇\", \"芙\", \"询\", \"脊\", \"霾\", \"4\", \"撩\", \"浪\", \"巳\", \"选\", \"诫\", \"鲨\", \"魇\", \"湘\", \"沿\", \";\", \"祭\", \"束\", \"淫\", \"填\", \"铁\", \"韫\", \"奂\", \"雷\", \"馋\", \"己\", \"霭\", \"赞\", \"吐\", \"筑\", \"骤\", \"荡\", \"踪\", \"尺\", \"疲\", \"茫\", \"舅\", \"玫\", \"棒\", \"胰\", \"席\", \"顿\", \"驰\", \"腥\", \"涮\", \"阎\", \"颓\", \"窗\", \"参\", \"茱\", \"俞\", \"樟\", \"枉\", \"匈\", \"泥\", \"杉\", \"汐\", \"瞠\", \"诗\", \"枢\", \"流\", \"晶\", \"留\", \"匹\", \"蹭\", \"遛\", \"卓\", \"偷\", \"偻\", \"璃\", \"贡\", \"琴\", \"汤\", \"淼\", \"免\", \"椅\", \"擎\", \"峻\", \"烛\", \"馒\", \"技\", \"枝\", \"円\", \"◆\", \"犯\", \"卧\", \"杠\", \"绅\", \"拉\", \"馕\", \"侠\", \"患\", \"妞\", \"占\", \"哭\", \"牠\", \"更\", \"凶\", \"拍\", \"娶\", \"降\", \"蜜\", \"贬\", \"绍\", \"暨\", \"您\", \"磺\", \"菲\", \"俚\", \"噢\", \"拭\", \"岌\", \"阑\", \"仙\", \"酸\", \"医\", \"為\", \"⑩\", \"兵\", \"缆\", \"升\", \"采\", \"堕\", \"黩\", \"挡\", \"炼\", \"员\", \"傅\", \"\", \"娃\", \"颌\", \"宠\", \"逸\", \"皿\", \"恩\", \"驶\", \"蝌\", \"际\", \"僧\", \"葱\", \"眠\", \"捷\", \"喔\", \"迤\", \"弓\", \"J\", \"害\", \"献\", \"屋\", \"隐\", \"铩\", \"烟\", \"培\", \"角\", \"宪\", \"爸\", \"婉\", \"屄\", \"膛\", \"發\", \"鞠\", \"臻\", \"由\", \"逻\", \"挽\", \"锡\", \"攫\", \"炅\", \"癌\", \"铮\", \"谬\", \"岁\", \"娥\", \"砂\", \"琅\", \"涝\", \"芝\", \"L\", \"[\", \"覆\", \"祸\", \"怠\", \"窟\", \"煜\", \"犟\", \"芃\", \"糯\", \"蹊\", \"重\", \"萍\", \"招\", \"標\", \"胥\", \"呐\", \"殆\", \"③\", \"缅\", \"蒜\", \"崽\", \"傥\", \"市\", \"飙\", \"绳\", \"愁\", \"阮\", \"亟\", \"坟\", \"诬\", \"掩\", \"仕\", \"疙\", \"获\", \"演\", \"扔\", \"厅\", \"埃\", \"翱\", \"刷\", \"鲸\", \"篱\", \"渐\", \"岭\", \"援\", \"虐\", \"灑\", \"楣\", \"却\", \"芯\", \"锣\", \"嬉\", \"农\", \"洪\", \"差\", \"处\", \"囤\", \"耀\", \"K\", \"▲\", \"佣\", \"é\", \"汁\", \"鸭\", \"放\", \"坛\", \"慮\", \"乔\", \"衣\", \"鹕\", \"讷\", \"柔\", \"最\", \"踢\", \"挠\", \"踞\", \"蜀\", \"根\", \"噬\", \"鼯\", \"散\", \"髻\", \"傍\", \"掀\", \"坝\", \"嗲\", \"凄\", \"肾\", \"闸\", \"跃\", \"萦\", \"i\", \"貌\", \"壓\", \"缭\", \"匿\", \"飕\", \"这\", \"监\", \"弹\", \"吨\", \"嘲\", \"样\", \"巫\", \"补\", \"恶\", \"懒\", \"陋\", \"听\", \"俊\", \"黯\", \"亚\", \"尝\", \"淆\", \"焉\", \"煎\", \"骅\", \"衷\", \"钧\", \"棣\", \"似\", \"收\", \"颁\", \"抗\", \"N\", \"九\", \"茶\", \"锏\", \"铎\", \"翕\", \"链\", \"闺\", \"挪\", \"岔\", \"爪\", \"噱\", \"袍\", \"劝\", \"锁\", \"肌\", \"吁\", \"辰\", \"到\", \"寻\", \"黔\", \"褚\", \"槿\", \"周\", \"究\", \"裆\", \"理\", \"嘴\", \"撰\", \"较\", \"积\", \"莉\", \"税\", \"赤\", \"蘑\", \"巅\", \"愈\", \"录\", \"飞\", \"自\", \"瑜\", \"泣\", \"瑰\", \"镐\", \"讽\", \"浮\", \"別\", \"谋\", \"茨\", \"宛\", \"贝\", \"沉\", \"倏\", \"翔\", \"蝶\", \"灼\", \"谦\", \"廊\", \"键\", \"液\", \"旗\", \"辫\", \"六\", \"瓜\", \"色\", \"啬\", \"希\", \"寨\", \"挖\", \"码\", \"他\", \"疹\", \"老\", \"诊\", \"槛\", \"饿\", \"汛\", \"卵\", \"菩\", \"觉\", \"蔬\", \"煽\", \"绸\", \"割\", \"豚\", \"鸿\", \"螃\", \"贯\", \"侦\", \"亭\", \"堵\", \"符\", \"座\", \"旧\", \"醛\", \"內\", \"5\", \"拂\", \"菌\", \"遏\", \"随\", \"刹\", \"怜\", \"嘣\", \"膊\", \"滥\", \"涣\", \"吧\", \"庆\", \"圩\", \"魏\", \"骏\", \"未\", \"派\", \"辙\", \"坤\", \"攒\", \"漉\", \"珉\", \"炮\", \"寐\", \"掺\", \"秩\", \"乃\", \"韦\", \"峭\", \"桓\", \"町\", \"哪\", \"满\", \"唤\", \"洽\", \"钮\", \"卿\", \"咖\", \"姚\", \"渤\", \"汪\", \"悟\", \"報\", \"吵\", \"C\", \"窿\", \"弛\", \"凤\", \"狗\", \"蹈\", \"琉\", \"畑\", \"速\", \"块\", \"讦\", \"容\", \"漪\", \"宵\", \"察\", \"躯\", \"诱\", \"弑\", \"猛\", \"泼\", \"渝\", \"阽\", \"戍\", \"黏\", \"剁\", \"峰\", \"罪\", \"宴\", \"杀\", \"把\", \"拢\", \"皱\", \"兹\", \"渗\", \"指\", \"颖\", \"刊\", \"狭\", \"逮\", \"榴\", \"疴\", \"酱\", \"厘\", \"①\", \"插\", \"烬\", \"纨\", \"略\", \"r\", \"资\", \"函\", \"鳃\", \"噌\", \"而\", \"奶\", \"茧\", \"強\", \"拓\", \"彤\", \"恕\", \"坦\", \"约\", \"蒸\", \"竺\", \"吩\", \"笆\", \"烁\", \"烷\", \"跤\", \"揣\", \"簇\", \"鹭\", \"撬\", \"娅\", \"滨\", \"勖\", \"钜\", \"庸\", \"洋\", \"沦\", \"哉\", \"卜\", \"雇\", \"础\", \"棉\", \"婚\", \"尾\", \"陶\", \"O\", \"规\", \"邻\", \"适\", \"瞻\", \"静\", \"排\", \"盯\", \"联\", \"膀\", \"霜\", \"榨\", \"次\", \"镜\", \"忘\", \"胞\", \"璇\", \"疸\", \"球\", \"贴\", \"蛔\", \"庐\", \"谑\", \"践\", \"抖\", \"混\", \"栽\", \"寥\", \"吏\", \"恙\", \"鼠\", \"拔\", \"郁\", \"庭\", \"书\", \"兰\", \"亡\", \"炳\", \"滋\", \"柏\", \"战\", \"澜\", \"欢\", \"钱\", \"摘\", \"溢\", \"陀\", \"吴\", \"熔\", \"聒\", \"扬\", \"趾\", \"婶\", \"挺\", \"姣\", \"态\", \"绘\", \"烹\", \"V\", \"季\", \"恪\", \"矢\", \"舰\", \"熄\", \"T\", \"厉\", \"狐\", \"偏\", \"耻\", \"蔷\", \"择\", \"暇\", \"数\", \"激\", \"诵\", \"徘\", \"呵\", \"罹\", \"饰\", \"秘\", \"腑\", \"礼\", \"瓣\", \"懂\", \"耽\", \"徳\", \"量\", \"依\", \"疯\", \"篮\", \"痹\", \"柘\", \"呷\", \"科\", \"讲\", \"舐\", \"莺\", \"朽\", \"讳\", \"结\", \"翩\", \"牺\", \"虎\", \"權\", \"伦\", \"漫\", \"候\", \"拱\", \"珠\", \"舵\", \"签\", \"倜\", \"髓\", \"沾\", \"湿\", \"蓁\", \"厨\", \"咽\", \"躁\", \"茸\", \"点\", \"卤\", \"勘\", \"锌\", \"攥\", \"详\", \"瑕\", \"蛊\", \"巡\", \"桌\", \"嘱\", \"摧\", \"浠\", \"池\", \"稠\", \"号\", \"判\", \"难\", \"哦\", \"欺\", \"霍\", \"谔\", \"腔\", \"撷\", \"虏\", \"蚀\", \"⑧\", \"夭\", \"瀛\", \"屏\", \"翊\", \"敝\", \"漩\", \"礁\", \"箍\", \"在\", \"铝\", \"邸\", \"辨\", \"漆\", \"蹿\", \"鹑\", \"動\", \"玻\", \"轿\", \"抛\", \"央\", \"啐\", \"沃\", \"谧\", \"寰\", \"坊\", \"哲\", \"夺\", \"罚\", \"概\", \"纹\", \"巩\", \"秃\", \"胧\", \"惜\", \"凸\", \"殖\", \"艇\", \"烦\", \"诨\", \"渍\", \"剧\", \"浸\", \"关\", \"丐\", \"坞\", \"壁\", \"曼\", \"看\", \"斌\", \"跋\", \"沸\", \"槃\", \"畿\", \"瘦\", \"彙\", \"燃\", \"用\", \"纵\", \"严\", \"夸\", \"寅\", \"帕\", \"贱\", \"徽\", \"玷\", \"倒\", \"冥\", \"厂\", \"邓\", \"纬\", \"迭\", \"幽\", \"荫\", \"弟\", \"霆\", \"崔\", \"绊\", \"硅\", \"撇\", \"橇\", \"呦\", \"嚣\", \"飓\", \"姆\", \"耦\", \"摔\", \"粱\", \"裴\", \"茂\", \"绚\", \"遣\", \"赵\", \"⒃\", \"基\", \"妖\", \"旅\", \"群\", \"驳\", \"挟\", \"第\", \"W\", \"洁\", \"篝\", \"剔\", \"浩\", \"沐\", \"皂\", \"豪\", \"瞪\", \"啜\", \"溅\", \"雨\", \"居\", \"趣\", \"棘\", \"眶\", \"但\", \"・\", \"拳\", \"舞\", \"糖\", \"莎\", \"澳\", \"媚\", \"伴\", \"聿\", \"锚\", \"挨\", \"两\", \"配\", \"砾\", \"枚\", \"蓉\", \"你\", \"找\", \"通\", \"渡\", \"芳\", \"帐\", \"唉\", \"微\", \"酿\", \"旬\", \"宾\", \"婴\", \"姗\", \"待\", \"后\", \"A\", \"嘈\", \"厌\", \"谈\", \"\\u0005\", \"亮\", \"豁\", \"呕\", \"滇\", \"孱\", \"疗\", \"望\", \"斧\", \"僚\", \"袱\", \"&\", \"沏\", \"圈\", \"戚\", \"以\", \"蕉\", \"荧\", \"骼\", \"催\", \"撐\", \"刮\", \"時\", \"斩\", \"窦\", \"哺\", \"H\", \"纂\", \"呼\", \"非\", \"秤\", \"迄\", \"协\", \"灶\", \"肚\", \"蒙\", \"鸦\", \"汹\", \"橱\", \"伙\", \"助\", \"躲\", \"率\", \"卸\", \"蘸\", \"叨\", \"维\", \"了\", \"机\", \"赖\", \"橄\", \"乳\", \"趴\", \"孰\", \"飘\", \"粟\", \"认\", \"右\", \"媲\", \"亥\", \"_\", \"盗\", \"屠\", \"掖\", \"床\", \"锋\", \"辆\", \"暧\", \"昨\", \"味\", \"盎\", \"凿\", \"累\", \"據\", \"蜃\", \"临\", \"寿\", \"瑨\", \"喆\", \"益\", \"冬\", \"鹿\", \"辣\", \"吝\", \"溯\", \"雀\", \"奢\", \"粕\", \"尧\", \"魁\", \"聚\", \"豫\", \"酋\", \"责\", \"货\", \"崩\", \"裹\", \"翅\", \"肆\", \"忙\", \"挫\", \"毅\", \"茏\", \"嗓\", \"妙\", \"炊\", \"砌\", \"准\", \"焯\", \"戛\", \"艋\", \"峥\", \"揍\", \"E\", \"台\", \"唯\", \"呢\", \"杰\", \"鼓\", \"早\", \"黝\", \"娜\", \"乾\", \"萎\", \"藏\", \"铲\", \"郭\", \"洛\", \"甲\", \"乏\", \"丑\", \"敦\", \"哇\", \" \", \"涕\", \"丙\", \"呻\", \"肢\", \"蛙\", \"柴\", \"鞋\", \"脱\", \"脚\", \"叼\", \"抿\", \"汉\", \"纱\", \"兔\", \"弯\", \"偎\", \"涤\", \"伏\", \"麾\", \"椭\", \"血\", \"鬼\", \"热\", \"臧\", \"溜\", \"扉\", \"嘎\", \"猩\", \"璎\", \"螺\", \"净\", \"憔\", \"焙\", \"疑\", \"剪\", \"缜\", \"显\", \"埂\", \"票\", \"骆\", \"孝\", \"任\", \"户\", \"棂\", \"肥\", \"谩\", \"干\", \"她\", \"※\", \"蝉\", \"濮\", \"班\", \"苗\", \"好\", \"℃\", \"乡\", \"绉\", \"萝\", \"初\", \"拥\", \"肿\", \"执\", \"萄\", \"荤\", \"载\", \"刀\", \"幻\", \"醒\", \"诣\", \"连\", \"俩\", \"胀\", \"茉\", \"即\", \"於\", \"岛\", \"值\", \"嗜\", \"偶\", \"建\", \"沁\", \"绑\", \"勃\", \"搂\", \"屈\", \"麟\", \"韧\", \"叫\", \"卉\", \"钵\", \"牵\", \"喷\", \"躺\", \"便\", \"歹\", \"贤\", \"î\", \"籁\", \"测\", \"讯\", \"壤\", \"化\", \"赔\", \"延\", \"奔\", \"滴\", \"琛\", \"戴\", \"队\", \"券\", \"婺\", \"颈\", \"匠\", \"孔\", \"请\", \"滕\", \"娼\", \"粮\", \"奎\", \"缓\", \"争\", \"没\", \"瞧\", \"吮\", \"端\", \"籍\", \"锐\", \"乙\", \"颉\", \"嘀\", \"沧\", \"仲\", \"湃\", \"绎\", \"岳\", \"寞\", \"倚\", \"惶\", \"拒\", \"h\", \"携\", \"预\", \"I\", \"株\", \"振\", \"颜\", \"醍\", \"蜕\", \"侯\", \"慨\", \"洲\", \"拨\", \"揖\", \"蜒\", \"别\", \"椎\", \"顽\", \"靴\", \"慷\", \"阁\", \"场\", \"贫\", \"詹\", \"剖\", \"匀\", \"壑\", \"陛\", \"攘\", \"疤\", \"灯\", \"邕\", \"皙\", \"袁\", \"兮\", \"览\", \"济\", \"矣\", \"糊\", \"总\", \"鄯\", \"过\", \"愕\", \"珍\", \"坏\", \"橡\", \"讥\", \"摇\", \"盐\", \"梭\", \"钟\", \"赛\", \"洗\", \"锲\", \"性\", \"彻\", \"辩\", \"箱\", \"音\", \"窒\", \"牲\", \"案\", \"酝\", \"瘾\", \"实\", \"店\", \"贵\", \"惦\", \"甜\", \"波\", \"经\", \"寓\", \"嘻\", \"莅\", \"%\", \"鸽\", \"侬\", \"斥\", \"浊\", \"彗\", \"钢\", \"爵\", \"苇\", \"律\", \"朔\", \"番\", \"鹤\", \"馨\", \"潜\", \"架\", \"冯\", \"影\", \"奘\", \"啼\", \"涉\", \"棍\", \"威\", \"柑\", \"翁\", \"淳\", \"U\", \"扰\", \"段\", \"廉\", \"氢\", \"颤\", \"作\", \"荒\", \"应\", \"榆\", \"悦\", \"淑\", \"趁\", \"谨\", \"穆\", \"痪\", \"漠\", \"渣\", \"腹\", \"提\", \"僻\", \"页\", \"斯\", \"匆\", \"驮\", \"菱\", \"综\", \"碍\", \"妨\", \"爆\", \"职\", \"睿\", \"槽\", \"闲\", \"巨\", \"昊\", \"界\", \"肯\", \"镀\", \"惩\", \"病\", \"拖\", \"纰\", \"肺\", \"舀\", \"姐\", \"挂\", \"掘\", \"熟\", \"柯\", \"假\", \"阴\", \"捅\", \"涟\", \"姥\", \"腋\", \"矗\", \"俪\", \"葩\", \"虔\", \"息\", \"孪\", \"渠\", \"繁\", \"浴\", \"臀\", \"豹\", \"夥\", \"擀\", \"梗\", \"言\", \"厦\", \"伐\", \"雌\", \"剑\", \"钥\", \"A\", \"垄\", \"旁\", \"畔\", \"栖\", \"托\", \"拽\", \"袜\", \"艺\", \"堰\", \"拟\", \"般\", \"冒\", \"辽\", \"秦\", \"虑\", \"圆\", \"孙\", \"蝗\", \"酵\", \"县\", \"窥\", \"婪\", \"羞\", \"+\", \"盲\", \"绪\", \"鼾\", \"沫\", \"讶\", \"搭\", \"楚\", \"嗣\", \"蚓\", \"旱\", \"忐\", \"潘\", \"ヨ\", \"镭\", \"划\", \"觅\", \"屎\", \"倘\", \"牢\", \"絮\", \"龇\", \"悔\", \"褪\", \"恰\", \"伯\", \"辞\", \"泉\", \"陡\", \"烯\", \"笛\", \"辕\", \"p\", \"媒\", \"侣\", \"宏\", \"剂\", \"锥\", \"附\", \"⑨\", \"\", \"确\", \"雏\", \"惋\", \"弱\", \"宽\", \"握\", \"瘫\", \"恨\", \"贼\", \"噪\", \"Ø\", \"晒\", \"兢\", \"蹄\", \"教\", \"管\", \"编\", \"摸\", \"涂\", \"荏\", \"仇\", \"枷\", \"畏\", \"勿\", \"埠\", \"近\", \"锻\", \"泱\", \"栈\", \"慑\", \"秸\", \"倨\", \"爹\", \"愚\", \"鹉\", \"剽\", \"质\", \"咯\", \"邪\", \"⒀\", \"盆\", \"须\", \"荟\", \"牧\", \"梦\", \"阀\", \"查\", \"操\", \"勒\", \"背\", \"拼\", \"倡\", \"左\", \"奋\", \"岑\", \"遮\", \"锢\", \"垠\", \"脑\", \"蜘\", \"伉\", \"酪\", \"深\", \"权\", \"萌\", \"坪\", \"谁\", \"沽\", \"钞\", \"甫\", \"痒\", \"邢\", \"佟\", \"浙\", \"全\", \"葡\", \"度\", \"煮\", \"0\", \"虹\", \"忆\", \"砖\", \"賣\", \"氰\", \"告\", \"渴\", \"抬\", \"坠\", \"淄\", \"庙\", \"绛\", \"寸\", \"薰\", \"型\", \"盟\", \"卷\", \"逊\", \"咕\", \"帘\", \"贩\", \"童\", \"曳\", \"遗\", \"敬\", \"于\", \"呀\", \"宫\", \"啤\", \"赶\", \"耘\", \"捧\", \"邬\", \"峨\", \"佳\", \"崖\", \"署\", \"舎\", \"针\", \"惚\", \"蕤\", \"印\", \"撞\", \"儒\", \"挑\", \"硬\", \"烧\", \"装\", \"茜\", \"碑\", \"儿\", \"诧\", \"肪\", \"因\", \"据\", \"螂\", \"糠\", \"惰\", \"埋\", \"价\", \"瞎\", \"叛\", \"捕\", \"遍\", \"卑\", \"为\", \"毡\", \"嚼\", \"癜\", \"抒\", \"俱\", \"声\", \"润\", \"局\", \"韩\", \"袋\", \"蜡\", \"叠\", \"刚\", \"然\", \"莴\", \"尸\", \"甩\", \"恼\", \"徙\", \"憋\", \"捏\", \"】\", \"苒\", \"鳗\", \"妃\", \"咱\", \"芋\", \"檬\", \"抉\", \"越\", \"抹\", \"倾\", \"仑\", \"冻\", \"校\", \"欣\", \"遇\", \"扎\", \"院\", \"缈\", \"厥\", \"晰\", \"粘\", \"噶\", \"隋\", \"玄\", \"返\", \"藐\", \"咪\", \"菁\", \"巢\", \"麽\", \"羚\", \"喇\", \"肇\", \"夜\", \"阪\", \"號\", \"卖\", \"逝\", \"骛\", \"弗\", \"奴\", \"\", \"惑\", \"红\", \"畸\", \"萃\", \"站\", \"圭\", \"膏\", \"盈\", \"循\", \"陇\", \"熏\", \"揽\", \"牒\", \"岸\", \"吻\", \"穹\", \"稽\", \"郑\", \"迫\", \"魅\", \"奖\", \"祥\", \"瘩\", \"昂\", \"脆\", \"玉\", \"冉\", \"喜\", \"对\", \"遐\", \"睫\", \"廷\", \"可\", \"挤\", \"露\", \"诡\", \"很\", \"答\", \"梁\", \"壶\", \"鸠\", \"匾\", \"细\", \"缝\", \"懵\", \"喧\", \"蓟\", \"萼\", \"淘\", \"终\", \"梵\", \"靠\", \"臣\", \"吱\", \"豌\", \"嘤\", \"嵘\", \"醐\", \"猫\", \"罩\", \"灾\", \"骗\", \"庇\", \"泡\", \"潦\", \"策\", \"烙\", \"翠\", \"猥\", \"苛\", \"描\", \"锂\", \"唏\", \"怪\", \"此\", \"竿\", \"芷\", \"卢\", \"捉\", \"缄\", \"靶\", \"档\", \"丹\", \"订\", \"脉\", \"慌\", \"叩\", \"呸\", \"慎\", \"慰\", \"绞\", \"菊\", \"淖\", \"驿\", \"购\", \"寒\", \"瘀\", \"碰\", \"砧\", \"酣\", \"湾\", \"圣\", \"馄\", \"甯\", \"汗\", \"狠\", \"⑸\", \"C\", \"凝\", \"帽\", \"擤\", \"尔\", \"翼\", \"祝\", \"黧\", \"翡\", \"至\", \"辛\", \"薯\", \"嗦\", \"邹\", \"极\", \"魂\", \"桥\", \"服\", \"妄\", \"旷\", \"瑟\", \"雳\", \"盘\", \"苦\", \"秆\", \"饨\", \"审\", \"⑥\", \"矫\", \"嗨\", \"钻\", \"时\", \"昕\", \"暮\", \"掉\", \"所\", \"耿\", \"扣\", \"辱\", \"劾\", \"减\", \"侈\", \"俭\", \"逆\", \"运\", \"瞟\", \"婷\", \"房\", \"竟\", \"验\", \"骂\", \"芦\", \"饱\", \"播\", \"嗅\", \"桔\", \"域\", \"钉\", \"伫\", \"嚷\", \"蟀\", \"晚\", \"溘\", \"阅\", \"玛\", \"巾\", \"吟\", \"掐\", \"荼\", \"楔\", \"畅\", \"瞒\", \"萨\", \"矩\", \"柠\", \"宅\", \"熙\", \"泾\", \"训\", \"荆\", \"黢\", \"爬\", \"裘\", \"熨\", \"併\", \"D\", \"欧\", \"粒\", \"它\", \"惯\", \"喃\", \"○\", \"脸\", \"晤\", \"粽\", \"焦\", \"疆\", \"晴\", \"寄\", \"痫\", \"锈\", \"轻\", \"牟\", \"遂\", \"篡\", \"戒\", \"稀\", \"貂\", \"亩\", \"遥\", \"屯\", \"隔\", \"磋\", \"祀\", \"\\u0006\", \"扭\", \"敏\", \"肩\", \"棠\", \"超\", \"霉\", \"园\", \"坚\", \"顾\", \"伍\", \"固\", \"裁\", \"哧\", \"算\", \"匮\", \"欸\", \"臃\", \"碌\", \"梢\", \"百\", \"憧\", \"疚\", \"韪\", \"专\", \"船\", \"刘\", \"苣\", \"困\", \"橘\", \"腓\", \"搏\", \"巴\", \"输\", \"募\", \"耕\", \"醋\", \"奚\", \"徒\", \"纽\", \"鸟\", \"物\", \"级\", \"享\", \"辈\", \"敷\", \"酥\", \"布\", \"個\", \"拐\", \"褂\", \"词\", \"仅\", \"昧\", \"赏\", \"啊\", \"欲\", \"伺\", \"交\", \"活\", \"胱\", \"惫\", \"单\", \"妒\", \"张\", \"煞\", \"帷\", \"琳\", \"瓷\", \"底\", \"侥\", \"臆\", \"芬\", \"养\", \"葫\", \"彷\", \"篓\", \"特\", \"身\", \"倪\", \"烃\", \"汰\", \"歧\", \"靛\", \"充\", \"围\", \"誓\", \"筝\", \"回\", \"私\", \"娄\", \"烂\", \"则\", \"仓\", \"式\", \"鹰\", \"坎\", \"瑑\", \"狸\", \"炭\", \"胖\", \"沛\", \"报\", \"晖\", \"拜\", \"琢\", \"映\", \"肛\", \"咀\", \"毕\", \"余\", \"摆\", \"赃\", \"狄\", \"响\", \"继\", \"腕\", \"惧\", \"再\", \"毁\", \"役\", \"茄\", \"奇\", \"万\", \"甸\", \"莹\", \"状\", \"思\", \"棕\", \"折\", \"蚤\", \"釜\", \"克\", \"乓\", \"荻\", \"虾\", \"冰\", \"骰\", \"置\", \"尼\", \"筋\", \"哮\", \"课\", \"缚\", \"门\", \"诸\", \"勤\", \"储\", \"诙\", \"党\", \"沟\", \"猝\", \"令\", \"尊\", \"姑\", \"簧\", \"疾\", \"柿\", \"慧\", \"楼\", \"仿\", \"喂\", \"8\", \"恍\", \"缥\", \"羹\", \"d\", \"恺\", \"喻\", \"浏\", \"账\", \"薩\", \"瀑\", \"惘\", \"艳\", \"饭\", \"蓝\", \"持\", \"腊\", \"坯\", \"窖\", \"贸\", \"称\", \"葆\", \"幅\", \"辗\", \"奉\", \"岂\", \"〖\", \"汩\", \"吹\", \"壕\", \"游\", \"苟\", \"揉\", \"财\", \"午\", \"柜\", \"兜\", \"辅\", \"访\", \"贺\", \"举\", \"屿\", \"动\", \"亲\", \"顺\", \"饥\", \"宙\", \"栅\", \"艰\", \"迟\", \"炬\", \"〔\", \"赂\", \"孕\", \"靖\", \"替\", \"罄\", \"限\", \"途\", \"懦\", \"读\", \"源\", \"巷\", \"癫\", \"轰\", \"府\", \"照\", \"怡\", \"鞘\", \"走\", \"缉\", \"呛\", \"衅\", \"囊\", \"起\", \"隆\", \"筛\", \"à\", \"迹\", \"啪\", \"氛\", \"兴\", \"損\", \"镏\", \"鲤\", \"毛\", \"哑\", \"淤\", \"磊\", \"痊\", \"劳\", \"託\", \"剿\", \"翻\", \"浚\", \"衡\", \"贷\", \"瘙\", \"母\", \"颗\", \"谀\", \"妍\", \"推\", \"粪\", \"除\", \"贪\", \"挈\", \"昔\", \"拷\", \"勾\", \"鑫\", \"镉\", \"⑶\", \"竖\", \"旋\", \"鲍\", \"够\", \"罗\", \"掌\", \"矶\", \"舟\", \"披\", \"犷\", \"凌\", \"罐\", \"S\", \"跌\", \"瞩\", \"幕\", \"启\", \"妹\", \"转\", \"努\", \"蟹\", \"挎\", \"纸\", \"嘟\", \"嗪\", \"嗤\", \"忑\", \"孜\", \"婿\", \"旳\", \"佬\", \"杯\", \"尿\", \"斐\", \"墨\", \"浆\", \"铣\", \"弊\", \"送\", \"要\", \"狙\", \"珊\", \"拯\", \"丛\", \"瞅\", \"体\", \"傻\", \" \", \"蛇\", \"敖\", \"狳\", \"删\", \"榷\", \"绒\", \"镑\", \"发\", \"蹦\", \"呃\", \"\\u0007\", \"枣\", \"素\", \"網\", \"桃\", \""\", \"寝\", \"只\", \"淮\", \"愣\", \"苏\", \"饵\", \"X\", \"舆\", \"风\", \"颂\", \"哥\", \"乌\", \"佘\", \"R\", \"朴\", \"晃\", \"抑\", \"利\", \"抄\", \"泪\", \"休\", \"湮\", \"陪\", \"递\", \"垣\", \"泵\", \"蕃\", \"崛\", \"存\", \"淹\", \"悚\", \"厕\", \"丸\", \"已\", \"扑\", \"截\", \"缺\", \"亵\", \"踱\", \"紧\", \"产\", \"疫\", \"癖\", \"雾\", \"漂\", \"肠\", \"惨\", \"押\", \"殉\", \"项\", \"厝\", \"修\", \"熊\", \"當\", \"话\", \"桑\", \"系\", \"惟\", \"锄\", \"互\", \"某\", \"许\", \"狂\", \"蒂\", \"竣\", \"樱\", \"计\", \"\", \"珀\", \"盛\", \"份\", \"扶\", \"硕\", \"酒\", \"睬\", \"栓\", \"耗\", \"宁\", \"官\", \"接\", \"触\", \"桩\", \"娩\", \"瑢\", \"感\", \"银\", \"写\", \"贞\", \"裤\", \"缴\", \"炉\", \"勺\", \"着\", \"额\", \"弥\", \"澈\", \"副\", \"攻\", \"碧\", \"磅\", \"诀\", \"胸\", \"矍\", \"藉\", \"跚\", \"沓\", \"卡\", \"包\", \"榜\", \"压\", \"达\", \"珞\", \"蜴\", \"就\", \"取\", \"哟\", \"谣\", \"兽\", \"爽\", \"膜\", \"轨\", \"浅\", \"稿\", \"á\", \"冀\", \"避\", \"仄\", \"领\", \"彦\", \"茁\", \"嫩\", \"硫\", \"⑤\", \"搁\", \"锤\", \"夯\", \"脂\", \"糟\", \"晕\", \"猖\", \"穰\", \"鄙\", \"瞄\", \"吭\", \"或\", \"讨\", \"袭\", \"逼\", \"效\", \"葬\", \"忡\", \"救\", \"反\", \"邃\", \"辐\", \"意\", \"铸\", \"统\", \"涵\", \"驭\", \"狼\", \"淞\", \"穴\", \"凰\", \"靓\", \"丈\", \"狱\", \"诉\", \"付\", \"棺\", \"捡\", \"窝\", \"怕\", \"材\", \"忧\", \"赡\", \"骇\", \"蹴\", \"铛\", \"强\", \"共\", \"炸\", \"怎\", \"豆\", \"摊\", \"笔\", \"稣\", \"误\", \"搀\", \"贿\", \"煤\", \"挣\", \"少\", \"抱\", \"蜷\", \"甄\", \"伞\", \"阂\", \"怀\", \"塞\", \"烘\", \"郝\", \"氨\", \"尹\", \"姿\", \"蔼\", \"驱\", \"被\", \"纤\", \"削\", \"镳\", \"晟\", \"迦\", \"护\", \"屑\", \"邀\", \"榄\", \"赫\", \"姊\", \"拦\", \"些\", \"瑄\", \"去\", \"栾\", \"悲\", \"烈\", \"犄\", \"酬\", \"屣\", \"网\", \"步\", \"〕\", \"阳\", \"資\", \"另\", \"卍\", \"尽\", \"琪\", \"朵\", \"黛\", \"惠\", \"\\u0000\", \"诚\", \"F\", \"羽\", \"么\", \"横\", \"榭\", \"吞\", \"叙\", \"旨\", \"遑\", \"ソ\", \"邂\", \"G\", \"B\", \"霄\", \"佩\", \"轮\", \"牛\", \"咚\", \"岚\", \"亂\", \"纪\", \"祉\", \"琶\", \"脖\", \"瞬\", \"漲\", \"\", \"梳\", \"咋\", \"炝\", \"骚\", \"磨\", \"隙\", \"痴\", \"间\", \"品\", \"眩\", \"溶\", \"彪\", \"废\", \"标\", \"殿\", \"煌\", \"腱\", \"耍\", \"杏\", \"觑\", \"啥\", \"谍\", \"澡\", \"是\", \"胺\", \"斋\", \"邵\", \"禁\", \"召\", \"届\", \"篷\", \"胃\", \"其\", \"暗\", \"悄\", \"予\", \"康\", \"纲\", \"绷\", \"榻\", \"呈\", \"虞\", \"哒\", \"侄\", \"辟\", \"侵\", \"舔\", \"荨\", \"曝\", \"潭\", \"绿\", \"泰\", \"租\", \"契\", \"那\", \"鳌\", \"邋\", \"燥\", \"碾\", \"禧\", \"宰\", \"坑\", \"ù\", \"拾\", \"币\", \"楷\", \"⑦\", \"叉\", \"舒\", \"调\", \"仪\", \"句\", \"纳\", \"译\", \"萤\", \"喱\", \"渊\", \"戈\", \"阜\", \"梯\", \"鹅\", \"焚\", \"吓\", \"损\", \"眺\", \"潇\", \"拧\", \"侮\", \"善\", \"曾\", \"核\", \"失\", \"氯\", \"议\", \"首\", \"筷\", \"曙\", \"磁\", \"淌\", \"兄\", \"诠\", \"鸥\", \"2\", \"何\", \"琦\", \"鬣\", \"离\", \"腰\", \"敲\", \"氮\", \"普\", \"荷\", \"务\", \"渔\", \"拌\", \"薪\", \"慈\", \"竞\", \"歩\", \"馏\", \"命\", \"从\", \"娇\", \"伽\", \"鲁\", \"枕\", \"芹\", \"翌\", \"集\", \"椒\", \"闹\", \"堆\", \"警\", \"廓\", \"垂\", \"绝\", \"育\", \"含\", \"霊\", \"靡\", \"旭\", \"圾\", \"孵\", \"忪\", \"娟\", \"谊\", \"躇\", \"委\", \"慢\", \"轴\", \"甬\", \"妈\", \"题\", \"富\", \"商\", \"戮\", \"痛\", \"军\", \"蠢\", \"备\", \"逛\", \"玳\", \"缔\", \"直\", \"棋\", \"鹈\", \"札\", \"虱\", \"妮\", \"迷\", \"米\", \"啡\", \"碗\", \"况\", \"楞\", \"罔\", \"禄\", \"扯\", \"制\", \"踵\", \"扪\", \"友\", \"垫\", \"向\", \"境\", \"顶\", \"罢\", \"麓\", \"诶\", \"〗\", \"故\", \"嘿\", \"毋\", \"透\", \"菇\", \"椰\", \"让\", \"沼\", \"岐\", \"蔑\", \"魄\", \"凳\", \"涅\", \"具\", \"展\", \"蹩\", \"恢\", \"妓\", \"舍\", \"碳\", \"探\", \"忿\", \"垛\", \"鼎\", \"业\", \"买\", \"赅\", \"搜\", \"蛋\", \"娠\", \"馍\", \"盹\", \"瑒\", \"喽\", \"a\", \"见\", \"岱\", \"锯\", \"灭\", \"雍\", \"④\", \"遵\", \"槐\", \"树\", \"⑿\", \"逾\", \"涨\", \"退\", \"刻\", \"匙\", \"错\", \"迁\", \"臭\", \"檀\", \"亨\", \"芒\", \"媳\", \"腭\", \"能\", \"赐\", \"倦\", \"皮\", \"叮\", \"优\", \"丽\", \"麻\", \"类\", \"轩\", \"还\", \"祈\", \"滔\", \"矛\", \"芥\", \"扮\", \"蚪\", \"拆\", \"赌\", \"履\", \"窘\", \"圳\", \"熬\", \"熹\", \"串\", \"踊\", \"莱\", \"睛\", \"聋\", \"忍\", \"汲\", \"鸩\", \"礴\", \"湄\", \"缀\", \"笃\", \"娘\", \"赣\", \"浑\", \"耩\", \"俏\", \"马\", \"凋\", \"滩\", \"们\", \"醉\", \"啸\", \"姻\", \"帆\", \"序\", \"想\", \"庚\", \"鲱\", \"摹\", \"龄\", \"挲\", \"孤\", \"馈\", \"嗔\", \"劲\", \"遁\", \"呆\", \"璨\", \"变\", \"谅\", \"戳\", \"腐\", \"虚\", \"隧\", \"焊\", \"创\", \"淇\", \"蚯\", \"鹌\", \"侨\", \"诩\", \"岩\", \"恳\", \"碎\", \"淡\", \"掂\", \"允\", \"料\", \"尤\", \"敢\", \"忱\", \"幼\", \"掰\", \"樯\", \"窄\", \"来\", \"淀\", \"换\", \"祛\", \"凑\", \"喘\", \"急\", \"蚁\", \"妆\", \"恭\", \"眼\", \"吕\", \"s\", \"鹜\", \"瓢\", \"施\", \"琼\", \"篢\", \"解\", \"悖\", \"齿\", \"字\", \"尉\", \"佝\", \"匪\", \"哨\", \"讪\", \"叭\", \"幢\", \"易\", \"拗\", \"唆\", \"胎\", \"悼\", \"涩\", \"墒\", \"粤\", \"祷\", \"耙\", \"疵\", \"雪\", \"妊\", \"锦\", \"踏\", \"擞\", \"嵌\", \"厄\", \"封\", \"什\", \"撅\", \"将\", \"萧\", \"柳\", \"铄\", \"呗\", \"娛\", \"砥\", \"洞\", \"设\", \"冠\", \"俨\", \"帮\", \"歪\", \"密\", \"莘\", \"笑\", \"黄\", \"旦\", \"嘭\", \"洒\", \"浇\", \"N\", \"卫\", \"镍\", \"搞\", \"茵\", \"昌\", \"霞\", \"暹\", \"吆\", \"狩\", \"噼\", \"龟\", \"砍\", \"停\", \"求\", \"肋\", \"鹏\", \"丧\", \"片\", \"潢\", \"沮\", \"形\", \"咨\", \"捞\", \"飚\", \"钊\", \"贾\", \"义\", \"电\", \"扳\", \"冈\", \"暄\", \"蛮\", \"瑶\", \"蝇\", \"驴\", \"捐\", \"燕\", \"牙\", \"亏\", \"M\", \"企\", \"兼\", \"攸\", \"雅\", \"鸡\", \"拙\", \"懊\", \"煲\", \"疏\", \"泽\", \"楠\", \"蓬\", \"沪\", \"车\", \"骄\", \"抡\", \"岣\", \"胡\", \"添\", \"按\", \"鉴\", \"简\", \"炙\", \"织\", \"嗡\", \"铭\", \"仆\", \"箔\", \"该\", \"脐\", \"梧\", \"释\", \"凡\", \"霏\", \"赢\", \"塔\", \"耐\", \"默\", \"V\", \"迎\", \"T\", \"乎\", \"荣\", \"跨\", \"毫\", \"扼\", \"敛\", \"革\", \"韬\", \"乘\", \"缪\", \"工\", \"蔡\", \"⒋\", \"爻\", \"景\", \"胳\", \"距\", \"轼\", \"莞\", \"完\", \"桦\", \"造\", \"紊\", \"價\", \"乖\", \"括\", \"谚\", \"说\", \"既\", \"改\", \"辑\", \"哈\", \"赘\", \"咳\", \"墅\", \"逶\", \"长\", \"雕\", \"逗\", \"鲜\", \"沈\", \"唠\", \"並\", \"胫\", \"昆\", \"问\", \"钓\", \"肖\", \"弦\", \"糕\", \"吃\", \"霓\", \"库\", \"俘\", \"嫂\", \"悍\", \"软\", \"邯\", \"蟑\", \"袖\", \"蟋\", \"卻\", \"晗\", \"染\", \"污\", \"驼\", \"膝\", \"逞\", \"郅\", \"抠\", \"庶\", \"枪\", \"芜\", \"弧\", \"锒\", \"檐\", \"曦\", \"柱\", \"鹦\", \"曹\", \"奠\", \"柄\", \"怵\", \"朗\", \"睽\", \"悬\", \"垮\", \"塌\", \"裸\", \"打\", \"栩\", \"陌\", \"寂\", \"邮\", \"\\b\", \"往\", \"虫\", \"并\", \"乒\", \"灰\", \"屉\", \"芽\", \"涯\", \"猬\", \"苍\", \"D\", \"呜\", \"怒\", \"梅\", \"怖\", \"杨\", \"挚\", \"炎\", \"油\", \"申\", \"边\", \"刺\", \"锅\", \"掬\", \"睦\", \"欠\", \"牖\", \"峡\", \"秽\", \"缠\", \"ὐ\", \"娑\", \"泄\", \"彩\", \"析\", \"毙\", \"俗\", \"入\", \"模\", \"瞰\", \"n\", \"暂\", \"吾\", \"尬\", \"杭\", \"诟\", \"羔\", \"术\", \"眨\", \"翘\", \"玲\", \"樊\", \"埔\", \"唬\", \"诃\", \"又\", \"泳\", \"惕\", \"异\", \"哀\", \"琐\", \"珏\", \"躬\", \"窍\", \"控\", \"条\", \"趟\", \"湖\", \"晋\", \"谴\", \"屹\", \"撸\", \"草\", \"潮\", \"带\", \"吊\", \"励\", \"怔\", \"饲\", \"闪\", \"浞\", \"负\", \"杜\", \"粼\", \"现\", \"滤\", \"历\", \"憨\", \"贮\", \"导\", \"费\", \"缸\", \"哼\", \"吼\", \"唐\", \"表\", \"蛛\", \"胚\", \"势\", \"供\", \"谢\", \"开\", \"猾\", \"纺\", \"惺\", \"当\", \"抓\", \"孽\", \"浦\", \"〝\", \"桢\", \"啦\", \"担\", \"诞\", \"绵\", \"陷\", \"\", \"裳\", \"麦\", \"ό\", \"浓\", \"晦\", \"络\", \"忽\", \"墓\", \"劫\", \"採\", \"陵\", \"剐\", \"支\", \"住\", \"隘\", \"壳\", \"燎\", \"漱\", \"唷\", \"蜥\", \"凭\", \"猎\", \"屁\", \"巧\", \"逃\", \"促\", \"隶\", \"茅\", \"歼\", \"传\", \"莫\", \"籽\", \"徐\", \"荐\", \"云\", \"阻\", \"弄\", \"胁\", \"渲\", \"嘛\", \"臼\", \"佛\", \"范\", \"玩\", \"扩\", \"衔\", \"摒\", \"猡\", \"败\", \"慕\", \"舛\", \"港\", \"膳\", \"饽\", \"瘠\", \"ê\", \"肮\", \"揭\", \"丁\", \"撤\", \"妥\", \"纯\", \"葛\", \"柬\", \"植\", \"穗\", \"馅\", \"宝\", \"咆\", \"惮\", \"伸\", \"焰\", \"⑷\", \"厢\", \"枯\", \"斑\", \"殷\", \"栗\", \"谛\", \"蔓\", \"阱\", \"泯\", \"旖\", \"凉\", \"桂\", \"湛\", \"陈\", \"象\", \"倍\", \"襄\", \"唱\", \"娱\", \"器\", \"韵\", \"征\", \"绽\", \"逐\", \"哎\", \"跟\", \"颠\", \"售\", \"证\", \"o\", \"团\", \"饼\", \"e\", \"寡\", \"宋\", \"彼\", \"巍\", \"径\", \"僵\", \"尖\", \"远\", \"邦\", \"踌\", \"鬓\", \"多\", \"种\", \"盒\", \"进\", \"烤\", \"闾\", \"磕\", \"闻\", \"旎\", \"蔽\", \"睁\", \"颧\", \"各\", \"饮\", \"酌\", \"辜\", \"颐\", \"龙\", \"乱\", \"环\", \"筐\", \"恃\", \"〃\", \"迪\", \"鸣\", \"华\", \"板\", \"媛\", \"缮\", \"丝\", \"掷\", \"惬\", \"拘\", \"ㄓ\", \"垒\", \"唾\", \"估\", \"馁\", \"橙\", \"夷\", \"墙\", \"粗\", \"汽\", \"梨\", \"每\", \"虽\", \"郸\", \"众\", \"邑\", \"衬\", \"敌\", \"朋\", \"视\", \"笼\", \"蜿\", \"淅\", \"亦\", \"∶\", \"研\", \"孀\", \"咔\", \"驻\", \"今\", \"悴\", \"筒\", \"袒\", \"辄\", \"死\", \"崇\", \"果\", \"峙\", \"搡\", \"精\", \"運\", \"双\", \"毗\", \"禽\", \"皆\", \"灵\", \"犀\", \"脏\", \"郜\", \"撕\", \"典\", \"旺\", \"危\", \"蚂\", \"蜂\", \"棱\", \"营\", \"孟\", \"祖\", \"复\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/fr": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1540504,
"_n_tokens": 484075,
"_n_chars": 1484970,
"_n_oov_chars": 66759,
"oov_ratio": 0.04495646376694479,
"_oov_charset": "[\"ë\", \"î\", \"D\", \"R\", \"S\", \"È\", \"ô\", \"\", \"̧\", \"\", \"Ê\", \"à\", \"W\", \"🙂\", \"Z\", \"😀\", \"♕\", \"℃\", \"V\", \"❤\", \"̂\", \"́\", \"U\", \"😉\", \"À\", \"J\", \"ü\", \"H\", \"
\", \"ê\", \"Ç\", \"K\", \"N\", \"C\", \"É\", \"🤔\", \"Ô\", \"è\", \"é\", \"A\", \"ï\", \"Y\", \"�\", \"ã\", \"í\", \"M\", \"â\", \"û\", \"F\", \"Q\", \"L\", \"I\", \"ç\", \"T\", \"P\", \"O\", \"B\", \"G\", \"ù\", \"X\", \"ğ\", \"Â\", \"ä\", \"E\", \"Î\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/es": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1664455,
"_n_tokens": 538042,
"_n_chars": 1630297,
"_n_oov_chars": 68333,
"oov_ratio": 0.041914448717012914,
"_oov_charset": "[\"D\", \"\", \"S\", \"R\", \"▷\", \"\", \"\", \"ô\", \"😦\", \"🙁\", \"\", \"à\", \"W\", \"ñ\", \"Á\", \"🙂\", \"Z\", \"😀\", \"V\", \"❤\", \"️\", \"U\", \"😉\", \"Ó\", \"✪\", \"✖\", \"J\", \"ü\", \"ö\", \"H\", \"✔\", \"K\", \"N\", \"C\", \"É\", \"ò\", \"á\", \"Y\", \"A\", \"é\", \"è\", \"М\", \"ó\", \"í\", \"M\", \"✓\", \"ú\", \"F\", \"Q\", \"L\", \"Ñ\", \"Ú\", \"I\", \"👏\", \"ý\", \"👍\", \"T\", \"P\", \"O\", \"B\", \"G\", \"\", \"X\", \"Í\", \"E\"]",
"lossless": false
},
"google/mt5-large @ cc100/en": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1124813,
"_n_tokens": 307881,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"⑦\", \"´\", \"⑧\", \"⑤\", \"\", \"�\", \"⑩\", \"‑\", \"③\", \"…\"]",
"lossless": false
},
"google/mt5-large @ cc100/zh-Hans": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 2633047,
"_n_tokens": 621182,
"_n_chars": 927311,
"_n_oov_chars": 68514,
"oov_ratio": 0.07388459750827932,
"_oov_charset": "[\"(\", \"i\", \"N\", \"棂\", \"4\", \"℃\", \";\", \"・\", \"瑥\", \"\\u0006\", \"6\", \"�\", \"\", \"V\", \"⑶\", \"\", \"⒁\", \"A\", \"\\u0005\", \"\", \"+\", \"t\", \"&\", \")\", \"T\", \"!\", \".\", \"犄\", \"瑒\", \"猡\", \"a\", \"p\", \" \", \"④\", \"⑿\", \"⒋\", \"9\", \"\\u0000\", \"\\u0007\", \"⑨\", \"\", \"h\", \""\", \":\", \"⑷\", \"/\", \"⑩\", \"5\", \"腭\", \"瑑\", \"黩\", \"⒂\", \"3\", \"\", \"_\", \"o\", \"e\", \"⑧\", \"瑨\", \"⒀\", \"耩\", \"锒\", \"犰\", \"鲱\", \"\", \"7\", \"⑸\", \"C\", \"擤\", \"1\", \"[\", \"②\", \"0\", \"瑢\", \"阽\", \"③\", \"\\b\", \"]\", \"⑦\", \"%\", \",\", \"⑥\", \"8\", \"d\", \"D\", \"…\", \"①\", \" \", \"?\", \"r\", \"s\", \"-\", \"⒌\", \"⑴\", \" \", \"篢\", \"佝\", \"2\", \"n\", \"⑤\", \"鼯\", \"黢\", \"⒃\"]",
"lossless": false
},
"google/mt5-large @ cc100/fr": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1540504,
"_n_tokens": 460944,
"_n_chars": 1484970,
"_n_oov_chars": 839,
"oov_ratio": 0.0005649945790150643,
"_oov_charset": "[\"´\", \"²\", \"℃\", \"µ\", \"�\", \"″\", \"™\", \"…\"]",
"lossless": false
},
"google/mt5-large @ cc100/es": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1664455,
"_n_tokens": 462231,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"´\", \"²\", \"\", \"ª\", \"″\", \"º\", \"…\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/en": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1124813,
"_n_tokens": 280104,
"_n_chars": 1121360,
"_n_oov_chars": 136,
"oov_ratio": 0.00012128130127702077,
"_oov_charset": "[\"⑦\", \"😥\", \"\", \"{\", \"\", \"~\", \"…\", \"‑\", \"ñ\", \"🙂\", \"´\", \"⑧\", \"😉\", \"^\", \"}\", \"¡\", \"�\", \"¦\", \"ï\", \"\", \"⑤\", \"\", \"⑩\", \"③\", \"<\", \"\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/zh-Hans": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2633047,
"_n_tokens": 163519,
"_n_chars": 927311,
"_n_oov_chars": 865446,
"oov_ratio": 0.9332855967415462,
"_oov_charset": "[\"搅\", \"千\", \"太\", \"稻\", \"缕\", \"膨\", \"星\", \"杆\", \"痕\", \"抽\", \"滓\", \"办\", \"淋\", \"址\", \"郊\", \"霸\", \"墟\", \"惹\", \"先\", \"沥\", \"构\", \"徨\", \"恒\", \"著\", \"狈\", \"都\", \"戢\", \"竭\", \"畜\", \"擂\", \"吗\", \"奸\", \"壮\", \"α\", \"伟\", \"东\", \"政\", \"蕴\", \"羁\", \"ě\", \"射\", \"咏\", \"撒\", \"蕾\", \"窃\", \"倩\", \"劑\", \"腾\", \"突\", \"等\", \"犹\", \"嗯\", \"渺\", \"龚\", \"愤\", \"赚\", \"矮\", \"股\", \"~\", \"知\", \"擦\", \"伪\", \"罕\", \"甚\", \"掏\", \"遢\", \"李\", \"跷\", \"手\", \"簿\", \"赴\", \"者\", \"猴\", \"障\", \"俯\", \"客\", \"擅\", \"程\", \"宸\", \"款\", \"褒\", \"腺\", \"续\", \"迈\", \"哄\", \"涌\", \"骸\", \"路\", \"谐\", \"茎\", \"睡\", \"晨\", \"嫁\", \"庞\", \"跻\", \"苹\", \"衰\", \"脾\", \"》\", \"圜\", \"讼\", \"揪\", \"钦\", \"嫉\", \"壹\", \"承\", \"婆\", \"饶\", \"搬\", \"澎\", \"箭\", \"防\", \"几\", \"泛\", \"溪\", \"9\", \"弃\", \"骑\", \"堤\", \"鹃\", \"槌\", \"唇\", \"刃\", \"瑧\", \"捺\", \"铤\", \"鄂\", \"丰\", \"宜\", \"需\", \"阶\", \"懈\", \"戏\", \"妻\", \"踝\", \"冷\", \"睑\", \"昵\", \"眯\", \"薇\", \"闷\", \"晓\", \"冽\", \"像\", \"渥\", \"追\", \"寇\", \"注\", \"怯\", \"烫\", \"怂\", \"矿\", \"〉\", \"轶\", \"咬\", \"【\", \"也\", \"咒\", \"肃\", \"镇\", \"』\", \"独\", \"绩\", \"帅\", \"偌\", \"铜\", \"例\", \"▪\", \"迅\", \"足\", \"悠\", \"守\", \"澄\", \"炖\", \"粹\", \"稳\", \"铺\", \"牡\", \"灌\", \"闯\", \"属\", \"黎\", \"陆\", \"帜\", \"衿\", \"咙\", \"绥\", \"1\", \"如\", \"腻\", \"②\", \"画\", \"堡\", \"猜\", \"凹\", \"抵\", \"祟\", \"纠\", \"逢\", \"〞\", \"蹒\", \"丢\", \"试\", \"诈\", \"弩\", \"鳃\", \"餐\", \"{\", \"批\", \"遭\", \"叔\", \"观\", \"叶\", \"铨\", \"姬\", \"绰\", \"五\", \"踩\", \"屡\", \"宇\", \"衍\", \"铂\", \"秒\", \"⒌\", \"姜\", \"给\", \"垃\", \"棵\", \"瞳\", \"捂\", \"层\", \"愿\", \"瓦\", \"蒋\", \"位\", \"葵\", \"佰\", \"玖\", \"温\", \"闭\", \"殊\", \"跑\", \"睹\", \"狰\", \"族\", \"肝\", \"铃\", \"暴\", \"尴\", \"饷\", \"桐\", \"胶\", \"臊\", \"尘\", \"裔\", \"肓\", \"阐\", \"赎\", \"落\", \"碱\", \"使\", \"劈\", \"叹\", \"扁\", \"评\", \"险\", \"冶\", \"鲎\", \"悯\", \"痰\", \"女\", \"穷\", \"筹\", \"苯\", \"捆\", \"航\", \"紫\", \"髦\", \"短\", \"郴\", \"挥\", \"嘘\", \"抨\", \"嘉\", \"嚎\", \"烊\", \"挝\", \"美\", \"滢\", \"衫\", \"融\", \"砺\", \"鞭\", \"霹\", \"赋\", \"泸\", \"逍\", \"镕\", \"夕\", \"拇\", \"姓\", \"ズ\", \"�\", \"傲\", \"督\", \"晾\", \"颇\", \"啃\", \"斜\", \"犁\", \"襟\", \"蓦\", \"羡\", \"丘\", \"仗\", \"怨\", \"吠\", \"凛\", \"惊\", \"佐\", \"漓\", \"遴\", \"笨\", \"件\", \"跳\", \"无\", \"\", \"男\", \"摩\", \"秉\", \"莲\", \"绕\", \"孩\", \"汕\", \"魔\", \"驾\", \"啕\", \"旌\", \"炫\", \"蚌\", \"昏\", \"偿\", \"剩\", \"佼\", \"咸\", \"蒿\", \"前\", \"確\", \"旆\", \"泌\", \"菜\", \"摄\", \"格\", \"璀\", \"图\", \"勇\", \"憾\", \"诲\", \"销\", \"决\", \"谱\", \"仰\", \"必\", \"侧\", \"赁\", \"诅\", \"授\", \"電\", \"借\", \"臂\", \"消\", \"低\", \"帖\", \"粉\", \"忌\", \"栏\", \"鱼\", \"仍\", \"肘\", \"相\", \"刁\", \"诺\", \"蹲\", \"情\", \"练\", \"父\", \"喝\", \"粥\", \"厮\", \"恣\", \"毒\", \"线\", \"与\", \"祢\", \"辖\", \"朦\", \"狮\", \"伤\", \"增\", \"裂\", \"杂\", \"氧\", \"馆\", \"泊\", \"踹\", \"坡\", \"顷\", \"塘\", \"汀\", \"奈\", \"犰\", \"裙\", \"惴\", \"狞\", \"耶\", \"彬\", \"阵\", \"7\", \"逅\", \"谆\", \"咧\", \"盼\", \"稍\", \"侃\", \"永\", \"食\", \"楂\", \"登\", \"末\", \"漏\", \"涡\", \"匕\", \"歇\", \"蚊\", \"七\", \"夹\", \"胆\", \"誉\", \"俄\", \"趋\", \"汇\", \"泠\", \"肉\", \"盾\", \"扛\", \"墉\", \"碴\", \"闫\", \"苑\", \"噩\", \"记\", \"尚\", \"舶\", \"⑴\", \"滑\", \"方\", \"考\", \"耳\", \"念\", \"捍\", \"鳞\", \"论\", \"徊\", \"砸\", \"零\", \"篇\", \"鞍\", \"疼\", \"弈\", \"抢\", \"君\", \"语\", \"狡\", \"盏\", \"宗\", \"汶\", \"凯\", \"丫\", \"破\", \"师\", \"朱\", \"拣\", \"谓\", \"←\", \"摞\", \"彰\", \"残\", \"山\", \"庄\", \"镶\", \"恿\", \"投\", \"涸\", \"乍\", \"(\", \"疮\", \"信\", \"掠\", \"述\", \"骁\", \"栋\", \"跪\", \"阔\", \"均\", \"褐\", \"瑞\", \"畴\", \"渎\", \"岖\", \"擘\", \"舌\", \"兑\", \"盖\", \"睐\", \"覃\", \"愧\", \"期\", \"瑥\", \"谎\", \"6\", \"皈\", \"滚\", \"×\", \"个\", \"哗\", \"懑\", \"艾\", \"嫖\", \"曰\", \"冲\", \"列\", \"炒\", \"洼\", \"溃\", \"焕\", \"ο\", \"功\", \"快\", \"聘\", \"薛\", \"嫌\", \"津\", \"颊\", \"才\", \"检\", \"皑\", \"莓\", \"藕\", \"徇\", \"剥\", \"裕\", \"笋\", \"敞\", \"原\", \"滞\", \"乞\", \"恤\", \"治\", \"击\", \"憬\", \"涛\", \"瓶\", \"咦\", \"桶\", \"勉\", \"⒁\", \"赠\", \"咎\", \"若\", \"不\", \"迩\", \"聂\", \"钩\", \"濒\", \"t\", \"禾\", \"索\", \"芮\", \"斛\", \"吸\", \"窜\", \"刨\", \"半\", \"齐\", \"娴\", \"暖\", \"喊\", \"撑\", \"缩\", \"舱\", \"妤\", \"碟\", \"且\", \"套\", \"俺\", \"聊\", \"乐\", \"缘\", \"咐\", \"扫\", \"戾\", \"沙\", \"酷\", \"沂\", \"劣\", \"雄\", \"黑\", \"俑\", \"霖\", \"譬\", \"皖\", \"殴\", \"措\", \"雯\", \"恐\", \"芭\", \"归\", \"整\", \"始\", \"引\", \"戸\", \"斗\", \"械\", \"瘤\", \"\", \"囚\", \"雁\", \"毯\", \"⒂\", \"3\", \"奥\", \"獗\", \"勋\", \"致\", \"拿\", \"婊\", \"羊\", \"甘\", \"药\", \"坐\", \"醇\", \"禅\", \"崎\", \"屌\", \"聆\", \"蔚\", \"清\", \"璜\", \"否\", \"频\", \"爷\", \"牌\", \"和\", \"彭\", \"扇\", \"搐\", \"室\", \"受\", \"姨\", \"脯\", \"绣\", \"肤\", \"亳\", \"及\", \"兆\", \"猪\", \"肴\", \"瞥\", \"惭\", \"耸\", \"廖\", \"谜\", \"辉\", \"识\", \"债\", \"违\", \"症\", \"穿\", \"薄\", \"灸\", \"断\", \"森\", \"涎\", \"暑\", \"逑\", \"腿\", \"歉\", \"内\", \"]\", \"痘\", \"瀚\", \"喀\", \"陨\", \"岗\", \"册\", \"愉\", \"生\", \"邱\", \"稚\", \"纷\", \"攀\", \"做\", \"年\", \"钰\", \"玮\", \"卦\", \"汝\", \"翰\", \"谭\", \"眉\", \"亿\", \"爰\", \"噴\", \"公\", \"正\", \"悉\", \"鼻\", \"斤\", \"仔\", \"厚\", \"泻\", \"移\", \"灿\", \"璧\", \"蓄\", \"喉\", \"拎\", \"纾\", \"扒\", \"冤\", \"抚\", \"胜\", \"切\", \"陕\", \"得\", \"杖\", \"撼\", \"骨\", \"堪\", \"聪\", \"毎\", \"董\", \"习\", \"常\", \"奏\", \"棚\", \"垢\", \"刑\", \"气\", \"選\", \"溉\", \"炕\", \"霈\", \"〈\", \"框\", \"震\", \"坷\", \"钝\", \"爱\", \"组\", \"学\", \"头\", \"柚\", \"江\", \"艘\", \"桅\", \"眷\", \"恋\", \"員\", \"伊\", \"塑\", \"闵\", \"掳\", \"节\", \"溺\", \"妇\", \"芙\", \"健\", \"询\", \"脊\", \"霾\", \"4\", \"撩\", \"浪\", \"巳\", \"选\", \"诫\", \"鲨\", \"魇\", \"湘\", \"沿\", \";\", \"祭\", \"束\", \"淫\", \"填\", \"铁\", \"韫\", \"奂\", \"雷\", \"馋\", \"己\", \"昭\", \"章\", \"良\", \"赞\", \"」\", \"霭\", \"吐\", \"合\", \"筑\", \"骤\", \"荡\", \"踪\", \"尺\", \"疲\", \"茫\", \"舅\", \"玫\", \"棒\", \"胰\", \"席\", \"顿\", \"驰\", \"腥\", \"涮\", \"阎\", \"颓\", \"窗\", \"参\", \"茱\", \"俞\", \"樟\", \"枉\", \"匈\", \"泥\", \"杉\", \"汐\", \"瞠\", \"诗\", \"枢\", \"流\", \"晶\", \"留\", \"匹\", \"蹭\", \"遛\", \"卓\", \"偷\", \"偻\", \"璃\", \"贡\", \"琴\", \"汤\", \"淼\", \"免\", \"椅\", \"擎\", \"峻\", \"烛\", \"馒\", \"子\", \"技\", \"枝\", \"円\", \"◆\", \"犯\", \"卧\", \"杠\", \"绅\", \"拉\", \"馕\", \"侠\", \"患\", \"妞\", \"占\", \"哭\", \"牠\", \"更\", \"凶\", \"拍\", \"娶\", \"降\", \"蜜\", \"贬\", \"绍\", \"暨\", \"您\", \"磺\", \"菲\", \"俚\", \"噢\", \"海\", \"拭\", \"阑\", \"岌\", \"仙\", \"酸\", \"医\", \"為\", \"⑩\", \"兵\", \"缆\", \"升\", \"采\", \"堕\", \"黩\", \"挡\", \"炼\", \"员\", \"傅\", \"\", \"娃\", \"颌\", \"宠\", \"王\", \"逸\", \"皿\", \"恩\", \"驶\", \"蝌\", \"际\", \"僧\", \"葱\", \"眠\", \"捷\", \"喔\", \"ト\", \"迤\", \"弓\", \"花\", \"害\", \"献\", \"屋\", \"隐\", \"铩\", \"烟\", \"培\", \"角\", \"宪\", \"成\", \"爸\", \"婉\", \"屄\", \"膛\", \"發\", \"鞠\", \"臻\", \"由\", \"逻\", \"挽\", \"锡\", \"攫\", \"炅\", \"癌\", \"铮\", \"谬\", \"岁\", \"娥\", \"砂\", \"琅\", \"涝\", \"芝\", \"祸\", \"[\", \"覆\", \"怠\", \"窟\", \"煜\", \"犟\", \"芃\", \"糯\", \"蹊\", \"重\", \"の\", \"萍\", \"招\", \"標\", \"胥\", \"呐\", \"殆\", \"③\", \"缅\", \"蒜\", \"崽\", \"傥\", \"市\", \"飙\", \"绳\", \"愁\", \"阮\", \"亟\", \"坟\", \"诬\", \"掩\", \"仕\", \"疙\", \"获\", \"演\", \"扔\", \"厅\", \"埃\", \"翱\", \"刷\", \"城\", \"篱\", \"鲸\", \"渐\", \"岭\", \"援\", \"光\", \"虐\", \"灑\", \"-\", \"北\", \"楣\", \"却\", \"芯\", \"锣\", \"代\", \"嬉\", \"农\", \"洪\", \"差\", \"}\", \"处\", \"囤\", \"耀\", \"▲\", \"佣\", \"汁\", \"鸭\", \"放\", \"坛\", \"慮\", \"乔\", \"衣\", \"鹕\", \"讷\", \"柔\", \"最\", \"踢\", \"挠\", \"踞\", \"蜀\", \"根\", \"噬\", \"鼯\", \"散\", \"郎\", \"髻\", \"傍\", \"掀\", \"坝\", \"嗲\", \"凄\", \"肾\", \"闸\", \"跃\", \"萦\", \"i\", \"貌\", \"壓\", \"缭\", \"匿\", \"飕\", \"这\", \"监\", \"弹\", \"吨\", \"嘲\", \"样\", \"巫\", \"补\", \"恶\", \"懒\", \"陋\", \"听\", \"俊\", \"黯\", \"亚\", \"尝\", \"淆\", \"焉\", \"煎\", \"骅\", \"衷\", \"钧\", \"棣\", \"似\", \"收\", \"颁\", \"抗\", \"茶\", \"九\", \"锏\", \"铎\", \"翕\", \"爪\", \"链\", \"闺\", \"挪\", \"岔\", \"噱\", \"袍\", \"劝\", \"锁\", \"肌\", \"吁\", \"辰\", \"到\", \"寻\", \"黔\", \"褚\", \"槿\", \"周\", \"究\", \"大\", \"裆\", \"理\", \"嘴\", \"撰\", \"较\", \"积\", \"莉\", \"税\", \"赤\", \"蘑\", \"巅\", \"愈\", \"录\", \"飞\", \"自\", \"瑜\", \"泣\", \"瑰\", \"镐\", \"讽\", \"浮\", \"別\", \"谋\", \"茨\", \"宛\", \"贝\", \"沉\", \"倏\", \"翔\", \"蝶\", \"灼\", \"谦\", \"廊\", \"键\", \"液\", \"旗\", \"辫\", \"六\", \"瓜\", \"色\", \"啬\", \"希\", \"寨\", \"挖\", \"码\", \"他\", \"疹\", \"老\", \"诊\", \"槛\", \"饿\", \"汛\", \"卵\", \"菩\", \"觉\", \"村\", \"蔬\", \"煽\", \"割\", \"绸\", \"鸿\", \"豚\", \"螃\", \"日\", \"贯\", \"侦\", \"堵\", \"亭\", \"符\", \"座\", \"旧\", \"醛\", \"內\", \"5\", \"拂\", \"菌\", \"遏\", \"随\", \"刹\", \"怜\", \"<\", \"膊\", \"滥\", \"涣\", \"吧\", \"庆\", \"圩\", \"魏\", \"骏\", \"未\", \"派\", \"辙\", \"坤\", \"攒\", \"漉\", \"珉\", \"炮\", \"寐\", \"掺\", \"秩\", \"乃\", \"韦\", \"峭\", \"桓\", \"町\", \"哪\", \"满\", \"唤\", \"洽\", \"钮\", \"卿\", \"咖\", \"姚\", \"渤\", \"汪\", \"悟\", \"報\", \"吵\", \"窿\", \"御\", \"弛\", \"凤\", \"狗\", \"蹈\", \"ς\", \"琉\", \"畑\", \"速\", \"块\", \"讦\", \"容\", \"漪\", \"宵\", \"察\", \"『\", \"躯\", \"诱\", \"弑\", \"猛\", \"社\", \"泼\", \"渝\", \"阽\", \"帝\", \"戍\", \"黏\", \"中\", \"剁\", \"峰\", \"罪\", \"宴\", \"杀\", \"把\", \"拢\", \"皱\", \"兹\", \"街\", \"渗\", \"指\", \"颖\", \"刊\", \"狭\", \"─\", \"逮\", \"榴\", \"疴\", \"酱\", \"厘\", \"①\", \"插\", \"烬\", \"纨\", \"略\", \"r\", \"资\", \"省\", \"函\", \"噌\", \"而\", \"奶\", \"茧\", \"強\", \"拓\", \"彤\", \"恕\", \"坦\", \"约\", \"蒸\", \"竺\", \"吩\", \"笆\", \"烁\", \"烷\", \"跤\", \"揣\", \"簇\", \"鹭\", \"撬\", \"娅\", \"滨\", \"勖\", \"钜\", \"庸\", \"洋\", \"沦\", \"哉\", \"卜\", \"雇\", \"础\", \"棉\", \"婚\", \"尾\", \"陶\", \"规\", \"邻\", \"适\", \"瞻\", \"静\", \"排\", \"盯\", \"联\", \"膀\", \"霜\", \"榨\", \"次\", \"镜\", \"忘\", \"胞\", \"璇\", \"疸\", \"球\", \"贴\", \"蛔\", \"庐\", \"谑\", \"践\", \"抖\", \"混\", \"栽\", \"寥\", \"吏\", \"恙\", \"鼠\", \"拔\", \"郁\", \"谷\", \"庭\", \"书\", \"兰\", \"亡\", \"炳\", \"滋\", \"柏\", \"战\", \"澜\", \"史\", \"金\", \"欢\", \"钱\", \"摘\", \"溢\", \"吴\", \"陀\", \"熔\", \"聒\", \"扬\", \"趾\", \"婶\", \"挺\", \"姣\", \"态\", \"绘\", \"烹\", \"V\", \"季\", \"恪\", \"矢\", \"舰\", \"熄\", \"厉\", \"狐\", \"偏\", \"耻\", \"蔷\", \"择\", \"暇\", \"数\", \"激\", \"诵\", \"徘\", \"呵\", \"罹\", \"饰\", \"秘\", \"腑\", \"礼\", \"瓣\", \"宣\", \"懂\", \"耽\", \"徳\", \"量\", \"依\", \"疯\", \"篮\", \"痹\", \"柘\", \"呷\", \"科\", \"讲\", \"舐\", \"莺\", \"朽\", \"讳\", \"结\", \"翩\", \"牺\", \"智\", \"虎\", \"權\", \"伦\", \"漫\", \"候\", \"拱\", \"珠\", \"舵\", \"签\", \"倜\", \"髓\", \"沾\", \"湿\", \"蓁\", \"厨\", \"咽\", \"躁\", \"茸\", \"点\", \"卤\", \"勘\", \"锌\", \"嘣\", \"攥\", \"详\", \"瑕\", \"蛊\", \"巡\", \"桌\", \"嘱\", \"摧\", \"西\", \"池\", \"浠\", \"稠\", \"号\", \"判\", \"难\", \"哦\", \"欺\", \"霍\", \"谔\", \"腔\", \"撷\", \"虏\", \"蚀\", \"⑧\", \"夭\", \"瀛\", \"屏\", \"翊\", \"敝\", \"漩\", \"礁\", \"箍\", \"在\", \"铝\", \"邸\", \"辨\", \"漆\", \"秋\", \"蹿\", \"鹑\", \"動\", \"玻\", \"轿\", \"抛\", \"央\", \"啐\", \"沃\", \"谧\", \"寰\", \"坊\", \"哲\", \"夺\", \"罚\", \"古\", \"概\", \"纹\", \"巩\", \"秃\", \"胧\", \"惜\", \"凸\", \"殖\", \"艇\", \"烦\", \",\", \"诨\", \"渍\", \"剧\", \"浸\", \"关\", \"丐\", \"坞\", \"壁\", \"曼\", \"看\", \"斌\", \"跋\", \"沸\", \"槃\", \"畿\", \"瘦\", \"彙\", \"燃\", \"後\", \"用\", \"纵\", \"严\", \"夸\", \"。\", \"寅\", \"帕\", \"贱\", \"徽\", \"玷\", \"倒\", \"冥\", \"厂\", \"邓\", \"纬\", \"迭\", \"幽\", \"荫\", \"τ\", \"弟\", \"霆\", \"崔\", \"绊\", \"硅\", \"撇\", \"橇\", \"呦\", \"嚣\", \"飓\", \"姆\", \"耦\", \"摔\", \"粱\", \"裴\", \"茂\", \"绚\", \"遣\", \"赵\", \"⒃\", \"基\", \"妖\", \"旅\", \"群\", \"驳\", \"挟\", \"第\", \"剔\", \"洁\", \"篝\", \"浩\", \"沐\", \"皂\", \"豪\", \"瞪\", \"啜\", \"溅\", \"雨\", \"居\", \"趣\", \"棘\", \"眶\", \"但\", \"・\", \"拳\", \"舞\", \"糖\", \"莎\", \"澳\", \"媚\", \"伴\", \"幸\", \"聿\", \"火\", \"挨\", \"锚\", \"两\", \"配\", \"砾\", \"枚\", \"蓉\", \"你\", \"找\", \"通\", \"渡\", \"芳\", \"帐\", \"唉\", \"微\", \"酿\", \"旬\", \"宾\", \"婴\", \"皇\", \"姗\", \"待\", \"后\", \"A\", \"嘈\", \"厌\", \"谈\", \"\\u0005\", \"亮\", \"豁\", \"呕\", \"滇\", \"孱\", \"疗\", \"望\", \"斧\", \"僚\", \"袱\", \"&\", \"沏\", \"圈\", \"戚\", \"以\", \"蕉\", \"荧\", \"骼\", \"催\", \"撐\", \"刮\", \"時\", \"斩\", \"窦\", \"哺\", \"纂\", \"呼\", \"非\", \"秤\", \"迄\", \"协\", \"灶\", \"肚\", \"蒙\", \"鸦\", \"→\", \"汹\", \"橱\", \"伙\", \"助\", \"躲\", \"率\", \"卸\", \"蘸\", \"叨\", \"维\", \"了\", \"机\", \"赖\", \"橄\", \"乳\", \"趴\", \"孰\", \"飘\", \"粟\", \"认\", \"右\", \"媲\", \"亥\", \"_\", \"盗\", \"屠\", \"掖\", \"床\", \"锋\", \"辆\", \"暧\", \"昨\", \"味\", \"盎\", \"凿\", \"累\", \"據\", \"蜃\", \"临\", \"寿\", \"瑨\", \"喆\", \"益\", \"冬\", \"鹿\", \"辣\", \"吝\", \"溯\", \"雀\", \"奢\", \"粕\", \"尧\", \"外\", \"魁\", \"聚\", \"豫\", \"酋\", \"责\", \"货\", \"田\", \"崩\", \"裹\", \"翅\", \"肆\", \"忙\", \"挫\", \"毅\", \"茏\", \"嗓\", \"●\", \"目\", \"妙\", \"炊\", \"砌\", \"准\", \"焯\", \"戛\", \"艋\", \"峥\", \"揍\", \"台\", \"唯\", \"呢\", \"杰\", \"鼓\", \"早\", \"黝\", \"娜\", \"乾\", \"萎\", \"藏\", \"铲\", \"郭\", \"洛\", \"甲\", \"乏\", \"丑\", \"敦\", \"哇\", \" \", \"涕\", \"丙\", \"^\", \"呻\", \"肢\", \"蛙\", \"柴\", \"世\", \"脱\", \"脚\", \"鞋\", \"氏\", \"叼\", \"抿\", \"汉\", \"纱\", \"兔\", \"歌\", \"弯\", \"偎\", \"π\", \"涤\", \"伏\", \"麾\", \"椭\", \"血\", \"鬼\", \"热\", \"臧\", \"溜\", \"扉\", \"嘎\", \"猩\", \"璎\", \"螺\", \"净\", \"憔\", \"焙\", \"疑\", \"剪\", \"缜\", \"显\", \"埂\", \"票\", \"骆\", \"夏\", \"孝\", \"任\", \"户\", \"棂\", \"肥\", \"谩\", \"干\", \"她\", \"※\", \"蝉\", \"濮\", \"班\", \"苗\", \"好\", \"℃\", \"乡\", \"绉\", \"萝\", \"初\", \"拥\", \"堂\", \"肿\", \"执\", \"萄\", \"久\", \"荤\", \"载\", \"刀\", \"醒\", \"幻\", \"诣\", \"连\", \"俩\", \"英\", \"胀\", \"茉\", \"即\", \"於\", \"岛\", \"名\", \"值\", \"嗜\", \"偶\", \"建\", \"沁\", \"绑\", \"勃\", \"搂\", \"屈\", \"麟\", \"韧\", \"叫\", \"卉\", \"钵\", \"牵\", \"喷\", \"躺\", \"便\", \"歹\", \"贤\", \"籁\", \"测\", \"讯\", \"壤\", \"化\", \"赔\", \"延\", \"奔\", \"神\", \"滴\", \"琛\", \"戴\", \"队\", \"空\", \"券\", \"宿\", \"婺\", \"人\", \"颈\", \"匠\", \"孔\", \"请\", \"滕\", \"娼\", \"粮\", \"奎\", \"缓\", \"争\", \"没\", \"瞧\", \"吮\", \"端\", \"籍\", \"锐\", \"乙\", \"颉\", \"嘀\", \"沧\", \"仲\", \"湃\", \"绎\", \"岳\", \"寞\", \"倚\", \"惶\", \"拒\", \"有\", \"h\", \"地\", \"携\", \"预\", \"/\", \"株\", \"振\", \"月\", \"颜\", \"醍\", \"蜕\", \"侯\", \"慨\", \"洲\", \"拨\", \"揖\", \"イ\", \"蜒\", \"别\", \"椎\", \"顽\", \"靴\", \"慷\", \"阁\", \"场\", \"贫\", \"詹\", \"剖\", \"匀\", \"壑\", \"陛\", \"攘\", \"疤\", \"灯\", \"邕\", \"皙\", \"袁\", \"兮\", \"览\", \"济\", \"矣\", \"糊\", \"总\", \"鄯\", \"过\", \"愕\", \"珍\", \"坏\", \"橡\", \"讥\", \"摇\", \"盐\", \"梭\", \"钟\", \"赛\", \"洗\", \"锲\", \"性\", \"彻\", \"辩\", \"箱\", \"音\", \"窒\", \"牲\", \"案\", \"酝\", \"瘾\", \"实\", \"店\", \"贵\", \"惦\", \"甜\", \"波\", \"经\", \"寓\", \"比\", \"嘻\", \"莅\", \"%\", \"鸽\", \"侬\", \"斥\", \"浊\", \"彗\", \"钢\", \"爵\", \"苇\", \"律\", \"朔\", \"番\", \"鹤\", \"馨\", \"潜\", \"架\", \"冯\", \"影\", \"林\", \"奘\", \"涉\", \"啼\", \"棍\", \"威\", \"柑\", \"翁\", \"淳\", \"扰\", \"明\", \"段\", \"廉\", \"氢\", \"颤\", \"作\", \"荒\", \"应\", \"榆\", \"悦\", \"淑\", \"趁\", \"谨\", \"穆\", \"痪\", \"漠\", \"渣\", \"腹\", \"提\", \"僻\", \"页\", \"斯\", \"匆\", \"驮\", \"菱\", \"综\", \"碍\", \"妨\", \"爆\", \"职\", \"睿\", \"槽\", \"闲\", \"巨\", \"昊\", \"界\", \"平\", \"肯\", \"镀\", \"惩\", \"病\", \"拖\", \"纰\", \"肺\", \"舀\", \"姐\", \"挂\", \"掘\", \"熟\", \"柯\", \"假\", \"阴\", \"捅\", \"涟\", \"姥\", \"腋\", \"矗\", \"一\", \"俪\", \"葩\", \"虔\", \"息\", \"孪\", \"渠\", \"繁\", \"石\", \"浴\", \"臀\", \"豹\", \"夥\", \"擀\", \"梗\", \"言\", \"厦\", \"伐\", \"雌\", \"剑\", \"钥\", \"垄\", \"旁\", \"畔\", \"栖\", \"托\", \"拽\", \"袜\", \"艺\", \"堰\", \"拟\", \"般\", \"冒\", \"辽\", \"秦\", \"虑\", \"圆\", \"孙\", \"道\", \"蝗\", \"川\", \"酵\", \"县\", \"窥\", \"婪\", \"羞\", \"+\", \"盲\", \"绪\", \"鼾\", \"沫\", \"讶\", \"搭\", \"楚\", \"嗣\", \"蚓\", \"旱\", \"忐\", \"潘\", \"ヨ\", \"镭\", \"划\", \"觅\", \"郡\", \"屎\", \"倘\", \"牢\", \"弘\", \"絮\", \"定\", \"龇\", \"悔\", \"褪\", \"恰\", \"伯\", \"辞\", \"泉\", \"陡\", \"烯\", \"笛\", \"辕\", \"p\", \"媒\", \"侣\", \"宏\", \"剂\", \"锥\", \"附\", \"⑨\", \"\", \"确\", \"雏\", \"惋\", \"弱\", \"宽\", \"握\", \"瘫\", \"恨\", \"贼\", \"噪\", \"Ø\", \"晒\", \"保\", \"兢\", \"蹄\", \"教\", \"管\", \"编\", \"摸\", \"涂\", \"荏\", \"仇\", \"枷\", \"★\", \"畏\", \"勿\", \"埠\", \"近\", \"锻\", \"泱\", \"栈\", \"慑\", \"秸\", \"倨\", \"爹\", \"愚\", \"鹉\", \"剽\", \"质\", \"咯\", \"邪\", \"仁\", \"⒀\", \"盆\", \"须\", \"荟\", \"牧\", \"梦\", \"阀\", \"文\", \"查\", \"操\", \"勒\", \"背\", \"拼\", \"倡\", \"左\", \"奋\", \"岑\", \"遮\", \"锢\", \"垠\", \"脑\", \"褂\", \"蜘\", \"伉\", \"酪\", \"深\", \"权\", \"萌\", \"坪\", \"谁\", \"沽\", \"钞\", \"甫\", \"痒\", \"邢\", \"竹\", \"浙\", \"全\", \"葡\", \"度\", \"佟\", \"煮\", \"0\", \"虹\", \"忆\", \"砖\", \"賣\", \"氰\", \"野\", \"告\", \"渴\", \"抬\", \"坠\", \"淄\", \"庙\", \"绛\", \"寸\", \"薰\", \"型\", \"盟\", \"卷\", \"逊\", \"咕\", \"帘\", \"贩\", \"童\", \"曳\", \"遗\", \"敬\", \"于\", \"呀\", \"宫\", \"啤\", \"赶\", \"耘\", \"捧\", \"邬\", \"峨\", \"佳\", \"崖\", \"署\", \"舎\", \"针\", \"惚\", \"蕤\", \"印\", \"撞\", \"德\", \"儒\", \"挑\", \"硬\", \"烧\", \"装\", \"茜\", \"碑\", \"儿\", \"诧\", \"肪\", \"因\", \"据\", \"螂\", \"糠\", \"惰\", \"埋\", \"价\", \"瞎\", \"叛\", \"捕\", \"遍\", \"卑\", \"为\", \"毡\", \"吉\", \"嚼\", \"癜\", \"抒\", \"俱\", \"声\", \"润\", \"局\", \"韩\", \"袋\", \"蜡\", \"叠\", \"刚\", \"然\", \"莴\", \"尸\", \"甩\", \"恼\", \"徙\", \"憋\", \"捏\", \"】\", \"苒\", \"真\", \"妃\", \"咱\", \"芋\", \"檬\", \"鳗\", \"抉\", \"越\", \"抹\", \"倾\", \"仑\", \"冻\", \"校\", \"欣\", \"遇\", \"扎\", \"院\", \"缈\", \"厥\", \"晰\", \"粘\", \"噶\", \"隋\", \"玄\", \"返\", \"藐\", \"咪\", \"菁\", \"巢\", \"麽\", \"羚\", \"喇\", \"肇\", \"夜\", \"阪\", \"號\", \"卖\", \"逝\", \"骛\", \"弗\", \"奴\", \"\", \"夫\", \"惑\", \"红\", \"畸\", \"萃\", \"站\", \"圭\", \"广\", \"膏\", \"盈\", \"循\", \"陇\", \"熏\", \"揽\", \"牒\", \"岸\", \"吻\", \"穹\", \"稽\", \"郑\", \"迫\", \"魅\", \")\", \"奖\", \"祥\", \"瘩\", \"昂\", \"脆\", \"玉\", \"冉\", \"喜\", \"对\", \"遐\", \"睫\", \"廷\", \"可\", \"挤\", \"露\", \"诡\", \"很\", \"答\", \"梁\", \"壶\", \"鸠\", \"河\", \"匾\", \"细\", \"缝\", \"懵\", \"喧\", \"蓟\", \"萼\", \"淘\", \"终\", \"梵\", \"靠\", \"臣\", \"吱\", \"豌\", \"嘤\", \"嵘\", \"立\", \"秀\", \"醐\", \"猫\", \"罩\", \"分\", \"灾\", \"骗\", \"庇\", \"泡\", \"潦\", \"策\", \"烙\", \"翠\", \"阿\", \"猥\", \"苛\", \"描\", \"锂\", \"唏\", \"シ\", \"怪\", \"此\", \"竿\", \"高\", \"芷\", \"卢\", \"捉\", \"缄\", \"靶\", \"档\", \"丹\", \"订\", \"脉\", \"慌\", \"叩\", \"呸\", \"慎\", \"慰\", \"绞\", \"菊\", \"·\", \"淖\", \"驿\", \"犬\", \"购\", \"寒\", \"瘀\", \"碰\", \"砧\", \"酣\", \"湾\", \"圣\", \"馄\", \"甯\", \"汗\", \"狠\", \"⑸\", \"C\", \"凝\", \"帽\", \"擤\", \"尔\", \"翼\", \"祝\", \"黧\", \"翡\", \"至\", \"的\", \"辛\", \"薯\", \"嗦\", \"极\", \"魂\", \"桥\", \"服\", \"邹\", \"妄\", \"旷\", \"瑟\", \"雳\", \"盘\", \"苦\", \"秆\", \"饨\", \"审\", \"⑥\", \"矫\", \"嗨\", \"钻\", \"时\", \"~\", \"昕\", \"暮\", \"掉\", \"所\", \"耿\", \"扣\", \"辱\", \"劾\", \"减\", \"侈\", \"志\", \"俭\", \"?\", \"逆\", \"运\", \"瞟\", \"婷\", \"房\", \"竟\", \"验\", \"骂\", \"芦\", \"饱\", \"播\", \"嗅\", \"桔\", \"域\", \"钉\", \"伫\", \"嚷\", \"蟀\", \"晚\", \"溘\", \"阅\", \"玛\", \"\\\\\", \"吟\", \"巾\", \"荼\", \"掐\", \"楔\", \"畅\", \"瞒\", \"萨\", \"矩\", \"柠\", \"宅\", \"熙\", \"泾\", \"训\", \"荆\", \"黢\", \"同\", \"爬\", \"裘\", \"熨\", \"坂\", \"併\", \"欧\", \"粒\", \"它\", \"惯\", \"喃\", \"○\", \"脸\", \"晤\", \"粽\", \"焦\", \"疆\", \"晴\", \"寄\", \"痫\", \"锈\", \"轻\", \"牟\", \"遂\", \"篡\", \"戒\", \"稀\", \"貂\", \"・\", \"亩\", \"遥\", \"屯\", \"隔\", \"磋\", \"祀\", \"\\u0006\", \"扭\", \"敏\", \"肩\", \"棠\", \"超\", \"霉\", \"园\", \"坚\", \"顾\", \"伍\", \"固\", \"裁\", \"哧\", \"算\", \"匮\", \"欸\", \"臃\", \"碌\", \"梢\", \"百\", \"憧\", \"疚\", \"韪\", \"专\", \"船\", \"刘\", \"苣\", \"困\", \"橘\", \"腓\", \"搏\", \"巴\", \"输\", \"募\", \"耕\", \"醋\", \"奚\", \"徒\", \"纽\", \"介\", \"物\", \"级\", \"享\", \"辈\", \"鸟\", \"敷\", \"布\", \"酥\", \"拐\", \"個\", \"■\", \"词\", \"朝\", \"仅\", \"昧\", \"赏\", \"啊\", \"欲\", \"伺\", \"交\", \"活\", \"胱\", \"惫\", \"单\", \"妒\", \"张\", \"煞\", \"帷\", \"琳\", \"瓷\", \"底\", \"侥\", \"臆\", \"芬\", \"养\", \"葫\", \"彷\", \"篓\", \"特\", \"身\", \"倪\", \"烃\", \"汰\", \"歧\", \"靛\", \"充\", \"围\", \"誓\", \"筝\", \"回\", \"私\", \"娄\", \"烂\", \"则\", \"仓\", \"式\", \"鹰\", \"坎\", \"瑑\", \"狸\", \"炭\", \"胖\", \"沛\", \"报\", \"メ\", \"晖\", \"拜\", \"琢\", \"映\", \"肛\", \"咀\", \"毕\", \"余\", \"摆\", \"赃\", \"狄\", \"响\", \"へ\", \"继\", \"腕\", \"区\", \"惧\", \"再\", \"毁\", \"役\", \"茄\", \"奇\", \"万\", \"甸\", \"莹\", \"状\", \"思\", \"棕\", \"折\", \"蚤\", \"釜\", \"克\", \"乓\", \"荻\", \"虾\", \"冰\", \"骰\", \"置\", \"尼\", \"筋\", \"哮\", \"课\", \"缚\", \"门\", \"诸\", \"勤\", \"储\", \"诙\", \"党\", \"沟\", \"猝\", \"令\", \"尊\", \"姑\", \"簧\", \"疾\", \"柿\", \"慧\", \"楼\", \"仿\", \"喂\", \"8\", \"新\", \"恍\", \"羹\", \"缥\", \"d\", \"喻\", \"浏\", \"恺\", \"账\", \"薩\", \"三\", \"瀑\", \"惘\", \"艳\", \"饭\", \"蓝\", \"持\", \"腊\", \"坯\", \"窖\", \"贸\", \"称\", \"葆\", \"幅\", \"辗\", \"奉\", \"岂\", \"〖\", \"汩\", \"門\", \"吹\", \"壕\", \"游\", \"苟\", \"揉\", \"财\", \"午\", \"柜\", \"兜\", \"辅\", \"访\", \"贺\", \"举\", \"屿\", \"动\", \"亲\", \"顺\", \"饥\", \"宙\", \"栅\", \"艰\", \"迟\", \"炬\", \"〔\", \"赂\", \"孕\", \"靖\", \"替\", \"罄\", \"限\", \"途\", \"懦\", \"会\", \"读\", \"源\", \"巷\", \"下\", \"轰\", \"府\", \"照\", \"怡\", \"癫\", \"走\", \"鞘\", \"缉\", \"呛\", \"衅\", \"囊\", \"起\", \"隆\", \"筛\", \"迹\", \"啪\", \"氛\", \"兴\", \"損\", \"镏\", \"鲤\", \"毛\", \"哑\", \"淤\", \"磊\", \"痊\", \"劳\", \"託\", \"剿\", \"翻\", \"浚\", \"衡\", \"贷\", \"瘙\", \"母\", \"颗\", \"谀\", \"妍\", \"推\", \"粪\", \"除\", \"贪\", \"挈\", \"昔\", \"拷\", \"勾\", \"鑫\", \"白\", \"镉\", \"⑶\", \"竖\", \"旋\", \"鲍\", \"够\", \"罗\", \"掌\", \"矶\", \"舟\", \"披\", \"犷\", \"凌\", \"罐\", \"寺\", \"跌\", \"瞩\", \"幕\", \"家\", \"启\", \"妹\", \"转\", \"努\", \"蟹\", \"挎\", \"纸\", \"嘟\", \"嗪\", \"嗤\", \"忑\", \"孜\", \"事\", \"婿\", \"旳\", \"杯\", \"尿\", \"斐\", \"墨\", \"浆\", \"佬\", \"铣\", \"弊\", \"送\", \"要\", \"狙\", \"福\", \"珊\", \"拯\", \"丛\", \"瞅\", \"体\", \"傻\", \" \", \"蛇\", \"敖\", \"狳\", \"删\", \"榷\", \"绒\", \"镑\", \"发\", \"蹦\", \"呃\", \"\\u0007\", \"枣\", \"素\", \"網\", \"桃\", \""\", \"寝\", \"只\", \"淮\", \"愣\", \"苏\", \"饵\", \"土\", \"舆\", \"风\", \"颂\", \"哥\", \"乌\", \"佘\", \"朴\", \"晃\", \"抑\", \"利\", \"抄\", \"泪\", \"休\", \"湮\", \"陪\", \"递\", \"垣\", \"泵\", \"蕃\", \"崛\", \"存\", \"淹\", \"悚\", \"厕\", \"丸\", \"已\", \"扑\", \"截\", \"缺\", \"亵\", \"踱\", \"紧\", \"产\", \"疫\", \"癖\", \"雾\", \"漂\", \"ノ\", \"肠\", \"惨\", \"押\", \"殉\", \"项\", \"厝\", \"修\", \"熊\", \"當\", \"话\", \"桑\", \"系\", \"惟\", \"锄\", \"互\", \"某\", \"许\", \"狂\", \"蒂\", \"竣\", \"樱\", \"计\", \"\", \"珀\", \"盛\", \"份\", \"扶\", \"硕\", \"酒\", \"睬\", \"栓\", \"耗\", \"宁\", \"官\", \"接\", \"触\", \"桩\", \"娩\", \"瑢\", \"感\", \"银\", \"写\", \"贞\", \"裤\", \"缴\", \"炉\", \"勺\", \"《\", \"着\", \"额\", \"弥\", \"澈\", \"井\", \"藤\", \"副\", \"攻\", \"碧\", \"磅\", \"诀\", \"胸\", \"矍\", \"藉\", \"跚\", \"沓\", \"卡\", \"包\", \"榜\", \"南\", \"压\", \"达\", \"珞\", \"蜴\", \"就\", \"取\", \"哟\", \"谣\", \"兽\", \"爽\", \"膜\", \"轨\", \"浅\", \"稿\", \"冀\", \"避\", \"仄\", \"领\", \"彦\", \"茁\", \"嫩\", \"硫\", \"⑤\", \"搁\", \"锤\", \"夯\", \"脂\", \"糟\", \"晕\", \"猖\", \"穰\", \"鄙\", \"瞄\", \"吭\", \"或\", \"武\", \"↑\", \"讨\", \"袭\", \"逼\", \"效\", \"葬\", \"忡\", \"救\", \"反\", \"邃\", \"辐\", \"意\", \"铸\", \"统\", \"涵\", \"驭\", \"狼\", \"淞\", \"穴\", \"凰\", \"靓\", \"丈\", \"狱\", \"诉\", \"付\", \"棺\", \"捡\", \"窝\", \"怕\", \"材\", \"忧\", \"赡\", \"骇\", \"蹴\", \"铛\", \"强\", \"共\", \"炸\", \"怎\", \"豆\", \"摊\", \"笔\", \"稣\", \"误\", \"搀\", \"贿\", \"煤\", \"挣\", \"少\", \"抱\", \"蜷\", \"甄\", \"伞\", \"阂\", \"怀\", \"塞\", \"京\", \"烘\", \"郝\", \"氨\", \"尹\", \"姿\", \"蔼\", \"驱\", \"被\", \"纤\", \"削\", \"镳\", \"晟\", \"迦\", \"护\", \"屑\", \"邀\", \"榄\", \"赫\", \"姊\", \"拦\", \"些\", \"!\", \"瑄\", \"去\", \"栾\", \"悲\", \"烈\", \"犄\", \"酬\", \"屣\", \"©\", \"网\", \"步\", \"〕\", \"阳\", \"小\", \"資\", \"另\", \"卍\", \"尽\", \"琪\", \"朵\", \"黛\", \"惠\", \"\\u0000\", \"诚\", \"羽\", \"么\", \"横\", \"榭\", \"吞\", \"叙\", \"旨\", \"遑\", \"ソ\", \"邂\", \"元\", \"佩\", \"轮\", \"牛\", \"侍\", \"咚\", \"霄\", \"纪\", \"岚\", \"亂\", \"祉\", \"琶\", \"脖\", \"瞬\", \"司\", \"漲\", \"\", \"梳\", \"咋\", \"炝\", \"「\", \"骚\", \"磨\", \"隙\", \"痴\", \"间\", \"品\", \"眩\", \"溶\", \"彪\", \"废\", \"标\", \"殿\", \"煌\", \"腱\", \"耍\", \"杏\", \"觑\", \"啥\", \"谍\", \"澡\", \"是\", \"胺\", \"斋\", \"二\", \"禁\", \"召\", \"邵\", \"届\", \"篷\", \"胃\", \"其\", \"暗\", \"悄\", \"予\", \"康\", \"纲\", \"绷\", \"榻\", \"呈\", \"虞\", \"哒\", \"侄\", \"辟\", \"侵\", \"舔\", \"荨\", \"曝\", \"潭\", \"绿\", \"泰\", \"租\", \"契\", \"那\", \"鳌\", \"邋\", \"燥\", \"行\", \"碾\", \"宰\", \"禧\", \"坑\", \"拾\", \"币\", \"楷\", \"⑦\", \"叉\", \"舒\", \"调\", \"仪\", \"句\", \"纳\", \"译\", \"萤\", \"喱\", \"渊\", \"戈\", \"阜\", \"梯\", \"鹅\", \"焚\", \"吓\", \"损\", \"眺\", \"潇\", \"拧\", \"侮\", \"善\", \"曾\", \"核\", \"失\", \"氯\", \"议\", \"首\", \"筷\", \"曙\", \"磁\", \"淌\", \"兄\", \"诠\", \"鸥\", \"2\", \"何\", \"琦\", \"鬣\", \"离\", \"腰\", \"敲\", \"氮\", \"博\", \"普\", \"务\", \"荷\", \"渔\", \"薪\", \"拌\", \"慈\", \"我\", \"竞\", \"歩\", \"馏\", \"命\", \"从\", \"娇\", \"伽\", \"鲁\", \"枕\", \"芹\", \"翌\", \"集\", \"椒\", \"闹\", \"堆\", \"版\", \"警\", \"垂\", \"廓\", \"绝\", \"育\", \"含\", \"霊\", \"靡\", \"旭\", \"圾\", \"口\", \"孵\", \"娟\", \"谊\", \"躇\", \"忪\", \"委\", \"慢\", \"轴\", \"甬\", \"妈\", \"题\", \"富\", \"商\", \"戮\", \"痛\", \"军\", \"蠢\", \"备\", \"逛\", \"玳\", \"缔\", \"直\", \"棋\", \"鹈\", \"札\", \"虱\", \"妮\", \"迷\", \"米\", \"啡\", \"碗\", \"况\", \"楞\", \"罔\", \"禄\", \"扯\", \"制\", \"踵\", \"扪\", \"友\", \"垫\", \"向\", \"境\", \"顶\", \"罢\", \"麓\", \"诶\", \"〗\", \"故\", \"嘿\", \"毋\", \"透\", \"菇\", \"椰\", \"让\", \"沼\", \"岐\", \"蔑\", \"魄\", \"凳\", \"涅\", \"具\", \"展\", \"蹩\", \"恢\", \"妓\", \"舍\", \"心\", \"碳\", \"探\", \"忿\", \"垛\", \"鼎\", \"业\", \"买\", \"赅\", \"搜\", \"蛋\", \"娠\", \"馍\", \"盹\", \"`\", \"瑒\", \"喽\", \"a\", \"见\", \"岱\", \"锯\", \"灭\", \"雍\", \"④\", \"遵\", \"槐\", \"树\", \"⑿\", \"逾\", \"涨\", \"退\", \"刻\", \"匙\", \"错\", \"迁\", \":\", \"臭\", \"檀\", \"亨\", \"芒\", \"媳\", \"腭\", \"能\", \"赐\", \"倦\", \"皮\", \"叮\", \"优\", \"丽\", \"麻\", \"类\", \"轩\", \"还\", \"祈\", \"滔\", \"矛\", \"芥\", \"扮\", \"蚪\", \"拆\", \"赌\", \"履\", \"窘\", \"圳\", \"熬\", \"熹\", \"串\", \"踊\", \"莱\", \"睛\", \"聋\", \"忍\", \"四\", \"鸩\", \"礴\", \"汲\", \"湄\", \"面\", \"缀\", \"笃\", \"娘\", \"赣\", \"浑\", \"耩\", \"俏\", \"马\", \"凋\", \"滩\", \"们\", \"醉\", \"啸\", \"姻\", \"帆\", \"序\", \"想\", \"庚\", \"鲱\", \"摹\", \"龄\", \"挲\", \"孤\", \"馈\", \"嗔\", \"劲\", \"遁\", \"呆\", \"璨\", \"变\", \"谅\", \"戳\", \"腐\", \"虚\", \"隧\", \"焊\", \"创\", \"淇\", \"蚯\", \"鹌\", \"侨\", \"诩\", \"岩\", \"恳\", \"法\", \"碎\", \"淡\", \"掂\", \"允\", \"料\", \"尤\", \"曲\", \"敢\", \"忱\", \"幼\", \"掰\", \"樯\", \"窄\", \"来\", \"淀\", \"换\", \"祛\", \"凑\", \"喘\", \"急\", \"蚁\", \"―\", \"妆\", \"恭\", \"眼\", \"吕\", \"s\", \"鹜\", \"瓢\", \"施\", \"琼\", \"篢\", \"解\", \"悖\", \"齿\", \"字\", \"尉\", \"佝\", \"匪\", \"哨\", \"讪\", \"叭\", \"幢\", \"易\", \"拗\", \"唆\", \"胎\", \"悼\", \"涩\", \"墒\", \"示\", \"粤\", \"祷\", \"耙\", \"疵\", \"雪\", \"妊\", \"锦\", \"踏\", \"擞\", \"嵌\", \"厄\", \"封\", \"什\", \"撅\", \"将\", \"萧\", \"柳\", \"铄\", \"呗\", \"娛\", \"砥\", \"洞\", \"设\", \"青\", \"冠\", \"俨\", \"帮\", \"歪\", \"密\", \"莘\", \"笑\", \"黄\", \"旦\", \"嘭\", \"洒\", \"浇\", \"N\", \"春\", \"卫\", \"镍\", \"搞\", \"茵\", \"昌\", \"霞\", \"暹\", \"吆\", \"狩\", \"噼\", \"龟\", \"砍\", \"停\", \"求\", \"肋\", \"鹏\", \"丧\", \"片\", \"潢\", \"沮\", \"形\", \"咨\", \"捞\", \"飚\", \"钊\", \"贾\", \"义\", \"电\", \"扳\", \"冈\", \"暄\", \"蛮\", \"瑶\", \"蝇\", \"驴\", \"捐\", \"燕\", \"牙\", \"亏\", \"企\", \"兼\", \"攸\", \"雅\", \"鸡\", \"拙\", \"懊\", \"煲\", \"疏\", \"泽\", \"楠\", \"蓬\", \"沪\", \"车\", \"骄\", \"抡\", \"岣\", \"胡\", \"添\", \"按\", \"鉴\", \"简\", \"炙\", \"织\", \"嗡\", \"铭\", \"仆\", \"箔\", \"本\", \"该\", \"脐\", \"梧\", \"释\", \"凡\", \"霏\", \"赢\", \"塔\", \"耐\", \"默\", \"迎\", \"T\", \"乎\", \"荣\", \".\", \"跨\", \"毫\", \"扼\", \"敛\", \"革\", \"韬\", \"乘\", \"缪\", \"工\", \"蔡\", \"⒋\", \"爻\", \"景\", \"胳\", \"距\", \"轼\", \"莞\", \"完\", \"桦\", \"造\", \"紊\", \"價\", \"力\", \"乖\", \"括\", \"谚\", \"说\", \"既\", \"改\", \"木\", \"辑\", \"哈\", \"止\", \"赘\", \"咳\", \"墅\", \"逶\", \"长\", \"雕\", \"逗\", \"鲜\", \"沈\", \"唠\", \"並\", \"胫\", \"昆\", \"问\", \"钓\", \"肖\", \"弦\", \"州\", \"糕\", \"吃\", \"霓\", \"库\", \"俘\", \"嫂\", \"悍\", \"软\", \"邯\", \"蟑\", \"袖\", \"蟋\", \"卻\", \"晗\", \"染\", \"污\", \"驼\", \"膝\", \"逞\", \"郅\", \"抠\", \"庶\", \"枪\", \"芜\", \"弧\", \"锒\", \"檐\", \"曦\", \"柱\", \"鹦\", \"曹\", \"奠\", \"柄\", \"怵\", \"朗\", \"睽\", \"、\", \"悬\", \"垮\", \"塌\", \"八\", \"打\", \"裸\", \"栩\", \"陌\", \"寂\", \"邮\", \"\\b\", \"往\", \"虫\", \"并\", \"乒\", \"灰\", \"屉\", \"芽\", \"涯\", \"猬\", \"苍\", \"D\", \"呜\", \"怒\", \"梅\", \"怖\", \"…\", \"杨\", \"挚\", \"炎\", \"油\", \"申\", \"边\", \"香\", \"刺\", \"锅\", \"掬\", \"睦\", \"欠\", \"牖\", \"峡\", \"秽\", \"缠\", \"ὐ\", \" \", \"泄\", \"彩\", \"娑\", \"析\", \"毙\", \"部\", \"俗\", \"入\", \"模\", \"瞰\", \"n\", \"暂\", \"吾\", \"尬\", \"杭\", \"出\", \"诟\", \"羔\", \"术\", \"眨\", \"翘\", \"玲\", \"樊\", \"埔\", \"唬\", \"诃\", \"又\", \"泳\", \"惕\", \"异\", \"哀\", \"琐\", \"珏\", \"躬\", \"窍\", \"控\", \"条\", \"趟\", \"湖\", \"晋\", \"谴\", \"屹\", \"撸\", \"草\", \"潮\", \"带\", \"吊\", \"励\", \"怔\", \"饲\", \"闪\", \"浞\", \"负\", \"杜\", \"粼\", \"现\", \"主\", \"滤\", \"历\", \"憨\", \"贮\", \"导\", \"费\", \"缸\", \"哼\", \"吼\", \"唐\", \"表\", \"蛛\", \"胚\", \"势\", \"供\", \"谢\", \"开\", \"猾\", \"纺\", \"惺\", \"当\", \"抓\", \"孽\", \"浦\", \"〝\", \"桢\", \"啦\", \"加\", \"担\", \"诞\", \"绵\", \"陷\", \"\", \"天\", \"裳\", \"麦\", \"ό\", \"浓\", \"晦\", \"络\", \"忽\", \"墓\", \"劫\", \"採\", \"陵\", \"里\", \"剐\", \"民\", \"支\", \"住\", \"隘\", \"壳\", \"燎\", \"漱\", \"唷\", \"蜥\", \"凭\", \"猎\", \"屁\", \"巧\", \"逃\", \"促\", \"隶\", \"茅\", \"歼\", \"传\", \"莫\", \"籽\", \"徐\", \"荐\", \"云\", \"阻\", \"弄\", \"胁\", \"渲\", \"嘛\", \"臼\", \"士\", \"佛\", \"范\", \"上\", \"玩\", \"扩\", \"衔\", \"摒\", \"猡\", \"败\", \"慕\", \"舛\", \"港\", \"膳\", \"饽\", \"瘠\", \"肮\", \"揭\", \"丁\", \"撤\", \"妥\", \"纯\", \"葛\", \"柬\", \"植\", \"穗\", \"馅\", \"宝\", \"咆\", \"惮\", \"伸\", \"焰\", \"⑷\", \"厢\", \"枯\", \"斑\", \"殷\", \"栗\", \"谛\", \"蔓\", \"之\", \"阱\", \"泯\", \"旖\", \"凉\", \"桂\", \"湛\", \"陈\", \"象\", \"倍\", \"襄\", \"唱\", \"娱\", \"器\", \"韵\", \"国\", \"征\", \"绽\", \"逐\", \"哎\", \"跟\", \"安\", \"售\", \"颠\", \"证\", \"o\", \"团\", \"饼\", \"e\", \"十\", \"寡\", \"宋\", \"彼\", \"巍\", \"径\", \"僵\", \"水\", \"尖\", \"远\", \"邦\", \"忠\", \"踌\", \"鬓\", \"多\", \"种\", \"盒\", \"进\", \"烤\", \"闾\", \"磕\", \"闻\", \"旎\", \"蔽\", \"睁\", \"颧\", \"各\", \"饮\", \"酌\", \"辜\", \"颐\", \"龙\", \"乱\", \"环\", \"筐\", \"恃\", \"〃\", \"迪\", \"松\", \"鸣\", \"华\", \"板\", \"媛\", \"缮\", \"丝\", \"掷\", \"惬\", \"拘\", \"ㄓ\", \"垒\", \"唾\", \"估\", \"馁\", \"橙\", \"夷\", \"墙\", \"粗\", \"汽\", \"梨\", \"每\", \"虽\", \"郸\", \"众\", \"邑\", \"衬\", \"敌\", \"朋\", \"视\", \"笼\", \"蜿\", \"淅\", \"亦\", \"∶\", \"研\", \"孀\", \"咔\", \"驻\", \"今\", \"悴\", \"筒\", \"袒\", \"辄\", \"死\", \"崇\", \"果\", \"峙\", \"搡\", \"精\", \"運\", \"双\", \"毗\", \"禽\", \"皆\", \"灵\", \"犀\", \"脏\", \"郜\", \"撕\", \"典\", \"旺\", \"危\", \"蚂\", \"蜂\", \"棱\", \"营\", \"孟\", \"祖\", \"复\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/fr": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1540504,
"_n_tokens": 466133,
"_n_chars": 1484970,
"_n_oov_chars": 1615,
"oov_ratio": 0.001087564058533169,
"_oov_charset": "[\"ë\", \"È\", \"̧\", \"★\", \"\", \"{\", \"Ê\", \"~\", \"…\", \"🙂\", \"´\", \"😀\", \"♕\", \"℃\", \"❤\", \"§\", \"̂\", \"―\", \"́\", \"😉\", \"^\", \"À\", \"™\", \"²\", \"}\", \"·\", \"
\", \"♠\", \"Ç\", \"🤔\", \"ã\", \"Ô\", \"µ\", \"�\", \"ï\", \"″\", \"í\", \"\\\\\", \"œ\", \"ğ\", \"←\", \"‐\", \"Â\", \"<\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/es": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1664455,
"_n_tokens": 696400,
"_n_chars": 1630297,
"_n_oov_chars": 11598,
"oov_ratio": 0.007114041183906981,
"_oov_charset": "[\"″\", \"ñ\", \"{\", \"\", \"▷\", \"️\", \"🙂\", \"😉\", \"✪\", \"Í\", \"º\", \"🙁\", \"í\", \"■\", \"}\", \"Á\", \"Ñ\", \"´\", \"👍\", \"✓\", \"Ú\", \"―\", \"…\", \"М\", \"\\\\\", \"\", \"ª\", \"😦\", \"©\", \"·\", \"→\", \"×\", \"\", \"^\", \"²\", \"←\", \"\", \"ú\", \"✖\", \"<\", \"❤\", \"¡\", \"ý\", \"¿\", \"ø\", \"ò\", \"✔\", \"👏\", \"😀\", \"Ó\"]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/en": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1124813,
"_n_tokens": 254944,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/zh-Hans": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2633047,
"_n_tokens": 747405,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/fr": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1540504,
"_n_tokens": 412146,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/es": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1664455,
"_n_tokens": 433289,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/chinese-alpaca-lora-7b @ cc100/en": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1124813,
"_n_tokens": 281471,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/zh-Hans": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 2633047,
"_n_tokens": 613993,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/fr": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1540504,
"_n_tokens": 440299,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/es": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1664455,
"_n_tokens": 476720,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/en": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/zh-Hans": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 2633047,
"_n_tokens": 616545,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/fr": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/es": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/en": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1124813,
"_n_tokens": 281471,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/zh-Hans": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 2633047,
"_n_tokens": 613993,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/fr": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1540504,
"_n_tokens": 440299,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/es": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1664455,
"_n_tokens": 476720,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/llama-3-chinese-8b @ cc100/en": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1124813,
"_n_tokens": 254944,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/zh-Hans": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 2633047,
"_n_tokens": 747405,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/fr": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1540504,
"_n_tokens": 412141,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/es": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1664455,
"_n_tokens": 433286,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hpcai-tech/grok-1 @ cc100/en": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1124813,
"_n_tokens": 258048,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/zh-Hans": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 2633047,
"_n_tokens": 1414508,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/fr": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1540504,
"_n_tokens": 428298,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/es": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1664455,
"_n_tokens": 449392,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/en": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/zh-Hans": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/fr": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/es": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm-chat-7b @ cc100/en": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1124813,
"_n_tokens": 261293,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/zh-Hans": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2633047,
"_n_tokens": 569109,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/fr": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1540504,
"_n_tokens": 485045,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/es": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1664455,
"_n_tokens": 506572,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/en": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1124813,
"_n_tokens": 261293,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/zh-Hans": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2633047,
"_n_tokens": 569109,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/fr": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1540504,
"_n_tokens": 485045,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/es": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1664455,
"_n_tokens": 506572,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm2-chat-7b @ cc100/en": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1124813,
"_n_tokens": 261583,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/zh-Hans": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2633047,
"_n_tokens": 569976,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/fr": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1540504,
"_n_tokens": 486629,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/es": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1664455,
"_n_tokens": 508871,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/en": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1124813,
"_n_tokens": 261583,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/zh-Hans": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2633047,
"_n_tokens": 569976,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/fr": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1540504,
"_n_tokens": 486629,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/es": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1664455,
"_n_tokens": 508871,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/en": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1124813,
"_n_tokens": 474941,
"_n_chars": 1121360,
"_n_oov_chars": 111,
"oov_ratio": 9.898694442462724e-05,
"_oov_charset": "[\"\", \"¡\", \"😉\", \"\", \"‑\", \"�\", \"ï\", \"\", \"´\", \"¦\", \"③\", \"🙂\", \"⑧\", \"~\", \"😥\", \"\", \"⑩\", \"ñ\", \"…\", \"⑦\", \"⑤\", \"\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/zh-Hans": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 2633047,
"_n_tokens": 168974,
"_n_chars": 927311,
"_n_oov_chars": 864792,
"oov_ratio": 0.9325803317333667,
"_oov_charset": "[\"福\", \"志\", \"悍\", \"恳\", \"芦\", \"加\", \"艳\", \"林\", \"副\", \"昭\", \"檀\", \"嗤\", \"衡\", \"沃\", \"样\", \"新\", \"蒂\", \"贡\", \"胚\", \"阂\", \"育\", \"祸\", \"汐\", \"藐\", \"特\", \"汗\", \"乞\", \"工\", \"卵\", \"共\", \"抬\", \"曝\", \"巾\", \"舎\", \"异\", \"漆\", \"蛔\", \"孰\", \"煮\", \"环\", \"浞\", \"匪\", \"橇\", \"引\", \"窖\", \"氮\", \"弥\", \"蓦\", \"能\", \"弓\", \"惨\", \"两\", \"优\", \"果\", \"早\", \"岖\", \"骛\", \"筝\", \"嗜\", \"⒃\", \"揍\", \"粪\", \"℃\", \"霭\", \"岑\", \"痘\", \"调\", \"辆\", \"否\", \"尊\", \"琉\", \"矮\", \"购\", \"颖\", \"阵\", \"〃\", \"必\", \"鹏\", \"昔\", \"」\", \"鼠\", \"胳\", \"寥\", \"號\", \"极\", \"發\", \"缜\", \"噴\", \"论\", \"色\", \"惟\", \"亦\", \"摩\", \"绞\", \"恣\", \"境\", \"买\", \"键\", \"秉\", \"过\", \"来\", \"测\", \"殉\", \"鸟\", \"收\", \"眩\", \"牒\", \"猥\", \"倾\", \"坡\", \"恪\", \"n\", \"敛\", \"蜴\", \"撕\", \"垠\", \"链\", \"挎\", \"封\", \"集\", \"丰\", \"暧\", \"孔\", \"镐\", \"锥\", \"沿\", \"酋\", \"毅\", \"苏\", \"簿\", \"魅\", \"戛\", \"亂\", \"晨\", \"莘\", \"遮\", \"基\", \"拔\", \"栅\", \"辞\", \"巩\", \"稚\", \"幽\", \"豆\", \"埂\", \"虹\", \"娱\", \"具\", \"蕴\", \"赅\", \"礼\", \"欺\", \"\", \"溅\", \"泻\", \"尚\", \"纺\", \"选\", \"别\", \"酷\", \"魄\", \"誓\", \"愁\", \"狰\", \"歉\", \"疫\", \"厝\", \"亭\", \"a\", \"奠\", \"枕\", \"纹\", \"契\", \"府\", \"召\", \"怠\", \"佬\", \"侥\", \"耍\", \"遍\", \"责\", \"泽\", \"娠\", \"绣\", \"庞\", \"歪\", \"复\", \"党\", \"徊\", \"暇\", \"膛\", \"砧\", \"唇\", \"迭\", \"承\", \"伙\", \"镶\", \"定\", \"魇\", \"那\", \"骑\", \"屯\", \"肋\", \"旱\", \"颉\", \"姗\", \"辟\", \"钦\", \"夺\", \"哒\", \"嘭\", \"赋\", \"肪\", \"领\", \"刘\", \"闭\", \"须\", \"撒\", \"味\", \"怵\", \"\", \"谭\", \"锐\", \"了\", \"饥\", \"真\", \"丈\", \"桢\", \"菲\", \"晰\", \"帅\", \"ο\", \"拍\", \"詹\", \"霊\", \"蒸\", \"谧\", \"犟\", \"层\", \"噼\", \"門\", \"衿\", \"次\", \"尸\", \"晕\", \"薛\", \"τ\", \"国\", \"僵\", \"雀\", \"侬\", \"塞\", \"噪\", \"靖\", \"锣\", \"稣\", \"聒\", \"崩\", \"熏\", \"迎\", \"睁\", \"鞘\", \"蚌\", \"峙\", \"帐\", \"莎\", \"汁\", \"憔\", \"庆\", \"亏\", \"甫\", \"辜\", \"抢\", \"呗\", \"殷\", \"棺\", \"明\", \"锈\", \"韵\", \"涎\", \"岣\", \"蕉\", \"T\", \"雅\", \"解\", \"便\", \"驿\", \"约\", \"瑒\", \"捷\", \"母\", \"瘦\", \"锅\", \"富\", \"羁\", \"某\", \"陆\", \"讳\", \"妍\", \"渍\", \"鲜\", \"衷\", \"率\", \"辐\", \"揽\", \"把\", \"利\", \"黧\", \"淹\", \"陀\", \"奏\", \"懑\", \"嗣\", \"焦\", \"推\", \"咬\", \"慧\", \"冷\", \"寂\", \"橡\", \"棉\", \"卷\", \"轨\", \"做\", \"谍\", \"谅\", \"雇\", \"直\", \"衬\", \"抿\", \"腐\", \"⑥\", \"芋\", \"舶\", \"偷\", \"璧\", \"期\", \"哨\", \"胱\", \"律\", \"妹\", \"邂\", \"忱\", \"各\", \"川\", \"患\", \"症\", \"娼\", \"等\", \"忍\", \"篷\", \"浪\", \"炎\", \"踌\", \"邓\", \"蹒\", \"搜\", \"绿\", \"亥\", \"危\", \"纷\", \"讯\", \"淞\", \"泰\", \"瞄\", \"桩\", \"叨\", \"凄\", \"纳\", \"征\", \"斑\", \"淄\", \"生\", \"削\", \"梁\", \"岳\", \"泣\", \"桃\", \"澡\", \"萤\", \"浸\", \"肌\", \"淖\", \"盾\", \"汛\", \"硬\", \"吱\", \"简\", \"鲎\", \"室\", \"珠\", \"凡\", \"弊\", \"仆\", \"死\", \"聚\", \"呼\", \"寡\", \"嘤\", \"袖\", \"韬\", \"时\", \"拽\", \"佳\", \"宇\", \"队\", \"膀\", \"栖\", \"喉\", \"邢\", \"醍\", \"秒\", \"迷\", \"呕\", \"贝\", \"掏\", \"讥\", \"绰\", \"癫\", \"尝\", \"儿\", \"讽\", \"妃\", \"盏\", \"涩\", \"土\", \"舅\", \"狱\", \"勒\", \"许\", \"p\", \"狩\", \"惑\", \"扯\", \"硕\", \"聂\", \"捕\", \"管\", \"撤\", \"酵\", \"蕤\", \"矍\", \"笑\", \"炬\", \"粼\", \"石\", \"荻\", \"侯\", \"客\", \"栩\", \"捐\", \"酣\", \"舔\", \"信\", \"眺\", \"拜\", \"鸿\", \"《\", \"他\", \"鲤\", \"虚\", \"剥\", \"派\", \"床\", \"斐\", \"闸\", \"控\", \"贼\", \"⑸\", \"坦\", \"再\", \"锢\", \"賣\", \"玛\", \"怕\", \"蹭\", \"蔼\", \"眉\", \"郴\", \"狙\", \"烛\", \"轩\", \"曹\", \"焰\", \"焯\", \"遗\", \"蚁\", \"钰\", \"帖\", \"炒\", \"奸\", \"脾\", \"号\", \"拿\", \"痫\", \"矛\", \"肿\", \"般\", \"卓\", \"帘\", \"箭\", \"杠\", \"饽\", \"徒\", \"请\", \"钱\", \"懂\", \"垮\", \"纽\", \"祷\", \"翠\", \"伟\", \"蝗\", \"昂\", \"名\", \"廷\", \"淅\", \"拯\", \"荧\", \"徘\", \"阴\", \"觑\", \"嘟\", \"★\", \"〈\", \"察\", \"迤\", \"铤\", \"庸\", \"瘤\", \"六\", \"敏\", \"辙\", \"憾\", \"帆\", \"伯\", \"脸\", \"到\", \"澈\", \"⑿\", \"峭\", \"市\", \"何\", \"输\", \"妖\", \"睦\", \"秆\", \"独\", \"傲\", \"玄\", \"八\", \"抨\", \"碱\", \"絮\", \"巴\", \"剿\", \"恋\", \"菊\", \"柔\", \"阪\", \"筷\", \"姓\", \"侃\", \"纠\", \"凳\", \"蚓\", \"篝\", \"岂\", \"纾\", \"魁\", \"细\", \"媳\", \"抛\", \"它\", \"前\", \"证\", \"丽\", \"自\", \"宴\", \"佝\", \"皮\", \"麽\", \"翕\", \"微\", \"暄\", \"瑶\", \"莅\", \"峻\", \"亿\", \"空\", \"個\", \"故\", \"笋\", \"显\", \"暴\", \"僚\", \"○\", \"滞\", \"苒\", \"赫\", \"弘\", \"朵\", \"袁\", \"捞\", \"斛\", \"艺\", \"戍\", \"舛\", \"闾\", \"〝\", \"菱\", \"居\", \"洞\", \"训\", \"蛇\", \"奉\", \"婺\", \"西\", \"汶\", \"农\", \"锋\", \"墟\", \"卡\", \"兰\", \"朝\", \"害\", \"滩\", \"舒\", \"胫\", \"〕\", \"租\", \"惬\", \"橱\", \"宿\", \"舌\", \"唉\", \"叛\", \"筑\", \"梯\", \"泪\", \"钉\", \"屣\", \"唬\", \"绊\", \"掺\", \"因\", \"赤\", \"兵\", \"脏\", \"榴\", \"憬\", \"楣\", \"听\", \"串\", \"希\", \"喇\", \"归\", \"杭\", \"嗨\", \"煽\", \"蹄\", \"拱\", \"钥\", \"翘\", \"吮\", \"督\", \"执\", \"愿\", \"钓\", \"网\", \"椒\", \"严\", \"数\", \"鼻\", \"嘈\", \"爱\", \"嗦\", \"腺\", \"未\", \"竺\", \"填\", \"帮\", \"代\", \"褒\", \"江\", \"驼\", \"席\", \"侣\", \"至\", \"益\", \"纂\", \"C\", \"常\", \"娜\", \"铁\", \"卻\", \"泌\", \"翊\", \"薇\", \"臃\", \"茂\", \"腿\", \"挂\", \"骰\", \"挟\", \"钝\", \"籁\", \"郸\", \"度\", \"邑\", \"饰\", \"惜\", \"敷\", \"阻\", \"侮\", \"丙\", \"隋\", \"叉\", \"猩\", \"克\", \"节\", \"防\", \"继\", \"缴\", \"冯\", \"追\", \"慈\", \"局\", \"如\", \"逊\", \"郜\", \"棋\", \"…\", \"很\", \"吕\", \"缥\", \"姆\", \"炝\", \"宜\", \"送\", \"弑\", \"缪\", \"壹\", \"睛\", \"晤\", \"撞\", \"佐\", \"考\", \"-\", \"卍\", \"舰\", \"菜\", \"霹\", \"芬\", \"趣\", \"瞻\", \"矶\", \"表\", \"猪\", \"熨\", \"翱\", \"镀\", \"章\", \"沮\", \"擞\", \"跃\", \"瑄\", \"寨\", \"熙\", \"埠\", \"芃\", \"砥\", \"店\", \"麦\", \"禽\", \"驰\", \"彻\", \"之\", \"憋\", \"噬\", \"敝\", \"裙\", \"罕\", \"姐\", \"劾\", \"媒\", \" \", \"丐\", \"圳\", \"咳\", \"套\", \"驮\", \"臂\", \"襄\", \"私\", \"刻\", \"遛\", \"拾\", \"耀\", \"操\", \"贤\", \"船\", \"扑\", \"畴\", \"俏\", \"蓁\", \"设\", \"鼎\", \"札\", \"罔\", \"烟\", \"耗\", \"甘\", \"斤\", \"虎\", \"喽\", \"岗\", \"师\", \"舵\", \"隔\", \"磋\", \"爵\", \"绝\", \"皇\", \"涉\", \"跻\", \"灾\", \"佘\", \"圩\", \"趴\", \"澳\", \"质\", \"渣\", \"赣\", \"东\", \"婊\", \"雕\", \"攸\", \"葆\", \"锦\", \"酱\", \"柜\", \"跪\", \"列\", \"爷\", \"拳\", \"荼\", \"棂\", \"泼\", \"讷\", \"瓷\", \"拙\", \"瞪\", \"感\", \"丸\", \"铂\", \"币\", \"肖\", \"截\", \"续\", \"啡\", \"瑟\", \"九\", \"挲\", \"方\", \"相\", \"李\", \"撐\", \"硅\", \"ς\", \"诡\", \"山\", \"量\", \"靓\", \"虔\", \"镍\", \"鹈\", \"婷\", \"映\", \"卧\", \"膜\", \"掠\", \"糠\", \"萼\", \"声\", \"惹\", \""\", \"秦\", \"匙\", \"灌\", \"还\", \"黄\", \"坊\", \"贪\", \"案\", \"俞\", \"荫\", \"禄\", \"爸\", \"持\", \"邪\", \"华\", \"莱\", \"乳\", \"司\", \"又\", \"坷\", \"蒜\", \"判\", \"跷\", \"袒\", \"小\", \"村\", \"榄\", \"周\", \"搁\", \"座\", \"赡\", \"货\", \"俚\", \"州\", \"缘\", \"彭\", \"+\", \"●\", \"棵\", \"插\", \"劈\", \"亡\", \"冈\", \"友\", \"鹿\", \"メ\", \"忿\", \"獗\", \"倨\", \"消\", \"驱\", \"程\", \"恤\", \"哇\", \"欲\", \"雏\", \"港\", \"幅\", \"思\", \"概\", \"啼\", \"幼\", \"荆\", \"據\", \"负\", \"扬\", \"蕾\", \"胡\", \"铸\", \"惠\", \"斯\", \"遐\", \"朽\", \"尔\", \"猝\", \"劳\", \"瞰\", \"飚\", \"拌\", \"啐\", \"淆\", \"稠\", \"螺\", \"痊\", \"驴\", \"吆\", \"嫂\", \"掐\", \"哧\", \"情\", \"仍\", \"涛\", \"粘\", \"尹\", \"家\", \"习\", \"奂\", \"邻\", \"怔\", \"昨\", \"首\", \"问\", \"禧\", \"清\", \"擂\", \"纰\", \"却\", \"绩\", \"墒\", \"鸭\", \"晓\", \"罚\", \"沈\", \"穿\", \"不\", \"笔\", \"白\", \"呆\", \"扉\", \"镳\", \"地\", \"假\", \"蔽\", \"挣\", \"惩\", \"疑\", \"竞\", \"曲\", \"哪\", \"钜\", \"踞\", \"挚\", \"愤\", \"靶\", \"诞\", \"妥\", \"瞅\", \"吟\", \"馏\", \"喝\", \"悟\", \"⑶\", \"淇\", \"祝\", \"瞩\", \"斥\", \"廖\", \"臻\", \"剽\", \"寄\", \"亨\", \"呃\", \"现\", \"包\", \"卢\", \"访\", \"柯\", \"以\", \"浓\", \"谬\", \"⑷\", \"裘\", \"辅\", \"捧\", \"挑\", \"赶\", \"诬\", \"圜\", \"旋\", \"玮\", \"音\", \"露\", \"值\", \"诨\", \"刨\", \"溪\", \"戴\", \"奎\", \"鸡\", \"弹\", \"喻\", \"翼\", \"蟀\", \"圈\", \"营\", \"寿\", \"冉\", \"鞠\", \"虞\", \"慑\", \"于\", \"俨\", \"忧\", \"与\", \"×\", \"鼯\", \"望\", \"]\", \"潘\", \"邃\", \"嗯\", \"鹤\", \"惺\", \"戮\", \"膨\", \"并\", \"&\", \"〔\", \"晾\", \"咀\", \"猖\", \"多\", \"龄\", \"寺\", \"或\", \"鸽\", \"趁\", \"涂\", \"\\u0006\", \"融\", \"蹈\", \"义\", \"·\", \"废\", \"邕\", \"茧\", \"制\", \"夹\", \"民\", \"s\", \"帜\", \"瞳\", \"助\", \"镑\", \"蛙\", \"胥\", \"堪\", \"渺\", \"潭\", \"夕\", \"炸\", \"褂\", \"保\", \"欢\", \"淼\", \"南\", \"框\", \"谎\", \"浏\", \"硫\", \"〖\", \"桥\", \"台\", \"澄\", \"狞\", \"软\", \"绉\", \"书\", \"文\", \"航\", \"润\", \"漪\", \"踩\", \"轻\", \"泵\", \"中\", \"振\", \"使\", \"政\", \"彩\", \"谱\", \"锻\", \"恢\", \"湄\", \"窄\", \"奇\", \"乃\", \"左\", \"扔\", \"舆\", \"颓\", \"迪\", \"竹\", \"挈\", \"逆\", \"掀\", \"紫\", \"。\", \"辫\", \"琢\", \"攻\", \"桌\", \"毒\", \"要\", \"撇\", \"栏\", \"艇\", \"窒\", \"噶\", \"瑢\", \"醋\", \"鹑\", \"灑\", \"烧\", \"运\", \"瓦\", \"屄\", \"ㄓ\", \"抄\", \"析\", \"割\", \"挖\", \"掬\", \"鬼\", \"奘\", \"氧\", \"圾\", \"黛\", \"瑧\", \"赘\", \"渐\", \"取\", \"警\", \"湃\", \"梳\", \"▲\", \"滴\", \"陶\", \"黯\", \"毋\", \"焊\", \"戚\", \"沟\", \"郑\", \"牲\", \"支\", \"省\", \"蜕\", \"巍\", \"积\", \"屏\", \"萨\", \"蘸\", \"孪\", \"赛\", \"踪\", \"濒\", \"错\", \"酝\", \"盟\", \"寅\", \"卦\", \"夯\", \"娟\", \"凰\", \"焉\", \"沂\", \"烷\", \"渎\", \"炮\", \"出\", \"妊\", \"盹\", \"雨\", \"门\", \"〉\", \"贿\", \"芹\", \"杰\", \"扶\", \"牛\", \"乐\", \"蔓\", \"开\", \"妞\", \"嘿\", \"背\", \"晃\", \"揣\", \"刑\", \"挺\", \"狸\", \"電\", \"处\", \"锒\", \"丑\", \"投\", \"衍\", \"佩\", \"抉\", \"津\", \"吭\", \"婉\", \"腰\", \"浦\", \"筐\", \"徨\", \"へ\", \"交\", \"咧\", \"角\", \"慌\", \"喔\", \"嗓\", \"哈\", \"语\", \"铭\", \"无\", \"粮\", \"胎\", \"腥\", \"6\", \"矢\", \"渡\", \"霸\", \"槌\", \"楠\", \"阶\", \"智\", \"釜\", \"蜡\", \"韫\", \"匕\", \"嗲\", \"协\", \"枪\", \"盯\", \"痰\", \"蹩\", \"嵌\", \"岚\", \"春\", \"辄\", \"放\", \"彬\", \"韩\", \"稿\", \"榆\", \"侈\", \"倏\", \"碍\", \"葬\", \"踝\", \"兽\", \"當\", \"臆\", \"聘\", \"霾\", \"灿\", \"品\", \"颠\", \"唾\", \"届\", \"怀\", \"闹\", \"拷\", \"致\", \"堰\", \"恐\", \"潢\", \"∶\", \"仰\", \"毗\", \"划\", \"哼\", \"穆\", \"络\", \"冤\", \"蹿\", \"爻\", \"坠\", \"胧\", \"洛\", \"汲\", \"纵\", \"搂\", \"琐\", \"蛊\", \"崔\", \"惭\", \"女\", \"军\", \"煜\", \"寞\", \"椰\", \"惧\", \"婴\", \"衔\", \"页\", \"柏\", \"滔\", \"档\", \"睐\", \"拟\", \"鸩\", \"萦\", \"翡\", \"含\", \"券\", \"途\", \"矿\", \"菌\", \"荨\", \"桦\", \"塘\", \"涟\", \"骏\", \"己\", \"[\", \"句\", \"务\", \"姑\", \"垫\", \"及\", \"批\", \"诵\", \"厨\", \"祥\", \"暮\", \"乘\", \"览\", \"肚\", \"鲁\", \"儒\", \"通\", \"谢\", \"拭\", \"堆\", \"版\", \"挫\", \"虫\", \"紊\", \"库\", \"嚼\", \"从\", \"陪\", \"厕\", \"贯\", \";\", \"滋\", \"涵\", \"典\", \"偌\", \"饲\", \"众\", \"蜀\", \"柴\", \"柱\", \"抠\", \"琦\", \"退\", \"癜\", \"蜒\", \"账\", \"男\", \"坐\", \"馅\", \"溘\", \"恩\", \"畑\", \"绵\", \"時\", \"镕\", \"躲\", \"介\", \"着\", \"令\", \"核\", \"公\", \"旺\", \"奖\", \"塌\", \"甜\", \"字\", \"戳\", \"旌\", \"匹\", \"鞋\", \"喃\", \"龇\", \"医\", \"8\", \"偿\", \"卸\", \"晋\", \"延\", \"勉\", \"椅\", \"羚\", \"钩\", \"汤\", \"沏\", \"残\", \"对\", \"拒\", \"毙\", \"膳\", \"肉\", \"碟\", \"绛\", \"厅\", \"拐\", \"叩\", \"仔\", \"诸\", \"啊\", \"窝\", \"谣\", \"歇\", \"顿\", \"绅\", \"葱\", \"蛛\", \"淤\", \"棚\", \"贩\", \"犁\", \"股\", \"壁\", \"另\", \"イ\", \"芥\", \"夷\", \"①\", \"並\", \"盒\", \"驭\", \"_\", \"秋\", \"撑\", \"杆\", \"】\", \"甄\", \"掉\", \"烃\", \"驳\", \"殴\", \"伪\", \"淮\", \"涕\", \"砸\", \"讦\", \"氯\", \"逑\", \"疴\", \"權\", \"后\", \"压\", \"烦\", \"恿\", \"鳃\", \"歹\", \"孽\", \"乍\", \"氰\", \"嘀\", \"涤\", \"確\", \"佛\", \"良\", \"有\", \"蒋\", \"德\", \"悦\", \"亚\", \"十\", \"梧\", \"颂\", \"可\", \"诟\", \"▪\", \"牺\", \"郝\", \"型\", \"阀\", \"ὐ\", \"替\", \"游\", \"狂\", \"官\", \"命\", \"洼\", \"傥\", \"发\", \"餐\", \"季\", \"衰\", \"矩\", \"浩\", \"钞\", \"励\", \"弛\", \"端\", \"下\", \"笃\", \"囊\", \"搬\", \"犹\", \"艰\", \"坑\", \"嚎\", \"嬉\", \"哲\", \"势\", \"樊\", \"钟\", \"ě\", \"哭\", \"谷\", \"况\", \"黑\", \"综\", \"谴\", \"屹\", \" \", \"撅\", \"掖\", \"嘘\", \"只\", \"痛\", \"颧\", \"诉\", \"腓\", \"愚\", \"罹\", \"◆\", \"曰\", \"昕\", \"肝\", \"捏\", \"亩\", \"夫\", \"愉\", \"稳\", \"醐\", \"粹\", \"潦\", \"抗\", \"愧\", \"霄\", \"梭\", \"票\", \"啸\", \"税\", \"幕\", \"刊\", \"饮\", \"枣\", \"谐\", \"「\", \"秽\", \"窘\", \"恺\", \"牟\", \"愣\", \"善\", \"尿\", \"臣\", \"总\", \"冶\", \"棕\", \"窜\", \"霆\", \"阁\", \"铲\", \"择\", \"看\", \"珀\", \"啬\", \"強\", \"衣\", \"缉\", \"深\", \"坝\", \"庙\", \"病\", \"圣\", \"迫\", \"【\", \"眠\", \"選\", \"珉\", \"僻\", \"求\", \"鼾\", \"肥\", \"属\", \"吴\", \"厦\", \"赌\", \"忆\", \"豫\", \"酒\", \"寻\", \"焚\", \"玷\", \"d\", \"玉\", \"丢\", \"垣\", \"嚷\", \"趋\", \"镭\", \"询\", \"桅\", \"捂\", \"唱\", \"冀\", \"签\", \"乏\", \"主\", \"幻\", \"嘱\", \"佼\", \"喆\", \"踏\", \"沉\", \"妇\", \"矗\", \"溉\", \"筒\", \"伤\", \"蜥\", \"徙\", \"擤\", \"遏\", \"资\", \"巢\", \"睹\", \"狳\", \"耙\", \"瘩\", \"饷\", \"慮\", \"嘴\", \"玖\", \"哗\", \"尺\", \"宁\", \"赵\", \"乌\", \"嘲\", \"觉\", \"邸\", \"最\", \"员\", \"悯\", \"成\", \"泠\", \"斧\", \"呀\", \"猫\", \"毛\", \"夸\", \"镜\", \"蔡\", \"擦\", \"您\", \"陇\", \"④\", \"威\", \"雳\", \"炙\", \"孜\", \"目\", \"勘\", \"豚\", \"蟑\", \"啥\", \"战\", \"卖\", \"折\", \"济\", \"贴\", \"绕\", \"诀\", \"秩\", \"乎\", \"淫\", \"谦\", \"苍\", \"惴\", \"究\", \"役\", \"瑨\", \"毫\", \"重\", \"挠\", \"详\", \"抒\", \"犬\", \"骼\", \"除\", \"围\", \"烁\", \"际\", \"隆\", \"嘻\", \"姚\", \"箍\", \"容\", \"红\", \"惰\", \"砌\", \"藏\", \"涣\", \"破\", \"壳\", \"污\", \"年\", \"向\", \"决\", \"兄\", \"申\", \"举\", \"潇\", \"〞\", \"⑦\", \"炕\", \"纤\", \"饿\", \"登\", \"懊\", \"蔚\", \"比\", \"臊\", \"躇\", \"鞭\", \"徇\", \"近\", \"蜜\", \"溃\", \"曙\", \"险\", \"宅\", \"剂\", \"恒\", \"脆\", \"彰\", \"垢\", \"候\", \"豁\", \"统\", \"组\", \"叼\", \"畏\", \"道\", \"鄂\", \"蘑\", \"(\", \"县\", \"没\", \"恭\", \"凹\", \"孙\", \"窃\", \"阐\", \"沓\", \"补\", \"入\", \"起\", \"净\", \"茅\", \"铣\", \"衅\", \"灶\", \"迹\", \"绥\", \"椭\", \"缠\", \"闷\", \"蓝\", \"遥\", \"撩\", \"个\", \"每\", \"款\", \"岁\", \"食\", \"寒\", \"陵\", \"施\", \"液\", \"蕃\", \"薯\", \"诗\", \"浅\", \"棍\", \"翩\", \"吗\", \"澎\", \"象\", \"萃\", \"嘉\", \"枝\", \"禅\", \"樱\", \"拼\", \"韦\", \"倩\", \"担\", \"滨\", \"茄\", \"订\", \"佟\", \"段\", \"也\", \"风\", \"龙\", \"父\", \"搞\", \"覃\", \"羔\", \"评\", \"夥\", \"流\", \"r\", \"鹅\", \"礴\", \"鲨\", \"窥\", \"肆\", \"族\", \"蚀\", \"肤\", \"笛\", \"违\", \"留\", \"拖\", \"泄\", \"煎\", \"射\", \"赃\", \"你\", \"记\", \"五\", \"肇\", \"僧\", \"脉\", \"芮\", \"曳\", \"酬\", \"孩\", \"渊\", \"裁\", \"托\", \"贮\", \"兆\", \"血\", \"冠\", \"混\", \"垛\", \"载\", \"蔬\", \"财\", \"臭\", \"湖\", \"符\", \"校\", \"充\", \"孀\", \"喜\", \"蝌\", \"盛\", \"卉\", \"略\", \"旷\", \"韪\", \"恍\", \"陨\", \"创\", \"彼\", \"诈\", \"厄\", \"伺\", \"沧\", \"虐\", \"弧\", \"黝\", \"倍\", \"渤\", \"渲\", \"朋\", \"造\", \"茵\", \"殆\", \"澜\", \"吐\", \"併\", \"狐\", \"玻\", \"辈\", \"摄\", \"理\", \"畔\", \"珏\", \"盈\", \"猜\", \"⑩\", \"赂\", \"终\", \"臧\", \"赢\", \"乒\", \"辉\", \"挪\", \"慰\", \"\\u0005\", \"娅\", \"芝\", \"快\", \"勃\", \"斗\", \"伸\", \"针\", \"爬\", \"骤\", \"逶\", \"淀\", \"鸣\", \"丹\", \"且\", \"巨\", \"涡\", \"辑\", \"裔\", \"鲸\", \"叙\", \"爽\", \"状\", \"漱\", \"删\", \"洪\", \"胞\", \"沪\", \"努\", \"榜\", \"野\", \"饶\", \"铺\", \"此\", \"乖\", \"娘\", \"馁\", \"查\", \"挝\", \"饵\", \"冥\", \"瓢\", \"舟\", \"洽\", \"稍\", \"革\", \"铜\", \"粤\", \"熹\", \"回\", \"妆\", \".\", \"渗\", \"亟\", \"尽\", \"卤\", \"河\", \"『\", \"零\", \"逸\", \"言\", \"扫\", \"同\", \"限\", \"缔\", \"畜\", \"俪\", \"咸\", \"酸\", \"葫\", \"赏\", \"哄\", \"霖\", \"5\", \"整\", \"坤\", \"瑥\", \"予\", \"赠\", \"垄\", \"桂\", \"则\", \"秃\", \"磺\", \"乾\", \"才\", \"苣\", \"间\", \"璎\", \"为\", \"D\", \"御\", \"森\", \"黎\", \"吁\", \"授\", \"器\", \"昆\", \"媛\", \"兴\", \"肮\", \"摇\", \"喧\", \"晟\", \"姻\", \"彤\", \"藤\", \"桓\", \"珞\", \"驻\", \"呵\", \"待\", \"万\", \"缆\", \"染\", \"�\", \"睡\", \"粟\", \"在\", \"均\", \"铃\", \"冽\", \"胀\", \"⑨\", \"聊\", \"精\", \"剪\", \"赴\", \"累\", \"庇\", \"腔\", \"给\", \"怂\", \"径\", \"搡\", \"暂\", \"盲\", \"供\", \"童\", \"ό\", \"痹\", \"腊\", \"衫\", \"佣\", \"忌\", \"汉\", \"怡\", \"置\", \"照\", \"她\", \"救\", \"码\", \"池\", \"右\", \"沫\", \"翅\", \"拦\", \"美\", \"扣\", \"資\", \"厌\", \"枷\", \"扩\", \"狄\", \"畸\", \"莺\", \"萧\", \"颤\", \"睑\", \"盎\", \"婪\", \"末\", \"嫉\", \"踊\", \"仲\", \"妒\", \"篡\", \"麾\", \"耸\", \"榨\", \"贷\", \"粒\", \"突\", \"羽\", \"飓\", \"跌\", \"宰\", \"瘾\", \"咚\", \"亳\", \"犷\", \"攫\", \"四\", \"天\", \"袜\", \"遇\", \"娶\", \"递\", \"遁\", \"紧\", \"碾\", \"昌\", \"社\", \"喀\", \"尧\", \"撼\", \"借\", \"採\", \"械\", \"拂\", \"隐\", \"瞥\", \"怎\", \"仿\", \"碌\", \"畅\", \"勾\", \"荐\", \"耕\", \"碧\", \"疯\", \"银\", \"煤\", \"瞧\", \"锂\", \"恼\", \"者\", \"潮\", \"布\", \"猴\", \"急\", \"凸\", \"燎\", \"狈\", \"刺\", \"炫\", \"簧\", \"竭\", \"乔\", \"七\", \"扭\", \"面\", \"揪\", \"耶\", \"杀\", \"躺\", \"梗\", \"薄\", \"据\", \"脊\", \"榷\", \"闻\", \"图\", \"海\", \"―\", \"靡\", \"吃\", \"础\", \"凶\", \"缭\", \"散\", \"短\", \"庐\", \"糊\", \"课\", \"烂\", \"峡\", \"洁\", \"■\", \"缅\", \"额\", \"罢\", \"铎\", \"甬\", \"%\", \"滕\", \"呢\", \"根\", \"梅\", \"曾\", \"渠\", \"讼\", \"瞟\", \"哮\", \"疸\", \"闫\", \"瑜\", \"咒\", \"醉\", \"扛\", \"监\", \"枯\", \"枉\", \"鉴\", \"霈\", \"堵\", \"骚\", \"暗\", \"浮\", \"祛\", \"揭\", \"升\", \"雄\", \"外\", \"渥\", \"熔\", \"掌\", \"塔\", \"悄\", \"叠\", \"仓\", \"得\", \"落\", \"矣\", \"达\", \"岭\", \"喱\", \"苯\", \"枚\", \"进\", \"哀\", \"憨\", \"湛\", \"妻\", \"挥\", \"崖\", \"誉\", \"态\", \"篱\", \"舞\", \"长\", \"擎\", \"茎\", \"变\", \"尬\", \"琅\", \"胺\", \"俭\", \"喊\", \"凛\", \"凌\", \"丝\", \"莞\", \"蜷\", \"毁\", \"ヨ\", \"鹉\", \"厚\", \"册\", \"撰\", \"商\", \"怖\", \"展\", \"肴\", \"圭\", \"付\", \"萌\", \"苹\", \"吊\", \"沾\", \"部\", \"艋\", \"踢\", \"贬\", \"例\", \"壮\", \"穷\", \"疏\", \"瞬\", \"由\", \"別\", \"跳\", \"绪\", \"脱\", \"彦\", \"业\", \"迅\", \"哦\", \"办\", \"遑\", \"纯\", \"坏\", \"漓\", \"辛\", \"循\", \"秸\", \"巧\", \"湮\", \"勇\", \"』\", \"示\", \"楷\", \"爹\", \"躁\", \"鼓\", \"余\", \"圆\", \"凑\", \"轴\", \"锁\", \"桑\", \"养\", \"乡\", \"午\", \"⑧\", \"绸\", \"馒\", \"柄\", \"鄙\", \"鳞\", \"茉\", \"行\", \"障\", \"恰\", \"\", \"脯\", \"所\", \"筋\", \"是\", \"颌\", \"─\", \"联\", \"燃\", \"活\", \"肛\", \"月\", \"剑\", \"钵\", \"和\", \"沼\", \"癖\", \"种\", \"临\", \"呸\", \"仙\", \"类\", \"披\", \"接\", \"兜\", \"当\", \"话\", \"念\", \"仪\", \"惯\", \"栈\", \"咱\", \"即\", \"暹\", \"攥\", \"岸\", \"咦\", \"叫\", \"鞍\", \"盘\", \"谜\", \"爆\", \"昏\", \"焙\", \"建\", \"述\", \"②\", \"弯\", \"斋\", \"宝\", \"鑫\", \"痪\", \"湾\", \"宫\", \"菇\", \"殿\", \"敬\", \"人\", \"冒\", \"祖\", \"赔\", \"院\", \"咏\", \"徽\", \"姨\", \"磊\", \"沁\", \"职\", \"楔\", \"萝\", \"阑\", \"倜\", \"正\", \"掷\", \"伞\", \"橄\", \"宋\", \"咽\", \"耳\", \"题\", \"丛\", \"火\", \"伐\", \"啦\", \"肢\", \"壶\", \"绒\", \"0\", \"甸\", \"寰\", \"钧\", \"逞\", \"讪\", \"康\", \"涨\", \"骨\", \"蝉\", \"娴\", \"淋\", \"蝇\", \"这\", \"飙\", \"蚊\", \"宵\", \"坯\", \"弗\", \"猾\", \"户\", \"翻\", \"皱\", \"孟\", \"铄\", \"熊\", \"陡\", \"宗\", \"招\", \"慷\", \"历\", \"禁\", \"顶\", \"黏\", \"鹰\", \"晗\", \"赞\", \"嘛\", \"守\", \"遭\", \"广\", \"咖\", \"搅\", \"辨\", \"怪\", \"沐\", \"烘\", \"窿\", \"机\", \"陷\", \"屈\", \"启\", \"侠\", \"宏\", \"怯\", \"劑\", \"镏\", \"路\", \"雪\", \"颊\", \"桔\", \"疵\", \"倪\", \"濮\", \"传\", \"蛋\", \"灰\", \"筛\", \"诊\", \"彷\", \"护\", \"田\", \"芭\", \"懦\", \"瘠\", \"炖\", \"⒌\", \"募\", \"幢\", \"术\", \"t\", \"託\", \"偻\", \"芯\", \"铛\", \"劝\", \"织\", \"稻\", \"播\", \"误\", \"增\", \"簇\", \"拆\", \"恙\", \"巷\", \"杯\", \"⒂\", \"受\", \"然\", \"尘\", \"诱\", \"侧\", \"俊\", \"浇\", \"动\", \"绽\", \"兑\", \"稽\", \"式\", \"亲\", \"瓜\", \"璜\", \"铩\", \"而\", \"说\", \"疾\", \"》\", \"逝\", \"热\", \"瑰\", \"魂\", \"芳\", \"虽\", \"丘\", \"琛\", \")\", \"運\", \"竖\", \"阱\", \"沥\", \"遵\", \"摒\", \"攒\", \"洒\", \"匾\", \"椎\", \"够\", \"鹌\", \"磨\", \"敦\", \"戒\", \"抑\", \"標\", \"嘎\", \"刮\", \"搐\", \"棒\", \"牵\", \"坟\", \"蜂\", \"虑\", \"顺\", \"老\", \"摧\", \"炳\", \"技\", \"旎\", \"羊\", \"驾\", \"斩\", \"舀\", \"分\", \"廊\", \"价\", \"甩\", \"屌\", \"摊\", \"馋\", \"攀\", \"臀\", \"若\", \"兔\", \"奶\", \"谁\", \"~\", \"缓\", \"鬓\", \"存\", \"旖\", \"边\", \"叔\", \"鲍\", \"皙\", \"灸\", \"蔑\", \"售\", \"拥\", \"暑\", \"鳗\", \"婚\", \"墙\", \"萍\", \"旨\", \"杖\", \"茁\", \"芷\", \"区\", \"璨\", \"雷\", \"尉\", \"瘫\", \"大\", \"普\", \"援\", \"迟\", \"桶\", \"离\", \"倒\", \"禾\", \"郭\", \"粗\", \"霜\", \"袍\", \"滚\", \"健\", \"溢\", \"番\", \"豹\", \"忠\", \"博\", \"乙\", \"幸\", \"皑\", \"笨\", \"趾\", \"欧\", \"更\", \"挤\", \"悉\", \"扮\", \"宾\", \"睽\", \"©\", \"肃\", \"仄\", \"但\", \"愕\", \"皖\", \"冬\", \"吾\", \"凭\", \"啕\", \"璀\", \"摹\", \"枢\", \"梵\", \"霞\", \"遣\", \"袋\", \"赐\", \"掰\", \"涮\", \"徐\", \"煌\", \"么\", \"今\", \"脐\", \"绷\", \"煞\", \"炭\", \"竟\", \"报\", \"邱\", \"啃\", \"迩\", \"婆\", \"踹\", \"群\", \"愈\", \"世\", \"脚\", \"添\", \"脂\", \"滢\", \"点\", \"瘀\", \"随\", \"箱\", \"滤\", \"鲱\", \"超\", \"恕\", \"陌\", \"烹\", \"青\", \"雯\", \"专\", \"改\", \"溜\", \"梦\", \"槽\", \"耽\", \"榭\", \"夏\", \"咨\", \"戏\", \"嫌\", \"莓\", \"汽\", \"植\", \"祭\", \"一\", \"呜\", \"欸\", \"雾\", \"纸\", \"犰\", \"响\", \"睿\", \"心\", \"汕\", \"巡\", \"羹\", \"槐\", \"罄\", \"③\", \"写\", \"胸\", \"擅\", \"跋\", \"苇\", \"傍\", \"宽\", \"懈\", \"醛\", \"逼\", \"叹\", \"厢\", \"湿\", \"徳\", \"杂\", \"抵\", \"淌\", \"沦\", \"畿\", \"影\", \"浆\", \"艾\", \"N\", \"绑\", \"谨\", \"汪\", \"纬\", \"棘\", \"吠\", \"旗\", \"狮\", \"崇\", \"堕\", \"剧\", \"弃\", \"享\", \"耘\", \"咆\", \"敌\", \"刹\", \"眼\", \"胜\", \"击\", \"奥\", \"踵\", \"殊\", \"熟\", \"密\", \"荷\", \"先\", \"岐\", \"计\", \"筹\", \"穗\", \"坎\", \"殖\", \"荏\", \"诚\", \"樟\", \"储\", \"蜿\", \"痒\", \"渝\", \"缄\", \"摆\", \"锯\", \"宪\", \"匠\", \"梢\", \"疼\", \"偶\", \"诺\", \"星\", \"服\", \"←\", \"闵\", \"朴\", \"谓\", \"孵\", \"本\", \"赖\", \"街\", \"遴\", \"⒀\", \"带\", \"缺\", \"碴\", \"治\", \"瞎\", \"挡\", \"匀\", \"厮\", \"单\", \"债\", \"牢\", \"埃\", \"足\", \"浠\", \"寝\", \"原\", \"肩\", \"半\", \"齐\", \"漲\", \"娥\", \"辣\", \"按\", \"悼\", \"脑\", \"峨\", \"粽\", \"走\", \"仕\", \"悲\", \"媚\", \"伍\", \"灵\", \"跤\", \"円\", \"莹\", \"阿\", \"找\", \"の\", \"闯\", \"叮\", \"栋\", \"葵\", \"竣\", \"慎\", \"柬\", \"科\", \"喂\", \"奢\", \"傅\", \"就\", \"卿\", \"忑\", \"槛\", \"浚\", \"培\", \"姣\", \"颇\", \"於\", \"卫\", \"凉\", \"酪\", \"晒\", \"既\", \"奋\", \"观\", \"旅\", \"换\", \"诧\", \"骇\", \"朗\", \"片\", \"辖\", \"意\", \"审\", \"艘\", \"葡\", \"巫\", \"摞\", \"猎\", \"荡\", \"棠\", \"烊\", \"呻\", \"祀\", \"降\", \"飘\", \"阳\", \"踱\", \"媲\", \"飞\", \"漂\", \"姜\", \"里\", \"松\", \"!\", \"h\", \"妮\", \"~\", \"葩\", \"谆\", \"事\", \"导\", \"斌\", \"孕\", \"适\", \"元\", \"烙\", \"画\", \"哑\", \"苟\", \"歩\", \"依\", \"汇\", \"沙\", \"肺\", \"兢\", \"拧\", \"效\", \"滑\", \"困\", \"泛\", \"弟\", \"檐\", \"痕\", \"渴\", \"聪\", \"裹\", \"蚤\", \"较\", \"瘙\", \"?\", \"试\", \"犯\", \"跨\", \"猬\", \"欣\", \"損\", \"捉\", \"谚\", \"鹕\", \"唷\", \"验\", \"扎\", \"需\", \"慨\", \"惋\", \"玳\", \"龟\", \"嗔\", \"Ø\", \"嫁\", \"惶\", \"呈\", \"芒\", \"\\u0007\", \"黩\", \"鸦\", \"粉\", \"瑞\", \"权\", \"邵\", \"眯\", \"卜\", \"初\", \"拇\", \"啪\", \"莉\", \"贺\", \"躯\", \"燕\", \"罪\", \"隘\", \"楂\", \"崎\", \"诙\", \"厂\", \"吸\", \"糟\", \"茸\", \"炉\", \"止\", \"噢\", \"法\", \"琼\", \"哎\", \"赚\", \"屡\", \"屿\", \"柿\", \"麻\", \"谈\", \"羞\", \"粥\", \"蒿\", \"瞠\", \"戈\", \"郡\", \"岌\", \"翰\", \"\", \"吧\", \"痴\", \"维\", \"俗\", \"沸\", \"勺\", \"练\", \"演\", \"泡\", \"吓\", \"扳\", \"全\", \"构\", \"甯\", \"素\", \"震\", \"菩\", \"酌\", \"其\", \"忡\", \"膝\", \"缸\", \"隧\", \"柠\", \"飕\", \"颜\", \"倦\", \"壤\", \"俯\", \"崛\", \"祈\", \"跟\", \"疚\", \"螃\", \"劲\", \"奚\", \"茶\", \"蚂\", \"悔\", \"墅\", \"界\", \"靠\", \"檬\", \"厥\", \"肘\", \"烯\", \"脖\", \"董\", \"ソ\", \"嵘\", \"坞\", \"臼\", \"谑\", \"学\", \"搭\", \"穴\", \"干\", \"诩\", \"靴\", \"妈\", \"住\", \"蒙\", \"立\", \"采\", \"疹\", \"钮\", \"虾\", \"饨\", \"粕\", \"泊\", \"鬣\", \"蜃\", \"翁\", \"偏\", \"频\", \"雍\", \"纪\", \"睬\", \"熬\", \"抱\", \"霍\", \"揉\", \"陕\", \"妄\", \"螂\", \"馄\", \"揖\", \"涅\", \"子\", \"帕\", \"侦\", \"棣\", \"篓\", \"毯\", \"序\", \"砾\", \"始\", \"怒\", \"齿\", \"ト\", \"唏\", \"・\", \"灯\", \"冲\", \"王\", \"完\", \"扒\", \"作\", \"我\", \"知\", \"聿\", \"俘\", \"琶\", \"唆\", \"裂\", \"拣\", \"疤\", \"气\", \"恨\", \"挽\", \"算\", \"內\", \"腭\", \"眷\", \"聋\", \"砍\", \"抹\", \"颁\", \"腱\", \"觅\", \"逻\", \"箔\", \"讨\", \"髓\", \"逃\", \"庶\", \"指\", \"预\", \"祉\", \"蝶\", \"休\", \"辗\", \"钊\", \"墉\", \"绚\", \"柳\", \"巅\", \"孱\", \"景\", \"勤\", \"裆\", \"吻\", \"模\", \"颐\", \"惘\", \"鹦\", \"束\", \"窗\", \"押\", \"合\", \"拉\", \"懒\", \"耐\", \"译\", \"屠\", \"携\", \"轮\", \"议\", \"欠\", \"吝\", \"暖\", \"喘\", \"歧\", \"娄\", \"弈\", \"横\", \"屎\", \"漫\", \"碎\", \"排\", \"涌\", \"唯\", \"闺\", \"附\", \"熄\", \"贵\", \"桐\", \"倘\", \"沛\", \"睫\", \"已\", \"帷\", \"懵\", \"價\", \"锏\", \"碑\", \"貌\", \"锤\", \"谊\", \"顷\", \"琪\", \"1\", \"允\", \"探\", \"域\", \"扪\", \"茱\", \"俩\", \"伉\", \"籍\", \"悚\", \"哉\", \"教\", \"缩\", \"蹦\", \"蜘\", \"袭\", \"告\", \"壓\", \"透\", \"眨\", \"距\", \"阅\", \"烬\", \"奈\", \"想\", \"樯\", \"彗\", \"称\", \"侨\", \"咐\", \"泥\", \"炊\", \"停\", \"策\", \"撬\", \"粱\", \"辕\", \"谛\", \"浴\", \"提\", \"房\", \"楼\", \"荒\", \"仗\", \"ノ\", \"贞\", \"颗\", \"坛\", \"尼\", \"吩\", \"剔\", \"锄\", \"墓\", \"马\", \"轰\", \"似\", \"勋\", \"阽\", \"唐\", \"辱\", \"夭\", \"邀\", \"腕\", \"邋\", \"瑑\", \"牡\", \"橙\", \"嘣\", \"盆\", \"检\", \"翌\", \"诶\", \"线\", \"瀛\", \"央\", \"菁\", \"捡\", \"逮\", \"竿\", \"屁\", \"绘\", \"胃\", \"速\", \"趟\", \"杉\", \"狼\", \"祟\", \"绳\", \"缮\", \"剩\", \"架\", \"冻\", \"吵\", \"馨\", \"笆\", \"牌\", \"逐\", \"跑\", \"捅\", \"忪\", \"滓\", \"辽\", \"邯\", \"舍\", \"份\", \"失\", \"辰\", \"编\", \"第\", \"骂\", \"默\", \"滇\", \"逢\", \"刃\", \"旁\", \"盐\", \"旳\", \"捆\", \"转\", \"位\", \"豌\", \"格\", \"郅\", \"百\", \"灭\", \"馕\", \"井\", \"倚\", \"梨\", \"潜\", \"撷\", \"莫\", \"避\", \"株\", \"咕\", \"爰\", \"霓\", \"凯\", \"寐\", \"荟\", \"匈\", \"久\", \"伏\", \"吉\", \"町\", \"昊\", \"企\", \"反\", \"聆\", \"满\", \"蹴\", \"屑\", \"杨\", \"士\", \"拢\", \"扁\", \"轶\", \"宸\", \"怨\", \"杏\", \"钢\", \"碳\", \"饭\", \"苦\", \"读\", \"薪\", \"蓉\", \"赎\", \"坚\", \"2\", \"吞\", \"毎\", \"泉\", \"e\", \"函\", \"化\", \"耿\", \"\\u0000\", \"磅\", \"料\", \"胖\", \"馍\", \"旭\", \"贫\", \"张\", \"芽\", \"玩\", \"伦\", \"褪\", \"灼\", \"诲\", \"性\", \"尖\", \"骸\", \"邬\", \"魏\", \"囤\", \"窍\", \"认\", \"水\", \"甲\", \"⒁\", \"吼\", \"蛮\", \"璃\", \"杜\", \"拨\", \"拓\", \"糕\", \"咔\", \"埔\", \"史\", \"规\", \"傻\", \"皈\", \"猡\", \"蟹\", \"疮\", \"胶\", \"催\", \"咋\", \"泱\", \"捺\", \"实\", \"窦\", \"凿\", \"兼\", \"擘\", \"鹜\", \"浑\", \"砖\", \"腑\", \"丧\", \"虱\", \"匆\", \"涸\", \"員\", \"诠\", \"巳\", \"鄯\", \"歼\", \"金\", \"抖\", \"\", \"疗\", \"繁\", \"峰\", \"裳\", \"淡\", \"汹\", \"庚\", \"V\", \"腻\", \"迦\", \"惊\", \"纱\", \"释\", \"谩\", \"难\", \"丁\", \"球\", \"迁\", \"妤\", \"/\", \"卑\", \"莲\", \"娃\", \"牙\", \"诅\", \"静\", \"佰\", \"研\", \"瑕\", \"晶\", \"估\", \"药\", \"壑\", \"皆\", \"摘\", \"罗\", \"低\", \"拘\", \"城\", \"锲\", \":\", \"髻\", \"榻\", \"胁\", \"妙\", \"扼\", \"α\", \"郊\", \"厘\", \"曼\", \"侍\", \"籽\", \"旬\", \"见\", \"牠\", \"郁\", \",\", \"茜\", \"戸\", \"龚\", \"著\", \"廓\", \"词\", \"贾\", \"啤\", \"蓄\", \"舐\", \"纨\", \"尤\", \"参\", \"会\", \"谔\", \"篢\", \"矫\", \"被\", \"忐\", \"庭\", \"涝\", \"匿\", \"双\", \"英\", \"豪\", \"岛\", \"吨\", \"光\", \"\", \"损\", \"缝\", \"顾\", \"委\", \"疆\", \"乓\", \"、\", \"敞\", \"剐\", \"⑴\", \"湘\", \"柑\", \"悠\", \"经\", \"谋\", \"憧\", \"剁\", \"後\", \"三\", \"淑\", \"咙\", \"仇\", \"屋\", \"缀\", \"腾\", \"惚\", \"板\", \"胰\", \"岩\", \"霏\", \"任\", \"饱\", \"答\", \"俑\", \"系\", \"娑\", \"涯\", \"⒋\", \"峥\", \"描\", \"索\", \"瀑\", \"吹\", \"神\", \"丫\", \"i\", \"3\", \"底\", \"弱\", \"婶\", \"抡\", \"茫\", \"站\", \"旦\", \"促\", \"配\", \"固\", \"抓\", \"芜\", \"偎\", \"襟\", \"形\", \"镇\", \"拗\", \"渔\", \"汝\", \"往\", \"報\", \"准\", \"阔\", \"砂\", \"弩\", \"项\", \"弦\", \"棱\", \"冰\", \"搏\", \"悬\", \"武\", \"呦\", \"ズ\", \"猛\", \"淳\", \"永\", \"汩\", \"狠\", \"逛\", \"焕\", \"宣\", \"镉\", \"戾\", \"旆\", \"践\", \"确\", \"A\", \"唠\", \"切\", \"瓶\", \"锡\", \"铝\", \"篮\", \"栾\", \"垂\", \"碰\", \"坪\", \"秘\", \"握\", \"皂\", \"些\", \"昵\", \"耩\", \"宠\", \"夜\", \"远\", \"瀚\", \"连\", \"识\", \"掳\", \"囚\", \"古\", \"云\", \"藉\", \"朔\", \"署\", \"膏\", \"甚\", \"蠢\", \"シ\", \"橘\", \"琳\", \"骄\", \"漩\", \"塑\", \"郎\", \"犄\", \"差\", \"腋\", \"太\", \"块\", \"免\", \"伊\", \"掩\", \"岔\", \"伴\", \"埋\", \"糖\", \"疙\", \"曦\", \"栓\", \"断\", \"擀\", \"修\", \"※\", \"孤\", \"岱\", \"级\", \"体\", \"烈\", \"兹\", \"陋\", \"〗\", \"铨\", \"悖\", \"薩\", \"寓\", \"仑\", \"千\", \"酿\", \"源\", \"璇\", \"侄\", \"印\", \"赁\", \"履\", \"阜\", \"伽\", \"车\", \"牖\", \"侵\", \"玫\", \"凋\", \"日\", \"妨\", \"茏\", \"二\", \"轼\", \"槿\", \"掂\", \"穰\", \"槃\", \"黢\", \"团\", \"叶\", \"蹊\", \"拎\", \"争\", \"注\", \"牧\", \"让\", \"鸥\", \"烫\", \"班\", \"祢\", \"俺\", \"的\", \"啜\", \"朦\", \"薰\", \"莴\", \"狗\", \"触\", \"溺\", \"姊\", \"9\", \"氛\", \"彙\", \"顽\", \"息\", \"移\", \"骅\", \"旧\", \"花\", \"销\", \"哥\", \"少\", \"劣\", \"盗\", \"香\", \"措\", \"娇\", \"秤\", \"几\", \"汀\", \"钻\", \"范\", \"用\", \"彪\", \"盖\", \"肠\", \"勿\", \"珍\", \"邦\", \"敲\", \"噌\", \"捍\", \"邹\", \"犀\", \"醒\", \"麓\", \"勖\", \"力\", \"辩\", \"蚯\", \"糯\", \"骗\", \"姬\", \"稀\", \"\\b\", \"燥\", \"垃\", \"遢\", \"结\", \"嚣\", \"都\", \"唤\", \"疲\", \"噩\", \"戢\", \"阮\", \"炼\", \"轿\", \"斜\", \"帽\", \"视\", \"将\", \"米\", \"鳌\", \"楚\", \"呛\", \"柚\", \"诫\", \"氨\", \"嫩\", \"好\", \"鸠\", \"珊\", \"骆\", \"北\", \"逗\", \"・\", \"裕\", \"蔷\", \"抚\", \"减\", \"堡\", \"烤\", \"凝\", \"凤\", \"刁\", \"咎\", \"骁\", \"激\", \"覆\", \"漉\", \"败\", \"泳\", \"貂\", \"备\", \"翔\", \"秀\", \"狭\", \"π\", \"沽\", \"劫\", \"虏\", \"兮\", \"去\", \"氏\", \"哟\", \"晖\", \"裴\", \"尾\", \"滥\", \"电\", \"闪\", \"讶\", \"逍\", \"越\", \"動\", \"噱\", \"寸\", \"氢\", \"安\", \"栽\", \"→\", \"苑\", \"绍\", \"浊\", \"娛\", \"括\", \"煲\", \"柘\", \"献\", \"非\", \"功\", \"咪\", \"葛\", \"哺\", \"仁\", \"磁\", \"肓\", \"袱\", \"油\", \"暨\", \"身\", \"4\", \"泯\", \"舱\", \"霉\", \"跚\", \"炅\", \"麟\", \"胆\", \"乱\", \"迈\", \"罩\", \"宙\", \"苗\", \"园\", \"泾\", \"厉\", \"吏\", \"址\", \"庄\", \"癌\", \"挨\", \"平\", \"录\", \"姥\", \"礁\", \"头\", \"歌\", \"强\", \"邮\", \"咯\", \"锌\", \"譬\", \"馈\", \"皿\", \"晚\", \"羡\", \"尴\", \"漠\", \"溶\", \"\", \"们\", \"什\", \"手\", \"谀\", \"迄\", \"昧\", \"摔\", \"遂\", \"盼\", \"易\", \"奔\", \"網\", \"洲\", \"匮\", \"裤\", \"酥\", \"费\", \"↑\", \"缚\", \"呷\", \"扇\", \"笼\", \"砺\", \"朱\", \"肯\", \"恃\", \"泸\", \"陛\", \"伫\", \"o\", \"玲\", \"打\", \"孝\", \"眶\", \"浙\", \"奴\", \"颈\", \"像\", \"汰\", \"蓬\", \"件\", \"诃\", \"鱼\", \"怜\", \"饼\", \"纲\", \"掘\", \"藕\", \"罐\", \"碗\", \"占\", \"贱\", \"堂\", \"惫\", \"垒\", \"材\", \"惕\", \"馆\", \"亵\", \"裸\", \"缈\", \"京\", \"楞\", \"隙\", \"上\", \"惦\", \"晴\", \"苛\", \"寇\", \"敢\", \"波\", \"讲\", \"扰\", \"⑤\", \"抽\", \"荤\", \"锚\", \"忙\", \"木\", \"慕\", \"魔\", \"耦\", \"贸\", \"蚪\", \"穹\", \"宛\", \"耻\", \"荣\", \"君\", \"蓟\", \"铮\", \"敖\", \"褚\", \"漏\", \"妓\", \"隶\", \"婿\", \"物\", \"弄\", \"俄\", \"腹\", \"\", \"屉\", \"靛\", \"逅\", \"嗅\", \"高\", \"褐\", \"忽\", \"阎\", \"黔\", \"步\", \"俱\", \"仅\", \"膊\", \"蟋\", \"亮\", \"产\", \"绎\", \"晦\", \"醇\", \"忘\", \"為\", \"肾\", \"髦\", \"嗡\", \"嗪\", \"磕\", \"陈\", \"洋\", \"崽\", \"惮\", \"诣\", \"逾\", \"姿\", \"芙\", \"萎\", \"廉\", \"墨\", \"淘\", \"悴\", \"爪\", \"恶\", \"温\", \"嫖\", \"标\", \"栗\", \"毕\", \"瞒\", \"毡\", \"雌\", \"口\", \"攘\", \"琴\", \"撸\", \"刚\", \"洗\", \"躬\", \"雁\", \"搀\", \"获\", \"喷\", \"驶\", \"关\", \"娩\", \"狡\", \"应\", \"溯\", \"返\", \"互\", \"壕\", \"内\", \"剖\", \"叭\", \"鹃\", \"场\", \"茨\", \"草\", \"7\", \"堤\", \"韧\", \"树\", \"条\", \"装\", \"瓣\", \"刷\", \"坂\", \"刀\", \"帝\", \"慢\", \"闲\", \"萄\", \"摸\", \"呐\", \"该\", \"蹲\", \"窟\", \"鹭\", \"倡\", \"篇\", \"缕\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/fr": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1540504,
"_n_tokens": 707675,
"_n_chars": 1484970,
"_n_oov_chars": 1363,
"oov_ratio": 0.0009178636605453309,
"_oov_charset": "[\"̂\", \"ğ\", \"̧\", \"™\", \"́\", \"😉\", \"Ç\", \"❤\", \"§\", \"℃\", \"
\", \"œ\", \"―\", \"�\", \"★\", \"Ô\", \"😀\", \"″\", \"È\", \"ë\", \"♕\", \"ï\", \"Ê\", \"²\", \"´\", \"🙂\", \"·\", \"~\", \"Â\", \"ã\", \"\", \"À\", \"←\", \"🤔\", \"♠\", \"µ\", \"…\", \"‐\", \"í\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/es": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1664455,
"_n_tokens": 960105,
"_n_chars": 1630297,
"_n_oov_chars": 11584,
"oov_ratio": 0.007105453791548411,
"_oov_charset": "[\"→\", \"\", \"¿\", \"¡\", \"😉\", \"😦\", \"❤\", \"Á\", \"✖\", \"👏\", \"―\", \"×\", \"😀\", \"″\", \"ø\", \"■\", \"🙁\", \"©\", \"²\", \"Ú\", \"ò\", \"´\", \"✔\", \"🙂\", \"·\", \"Ñ\", \"Ó\", \"️\", \"ª\", \"ñ\", \"ý\", \"\", \"М\", \"▷\", \"←\", \"ú\", \"\", \"👍\", \"…\", \"✓\", \"í\", \"º\", \"✪\", \"\", \"Í\"]",
"lossless": false
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/en": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/zh-Hans": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/fr": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/es": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/phi-1 @ cc100/en": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1124813,
"_n_tokens": 258409,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/zh-Hans": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/fr": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/es": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/en": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1124813,
"_n_tokens": 258409,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/zh-Hans": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/fr": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/es": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"mistralai/Mistral-7B-v0.1 @ cc100/en": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/zh-Hans": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/fr": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/es": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/en": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/zh-Hans": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/fr": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/es": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai-community/gpt2 @ cc100/en": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1124813,
"_n_tokens": 258428,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/zh-Hans": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/fr": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/es": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai/code-davinci-002 @ cc100/en": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1124813,
"_n_tokens": 258403,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/zh-Hans": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/fr": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/es": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/en": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1124813,
"_n_tokens": 254985,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/zh-Hans": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2633047,
"_n_tokens": 1084939,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/fr": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1540504,
"_n_tokens": 412685,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/es": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1664455,
"_n_tokens": 433875,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/en": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1124813,
"_n_tokens": 254985,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/zh-Hans": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2633047,
"_n_tokens": 1084939,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/fr": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1540504,
"_n_tokens": 412685,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/es": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1664455,
"_n_tokens": 433875,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/en": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1124813,
"_n_tokens": 251655,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/zh-Hans": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 2633047,
"_n_tokens": 707171,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/fr": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1540504,
"_n_tokens": 353101,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/es": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1664455,
"_n_tokens": 367655,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/en": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1124813,
"_n_tokens": 258403,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/zh-Hans": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/fr": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/es": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"paust/pko-t5-large @ cc100/en": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1124813,
"_n_tokens": 648985,
"_n_chars": 1121360,
"_n_oov_chars": 59,
"oov_ratio": 5.261468217164871e-05,
"_oov_charset": "[\"③\", \"⑧\", \"⑩\", \"…\", \"⑦\", \"⑤\", \"´\", \"‑\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/zh-Hans": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 2633047,
"_n_tokens": 2523519,
"_n_chars": 927311,
"_n_oov_chars": 49165,
"oov_ratio": 0.053018890102673216,
"_oov_charset": "[\" \", \"t\", \"8\", \"-\", \"/\", \"1\", \"⒃\", \"℃\", \"④\", \"C\", \"②\", \"⒁\", \"⒂\", \"4\", \"]\", \";\", \"d\", \"⑴\", \"r\", \"⑥\", \"o\", \""\", \".\", \"6\", \"A\", \"&\", \"⑶\", \"⑨\", \"~\", \"9\", \"(\", \"・\", \"!\", \"③\", \"⑸\", \"%\", \"⑧\", \"h\", \":\", \"⒋\", \"s\", \"5\", \"⑿\", \"⑩\", \"⑷\", \"i\", \"T\", \"7\", \"[\", \"3\", \",\", \"①\", \" \", \"_\", \"0\", \"2\", \"N\", \"p\", \")\", \"D\", \"+\", \"…\", \"V\", \"n\", \"⑤\", \"e\", \"a\", \"⑦\", \"⒌\", \"⒀\", \"?\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/fr": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1540504,
"_n_tokens": 1034665,
"_n_chars": 1484970,
"_n_oov_chars": 833,
"oov_ratio": 0.0005609540933486872,
"_oov_charset": "[\"″\", \"™\", \"µ\", \"…\", \"²\", \"℃\", \"´\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/es": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1664455,
"_n_tokens": 1124056,
"_n_chars": 1630297,
"_n_oov_chars": 528,
"oov_ratio": 0.0003238673689517922,
"_oov_charset": "[\"″\", \"²\", \"…\", \"ª\", \"º\", \"´\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/en": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 1124813,
"_n_tokens": 493077,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"③\", \"🙂\", \"⑧\", \"\", \"😥\", \"😉\", \"\", \"\", \"⑩\", \"…\", \"⑦\", \"⑤\", \"´\", \"\", \"‑\", \"\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/zh-Hans": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 2633047,
"_n_tokens": 839588,
"_n_chars": 927311,
"_n_oov_chars": 104246,
"oov_ratio": 0.1124175168848423,
"_oov_charset": "[\"恳\", \"艳\", \"蒂\", \"贡\", \"阂\", \"祸\", \"藐\", \"抬\", \"蛔\", \"浞\", \"氮\", \"蓦\", \"岖\", \"骛\", \"⒃\", \"揍\", \"粪\", \"℃\", \"霭\", \"辆\", \"颖\", \"阵\", \"胳\", \"缜\", \"绞\", \"买\", \"鸟\", \"倾\", \"n\", \"敛\", \"撕\", \"挎\", \"暧\", \"镐\", \"锥\", \"戛\", \"栅\", \"巩\", \"埂\", \"娱\", \"蕴\", \"赅\", \"溅\", \"\", \"泻\", \"纺\", \"狰\", \"歉\", \"a\", \"纹\", \"耍\", \"绣\", \"庞\", \"膛\", \"镶\", \"伙\", \"魇\", \"骑\", \"颉\", \"姗\", \"钦\", \"哒\", \"嘭\", \"赋\", \"怵\", \"须\", \"\", \"谭\", \"锐\", \"饥\", \"桢\", \"帅\", \"谧\", \"犟\", \"噼\", \"晕\", \"侬\", \"僵\", \"锣\", \"稣\", \"聒\", \"睁\", \"帐\", \"亏\", \"抢\", \"呗\", \"锈\", \"韵\", \"岣\", \"T\", \"驿\", \"瑒\", \"瘦\", \"锅\", \"羁\", \"讳\", \"渍\", \"鲜\", \"辐\", \"揽\", \"黧\", \"懑\", \"谍\", \"谅\", \"衬\", \"抿\", \"⑥\", \"偷\", \"篷\", \"踌\", \"邓\", \"蹒\", \"纷\", \"瞄\", \"桩\", \"叨\", \"澡\", \"萤\", \"鲎\", \"淖\", \"吱\", \"汛\", \"仆\", \"嘤\", \"韬\", \"拽\", \"呕\", \"讥\", \"绰\", \"癫\", \"尝\", \"讽\", \"盏\", \"涩\", \"狱\", \"p\", \"扯\", \"硕\", \"聂\", \"蕤\", \"矍\", \"粼\", \"舔\", \"鸿\", \"鲤\", \"闸\", \"贼\", \"⑸\", \"锢\", \"蹭\", \"蔼\", \"烛\", \"轩\", \"焯\", \"遗\", \"蚁\", \"钰\", \"痫\", \"肿\", \"帘\", \"饽\", \"懂\", \"垮\", \"纽\", \"淅\", \"荧\", \"阴\", \"觑\", \"嘟\", \"迤\", \"铤\", \"辙\", \"脸\", \"⑿\", \"峭\", \"秆\", \"抨\", \"碱\", \"絮\", \"筷\", \"纠\", \"凳\", \"蚓\", \"岂\", \"纾\", \"媳\", \"佝\", \"麽\", \"翕\", \"暄\", \"莅\", \"亿\", \"笋\", \"苒\", \"捞\", \"闾\", \"训\", \"胫\", \"滩\", \"惬\", \"橱\", \"唉\", \"钉\", \"屣\", \"唬\", \"绊\", \"掺\", \"脏\", \"楣\", \"听\", \"嗨\", \"钥\", \"翘\", \"吮\", \"钓\", \"严\", \"嘈\", \"嗦\", \"帮\", \"驼\", \"侣\", \"C\", \"卻\", \"臃\", \"骰\", \"钝\", \"籁\", \"郸\", \"饰\", \"缴\", \"冯\", \"逊\", \"郜\", \"…\", \"吕\", \"缥\", \"炝\", \"缪\", \"-\", \"舰\", \"矶\", \"翱\", \"镀\", \"擞\", \"跃\", \"芃\", \"驰\", \"彻\", \"噬\", \"憋\", \"敝\", \"裙\", \"丐\", \"驮\", \"遛\", \"贤\", \"畴\", \"扑\", \"俏\", \"蓁\", \"喽\", \"绝\", \"涉\", \"跻\", \"灾\", \"佘\", \"趴\", \"婊\", \"赣\", \"酱\", \"柜\", \"爷\", \"泼\", \"棂\", \"讷\", \"瞪\", \"铂\", \"币\", \"啡\", \"挲\", \"撐\", \"硅\", \"诡\", \"靓\", \"镍\", \"鹈\", \"卧\", \""\", \"贪\", \"俞\", \"荫\", \"坷\", \"跷\", \"袒\", \"榄\", \"搁\", \"赡\", \"货\", \"缘\", \"+\", \"冈\", \"棵\", \"獗\", \"倨\", \"驱\", \"雏\", \"荆\", \"负\", \"扬\", \"铸\", \"猝\", \"劳\", \"飚\", \"啐\", \"驴\", \"痊\", \"吆\", \"掐\", \"哧\", \"奂\", \"邻\", \"怔\", \"纰\", \"墒\", \"绩\", \"鸭\", \"罚\", \"笔\", \"镳\", \"挣\", \"惩\", \"钜\", \"竞\", \"挚\", \"愤\", \"靶\", \"诞\", \"瞅\", \"馏\", \"⑶\", \"瞩\", \"呃\", \"卢\", \"浓\", \"谬\", \"⑷\", \"辅\", \"赶\", \"诬\", \"玮\", \"诨\", \"刨\", \"喻\", \"蟀\", \"慑\", \"俨\", \"忧\", \"]\", \"鼯\", \"嗯\", \"鹤\", \"&\", \"晾\", \"猖\", \"龄\", \"鸽\", \"趁\", \"\\u0006\", \"废\", \"茧\", \"夹\", \"s\", \"帜\", \"镑\", \"褂\", \"淼\", \"浏\", \"谎\", \"〖\", \"狞\", \"绉\", \"漪\", \"润\", \"泵\", \"踩\", \"轻\", \"谱\", \"锻\", \"湄\", \"扔\", \"舆\", \"颓\", \"挈\", \"掀\", \"辫\", \"撇\", \"桌\", \"栏\", \"鹑\", \"醋\", \"灑\", \"烧\", \"ㄓ\", \"屄\", \"挖\", \"氧\", \"圾\", \"瑧\", \"赘\", \"渐\", \"黯\", \"湃\", \"焊\", \"蜕\", \"萨\", \"蘸\", \"孪\", \"濒\", \"酝\", \"夯\", \"烷\", \"渎\", \"盹\", \"贿\", \"妞\", \"嘿\", \"揣\", \"锒\", \"吭\", \"咧\", \"喔\", \"嗓\", \"铭\", \"腥\", \"6\", \"阶\", \"蜡\", \"韫\", \"嗲\", \"枪\", \"盯\", \"蹩\", \"岚\", \"辄\", \"榆\", \"倏\", \"兽\", \"霾\", \"灿\", \"颠\", \"怀\", \"闹\", \"哼\", \"蹿\", \"胧\", \"坠\", \"纵\", \"搂\", \"琐\", \"蛊\", \"惭\", \"婴\", \"衔\", \"睐\", \"拟\", \"鸩\", \"萦\", \"矿\", \"荨\", \"涟\", \"桦\", \"骏\", \"[\", \"垫\", \"诵\", \"厕\", \"贯\", \";\", \"偌\", \"饲\", \"抠\", \"癜\", \"蜒\", \"账\", \"溘\", \"馅\", \"绵\", \"镕\", \"躲\", \"塌\", \"戳\", \"龇\", \"8\", \"偿\", \"钩\", \"汤\", \"沏\", \"毙\", \"碟\", \"绛\", \"厅\", \"诸\", \"啊\", \"窝\", \"谣\", \"绅\", \"顿\", \"贩\", \"另\", \"①\", \"驭\", \"_\", \"撑\", \"杆\", \"烃\", \"驳\", \"伪\", \"涕\", \"砸\", \"讦\", \"氯\", \"逑\", \"疴\", \"烦\", \"压\", \"鳃\", \"恿\", \"孽\", \"氰\", \"嘀\", \"涤\", \"颂\", \"诟\", \"▪\", \"牺\", \"阀\", \"洼\", \"傥\", \"钞\", \"囊\", \"笃\", \"犹\", \"艰\", \"嚎\", \"势\", \"谴\", \"综\", \"撅\", \" \", \"颧\", \"诉\", \"亩\", \"潦\", \"稳\", \"梭\", \"啸\", \"饮\", \"谐\", \"枣\", \"秽\", \"恺\", \"愣\", \"窜\", \"阁\", \"铲\", \"啬\", \"缉\", \"鼾\", \"赌\", \"忆\", \"寻\", \"d\", \"玷\", \"丢\", \"嚷\", \"趋\", \"镭\", \"桅\", \"捂\", \"妇\", \"溉\", \"伤\", \"擤\", \"遏\", \"巢\", \"睹\", \"狳\", \"耙\", \"瘩\", \"饷\", \"哗\", \"觉\", \"悯\", \"夸\", \"镜\", \"陇\", \"④\", \"雳\", \"蟑\", \"啥\", \"卖\", \"贴\", \"绕\", \"诀\", \"谦\", \"苍\", \"惴\", \"瑨\", \"挠\", \"骼\", \"烁\", \"嘻\", \"涣\", \"壳\", \"污\", \"⑦\", \"〞\", \"举\", \"潇\", \"炕\", \"纤\", \"饿\", \"臊\", \"溃\", \"险\", \"剂\", \"叼\", \"蘑\", \"(\", \"阐\", \"补\", \"净\", \"铣\", \"衅\", \"灶\", \"绥\", \"椭\", \"缠\", \"闷\", \"蓝\", \"撩\", \"诗\", \"翩\", \"吗\", \"樱\", \"韦\", \"搞\", \"羔\", \"r\", \"礴\", \"鹅\", \"鲨\", \"窥\", \"蚀\", \"肤\", \"违\", \"赃\", \"脉\", \"渊\", \"贮\", \"垛\", \"孀\", \"蝌\", \"旷\", \"韪\", \"陨\", \"诈\", \"沧\", \"黝\", \"渲\", \"澜\", \"摄\", \"辈\", \"⑩\", \"赂\", \"赢\", \"乒\", \"辉\", \"挪\", \"\\u0005\", \"娅\", \"瑢\", \"针\", \"骤\", \"逶\", \"鸣\", \"涡\", \"忪\", \"鲸\", \"饶\", \"铺\", \"馁\", \"饵\", \"挝\", \"铜\", \"妆\", \".\", \"渗\", \"卤\", \"扫\", \"缔\", \"俪\", \"赏\", \"5\", \"瑥\", \"赠\", \"垄\", \"秃\", \"磺\", \"苣\", \"璎\", \"D\", \" \", \"吁\", \"肮\", \"摇\", \"驻\", \"缆\", \"铃\", \"胀\", \"⑨\", \"怂\", \"搡\", \"暂\", \"痹\", \"腊\", \"佣\", \"拦\", \"扣\", \"厌\", \"扩\", \"莺\", \"萧\", \"颤\", \"睑\", \"婪\", \"妒\", \"篡\", \"耸\", \"榨\", \"贷\", \"飓\", \"瘾\", \"咚\", \"犷\", \"袜\", \"递\", \"紧\", \"尧\", \"隐\", \"畅\", \"荐\", \"疯\", \"瞧\", \"锂\", \"恼\", \"狈\", \"簧\", \"竭\", \"乔\", \"扭\", \"揪\", \"躺\", \"榷\", \"础\", \"缭\", \"庐\", \"课\", \"烂\", \"洁\", \"缅\", \"罢\", \"铎\", \"%\", \"呢\", \"瞟\", \"闫\", \"讼\", \"扛\", \"枉\", \"霈\", \"鉴\", \"骚\", \"祛\", \"揭\", \"悄\", \"叠\", \"仓\", \"喱\", \"苯\", \"憨\", \"挥\", \"篱\", \"擎\", \"尬\", \"胺\", \"俭\", \"丝\", \"毁\", \"鹉\", \"艋\", \"贬\", \"穷\", \"绪\", \"哦\", \"遑\", \"纯\", \"漓\", \"秸\", \"湮\", \"爹\", \"凑\", \"轴\", \"锁\", \"养\", \"⑧\", \"绸\", \"馒\", \"鳞\", \"\", \"脯\", \"颌\", \"钵\", \"呸\", \"惯\", \"仪\", \"栈\", \"咱\", \"攥\", \"咦\", \"谜\", \"②\", \"斋\", \"痪\", \"菇\", \"赔\", \"萝\", \"阑\", \"倜\", \"掷\", \"伞\", \"丛\", \"绒\", \"壶\", \"0\", \"钧\", \"讪\", \"涨\", \"娴\", \"蝇\", \"飙\", \"坯\", \"皱\", \"铄\", \"陡\", \"慷\", \"鹰\", \"黏\", \"晗\", \"赞\", \"嘛\", \"搅\", \"烘\", \"陷\", \"劑\", \"镏\", \"颊\", \"筛\", \"诊\", \"懦\", \"瘠\", \"炖\", \"⒌\", \"t\", \"偻\", \"铛\", \"劝\", \"织\", \"恙\", \"簇\", \"拆\", \"⒂\", \"尘\", \"诱\", \"侧\", \"浇\", \"绽\", \"兑\", \"铩\", \"虽\", \")\", \"竖\", \"阱\", \"沥\", \"摒\", \"攒\", \"匾\", \"够\", \"鹌\", \"刮\", \"搐\", \"牵\", \"坟\", \"虑\", \"摧\", \"旎\", \"驾\", \"斩\", \"舀\", \"甩\", \"屌\", \"馋\", \"摊\", \"侥\", \"鬓\", \"旖\", \"谁\", \"~\", \"鲍\", \"皙\", \"鳗\", \"拥\", \"墙\", \"茁\", \"璨\", \"瘫\", \"迟\", \"皑\", \"笨\", \"挤\", \"宾\", \"睽\", \"肃\", \"凭\", \"啕\", \"璀\", \"摹\", \"赐\", \"掰\", \"涮\", \"绷\", \"脐\", \"煞\", \"啃\", \"迩\", \"踹\", \"滢\", \"瘀\", \"滤\", \"鲱\", \"榭\", \"莓\", \"呜\", \"欸\", \"雾\", \"纸\", \"犰\", \"罄\", \"③\", \"苇\", \"醛\", \"叹\", \"厢\", \"杂\", \"淌\", \"沦\", \"N\", \"浆\", \"绑\", \"谨\", \"纬\", \"狮\", \"弃\", \"敌\", \"筹\", \"诚\", \"储\", \"蜿\", \"缄\", \"摆\", \"锯\", \"宪\", \"诺\", \"闵\", \"谓\", \"赖\", \"遴\", \"⒀\", \"碴\", \"瞎\", \"挡\", \"匀\", \"厮\", \"债\", \"浠\", \"脑\", \"跤\", \"莹\", \"闯\", \"叮\", \"栋\", \"柬\", \"喂\", \"忑\", \"槛\", \"姣\", \"颇\", \"奋\", \"诧\", \"骇\", \"辖\", \"审\", \"摞\", \"猎\", \"荡\", \"烊\", \"飘\", \"踱\", \"媲\", \"!\", \"h\", \"谆\", \"哑\", \"汇\", \"兢\", \"拧\", \"檐\", \"渴\", \"聪\", \"裹\", \"较\", \"瘙\", \"?\", \"猬\", \"谚\", \"鹕\", \"唷\", \"惋\", \"玳\", \"龟\", \"嗔\", \"惶\", \"\\u0007\", \"黩\", \"鸦\", \"眯\", \"啪\", \"贺\", \"楂\", \"诙\", \"噢\", \"琼\", \"哎\", \"赚\", \"屿\", \"谈\", \"瞠\", \"练\", \"吓\", \"扳\", \"忡\", \"缸\", \"飕\", \"柠\", \"崛\", \"疚\", \"螃\", \"劲\", \"蚂\", \"烯\", \"脖\", \"嵘\", \"坞\", \"谑\", \"诩\", \"妈\", \"虾\", \"饨\", \"睬\", \"熬\", \"馄\", \"侦\", \"帕\", \"篓\", \"砾\", \"唏\", \"齿\", \"・\", \"扒\", \"拣\", \"疤\", \"聋\", \"腭\", \"砍\", \"颁\", \"觅\", \"逻\", \"讨\", \"髓\", \"辗\", \"钊\", \"绚\", \"巅\", \"孱\", \"裆\", \"颐\", \"鹦\", \"惘\", \"懒\", \"译\", \"歧\", \"娄\", \"弈\", \"闺\", \"熄\", \"倘\", \"懵\", \"锏\", \"锤\", \"谊\", \"顷\", \"1\", \"扪\", \"俩\", \"伉\", \"悚\", \"蹦\", \"袭\", \"壓\", \"眨\", \"阅\", \"烬\", \"樯\", \"侨\", \"咐\", \"撬\", \"粱\", \"辕\", \"谛\", \"贞\", \"颗\", \"坛\", \"吩\", \"剔\", \"锄\", \"轰\", \"勋\", \"阽\", \"邋\", \"嘣\", \"瑑\", \"诶\", \"捡\", \"绘\", \"趟\", \"绳\", \"笆\", \"缮\", \"剩\", \"冻\", \"吵\", \"捅\", \"骂\", \"旳\", \"盐\", \"捆\", \"豌\", \"灭\", \"馕\", \"撷\", \"咕\", \"凯\", \"寐\", \"荟\", \"聆\", \"拢\", \"轶\", \"碳\", \"饭\", \"赎\", \"坚\", \"2\", \"e\", \"\\u0000\", \"磅\", \"馍\", \"贫\", \"伦\", \"诲\", \"邬\", \"囤\", \"窍\", \"⒁\", \"拨\", \"咔\", \"傻\", \"皈\", \"猡\", \"疮\", \"胶\", \"泱\", \"窦\", \"凿\", \"擘\", \"鹜\", \"浑\", \"砖\", \"丧\", \"匆\", \"诠\", \"歼\", \"抖\", \"\", \"疗\", \"汹\", \"V\", \"腻\", \"惊\", \"纱\", \"释\", \"谩\", \"难\", \"迁\", \"/\", \"诅\", \"估\", \"壑\", \"锲\", \"榻\", \":\", \"胁\", \"籽\", \"牠\", \",\", \"龚\", \"贾\", \"纨\", \"篢\", \"谔\", \"矫\", \"忐\", \"涝\", \"吨\", \"\", \"损\", \"缝\", \"顾\", \"剐\", \"乓\", \"⑴\", \"谋\", \"剁\", \"咙\", \"缀\", \"胰\", \"霏\", \"饱\", \"⒋\", \"峥\", \"丫\", \"i\", \"3\", \"婶\", \"抡\", \"芜\", \"偎\", \"渔\", \"阔\", \"悬\", \"呦\", \"汩\", \"狠\", \"逛\", \"旆\", \"镉\", \"焕\", \"戾\", \"A\", \"唠\", \"锡\", \"铝\", \"栾\", \"碰\", \"皂\", \"耩\", \"宠\", \"掳\", \"漩\", \"骄\", \"犄\", \"疙\", \"擀\", \"〗\", \"兹\", \"铨\", \"悖\", \"仑\", \"酿\", \"侄\", \"赁\", \"牖\", \"茏\", \"轼\", \"掂\", \"黢\", \"拎\", \"鸥\", \"烫\", \"薰\", \"莴\", \"姊\", \"9\", \"氛\", \"顽\", \"骅\", \"娇\", \"钻\", \"盖\", \"肠\", \"捍\", \"邹\", \"勖\", \"辩\", \"蚯\", \"骗\", \"\\b\", \"遢\", \"垃\", \"嚣\", \"唤\", \"戢\", \"噩\", \"炼\", \"轿\", \"鳌\", \"呛\", \"诫\", \"氨\", \"鸠\", \"骆\", \"蔷\", \"抚\", \"减\", \"烤\", \"骁\", \"虏\", \"晖\", \"哟\", \"滥\", \"闪\", \"讶\", \"噱\", \"氢\", \"浊\", \"煲\", \"咪\", \"肓\", \"暨\", \"4\", \"舱\", \"霉\", \"跚\", \"罩\", \"迈\", \"泾\", \"厉\", \"咯\", \"锌\", \"馈\", \"尴\", \"羡\", \"\", \"谀\", \"摔\", \"盼\", \"匮\", \"裤\", \"呷\", \"缚\", \"笼\", \"泸\", \"伫\", \"o\", \"眶\", \"颈\", \"诃\", \"饼\", \"纲\", \"藕\", \"贱\", \"惫\", \"垒\", \"亵\", \"缈\", \" \", \"惦\", \"讲\", \"扰\", \"⑤\", \"荤\", \"锚\", \"耦\", \"贸\", \"蚪\", \"耻\", \"蓟\", \"铮\", \"隶\", \"\", \"屉\", \"靛\", \"阎\", \"蟋\", \"膊\", \"仅\", \"绎\", \"肾\", \"嗡\", \"嗪\", \"磕\", \"崽\", \"惮\", \"诣\", \"逾\", \"恶\", \"嫖\", \"毕\", \"瞒\", \"毡\", \"撸\", \"刚\", \"搀\", \"喷\", \"驶\", \"鹃\", \"7\", \"韧\", \"闲\", \"呐\", \"鹭\", \"缕\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/fr": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 1540504,
"_n_tokens": 844215,
"_n_chars": 1484970,
"_n_oov_chars": 852,
"oov_ratio": 0.000573748964625548,
"_oov_charset": "[\"🙂\", \"😀\", \"″\", \"♕\", \"\", \"😉\", \"™\", \"µ\", \"…\", \"²\", \"℃\", \"\", \"
\", \"´\", \"🤔\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/es": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 1664455,
"_n_tokens": 910626,
"_n_chars": 1630297,
"_n_oov_chars": 568,
"oov_ratio": 0.00034840277569056434,
"_oov_charset": "[\"😉\", \"✖\", \"👏\", \"😀\", \"″\", \"🙁\", \"²\", \"´\", \"✔\", \"🙂\", \"\", \"ª\", \"\", \"▷\", \"\", \"👍\", \"…\", \"✓\", \"º\", \"✪\", \"😦\", \"\"]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/en": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1124813,
"_n_tokens": 269347,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/zh-Hans": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 2633047,
"_n_tokens": 563646,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/fr": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1540504,
"_n_tokens": 495052,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/es": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1664455,
"_n_tokens": 546501,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/en": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1124813,
"_n_tokens": 262509,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/zh-Hans": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2633047,
"_n_tokens": 1124681,
"_n_chars": 927311,
"_n_oov_chars": 2300,
"oov_ratio": 0.002480289784117734,
"_oov_charset": "[\"\\u0005\"]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/fr": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1540504,
"_n_tokens": 407853,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/es": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1664455,
"_n_tokens": 442138,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/en": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1124813,
"_n_tokens": 262509,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/zh-Hans": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2633047,
"_n_tokens": 1124681,
"_n_chars": 927311,
"_n_oov_chars": 2300,
"oov_ratio": 0.002480289784117734,
"_oov_charset": "[\"\\u0005\"]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/fr": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1540504,
"_n_tokens": 407853,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/es": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1664455,
"_n_tokens": 442138,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/en": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 463681,
"_n_chars": 1121360,
"_n_oov_chars": 218,
"oov_ratio": 0.0001944067917528715,
"_oov_charset": "[\"\", \"«\", \"¡\", \"😉\", \"®\", \"\", \"‑\", \"�\", \"^\", \"ï\", \"\", \"´\", \"»\", \"¦\", \"③\", \"🙂\", \"⑧\", \"😥\", \"\", \"•\", \"⑩\", \"£\", \"‘\", \"…\", \"⑦\", \"⑤\", \"\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/zh-Hans": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 633038,
"_n_chars": 927311,
"_n_oov_chars": 299437,
"oov_ratio": 0.3229089269942878,
"_oov_charset": "[\"悍\", \"恳\", \"艳\", \"嗤\", \"沃\", \"样\", \"蒂\", \"贡\", \"阂\", \"祸\", \"藐\", \"抬\", \"巾\", \"异\", \"蛔\", \"孰\", \"环\", \"浞\", \"匪\", \"橇\", \"窖\", \"氮\", \"蓦\", \"两\", \"优\", \"岖\", \"骛\", \"筝\", \"⒃\", \"揍\", \"粪\", \"℃\", \"霭\", \"岑\", \"调\", \"辆\", \"购\", \"颖\", \"阵\", \"〃\", \"鹏\", \"胳\", \"寥\", \"號\", \"极\", \"發\", \"缜\", \"论\", \"亦\", \"绞\", \"恣\", \"买\", \"键\", \"秉\", \"过\", \"测\", \"鸟\", \"收\", \"眩\", \"牒\", \"猥\", \"倾\", \"坡\", \"恪\", \"n\", \"敛\", \"蜴\", \"撕\", \"垠\", \"链\", \"挎\", \"丰\", \"暧\", \"镐\", \"锥\", \"苏\", \"戛\", \"亂\", \"晨\", \"莘\", \"拔\", \"栅\", \"巩\", \"埂\", \"娱\", \"蕴\", \"赅\", \"溅\", \"\", \"泻\", \"纺\", \"选\", \"别\", \"愁\", \"魄\", \"厝\", \"狰\", \"歉\", \"a\", \"奠\", \"纹\", \"佬\", \"耍\", \"泽\", \"责\", \"绣\", \"庞\", \"复\", \"徊\", \"膛\", \"砧\", \"迭\", \"镶\", \"伙\", \"魇\", \"骑\", \"旱\", \"颉\", \"姗\", \"钦\", \"夺\", \"哒\", \"嘭\", \"赋\", \"怵\", \"领\", \"刘\", \"闭\", \"须\", \"\", \"谭\", \"锐\", \"饥\", \"桢\", \"菲\", \"晰\", \"帅\", \"ο\", \"詹\", \"谧\", \"犟\", \"层\", \"噼\", \"衿\", \"尸\", \"晕\", \"τ\", \"侬\", \"僵\", \"噪\", \"锣\", \"稣\", \"聒\", \"熏\", \"睁\", \"蚌\", \"峙\", \"帐\", \"莎\", \"憔\", \"庆\", \"亏\", \"辜\", \"抢\", \"呗\", \"锈\", \"韵\", \"涎\", \"岣\", \"蕉\", \"T\", \"驿\", \"约\", \"瑒\", \"瘦\", \"锅\", \"羁\", \"陆\", \"讳\", \"妍\", \"渍\", \"鲜\", \"衷\", \"辐\", \"揽\", \"黧\", \"淹\", \"懑\", \"橡\", \"棉\", \"卷\", \"轨\", \"谍\", \"谅\", \"衬\", \"抿\", \"⑥\", \"偷\", \"璧\", \"胱\", \"邂\", \"忱\", \"篷\", \"踌\", \"邓\", \"蹒\", \"搜\", \"绿\", \"纷\", \"ç\", \"讯\", \"淞\", \"瞄\", \"桩\", \"叨\", \"纳\", \"淄\", \"澡\", \"萤\", \"鲎\", \"淖\", \"吱\", \"汛\", \"简\", \"仆\", \"聚\", \"嘤\", \"韬\", \"时\", \"拽\", \"队\", \"膀\", \"栖\", \"邢\", \"»\", \"呕\", \"贝\", \"掏\", \"讥\", \"绰\", \"癫\", \"尝\", \"儿\", \"讽\", \"盏\", \"涩\", \"舅\", \"狱\", \"许\", \"p\", \"惑\", \"扯\", \"硕\", \"聂\", \"„\", \"蕤\", \"矍\", \"炬\", \"粼\", \"栩\", \"ê\", \"捐\", \"酣\", \"舔\", \"拜\", \"鸿\", \"鲤\", \"斐\", \"闸\", \"贼\", \"⑸\", \"賣\", \"坦\", \"锢\", \"玛\", \"怕\", \"蹭\", \"蔼\", \"郴\", \"烛\", \"轩\", \"焰\", \"焯\", \"遗\", \"蚁\", \"钰\", \"奸\", \"脾\", \"痫\", \"杠\", \"肿\", \"帘\", \"饽\", \"箭\", \"请\", \"钱\", \"懂\", \"垮\", \"纽\", \"祷\", \"伟\", \"蝗\", \"淅\", \"拯\", \"荧\", \"徘\", \"阴\", \"觑\", \"嘟\", \"迤\", \"铤\", \"辙\", \"憾\", \"脸\", \"澈\", \"⑿\", \"峭\", \"输\", \"秆\", \"抨\", \"傲\", \"碱\", \"絮\", \"剿\", \"筷\", \"侃\", \"纠\", \"凳\", \"蚓\", \"篝\", \"岂\", \"纾\", \"细\", \"媳\", \"抛\", \"它\", \"证\", \"丽\", \"佝\", \"麽\", \"翕\", \"暄\", \"瑶\", \"莅\", \"亿\", \"笋\", \"显\", \"苒\", \"赫\", \"斛\", \"朵\", \"捞\", \"戍\", \"艺\", \"舛\", \"闾\", \"〝\", \"训\", \"婺\", \"汶\", \"农\", \"锋\", \"墟\", \"卡\", \"兰\", \"胫\", \"滩\", \"舒\", \"惬\", \"橱\", \"唉\", \"泪\", \"钉\", \"屣\", \"唬\", \"绊\", \"掺\", \"脏\", \"榴\", \"憬\", \"楣\", \"听\", \"喇\", \"归\", \"嗨\", \"拱\", \"钥\", \"翘\", \"吮\", \"钓\", \"执\", \"愿\", \"网\", \"椒\", \"严\", \"嘈\", \"嗦\", \"爱\", \"竺\", \"填\", \"帮\", \"驼\", \"侣\", \"C\", \"纂\", \"娜\", \"铁\", \"卻\", \"翊\", \"薇\", \"臃\", \"腿\", \"挂\", \"骰\", \"钝\", \"籁\", \"郸\", \"饰\", \"叉\", \"猩\", \"节\", \"继\", \"缴\", \"冯\", \"逊\", \"郜\", \"…\", \"很\", \"吕\", \"缥\", \"姆\", \"炝\", \"弑\", \"缪\", \"壹\", \"睛\", \"晤\", \"撞\", \"-\", \"卍\", \"舰\", \"霹\", \"芬\", \"瞻\", \"^\", \"矶\", \"熨\", \"翱\", \"镀\", \"沮\", \"擞\", \"跃\", \"瑄\", \"寨\", \"芃\", \"砥\", \"禽\", \"驰\", \"彻\", \"噬\", \"憋\", \"敝\", \"劾\", \"裙\", \"罕\", \"姐\", \"丐\", \"圳\", \"咳\", \"套\", \"驮\", \"臂\", \"遛\", \"贤\", \"畴\", \"扑\", \"俏\", \"蓁\", \"设\", \"罔\", \"烟\", \"耗\", \"喽\", \"岗\", \"师\", \"磋\", \"绝\", \"涉\", \"跻\", \"灾\", \"佘\", \"圩\", \"趴\", \"澳\", \"质\", \"渣\", \"赣\", \"东\", \"婊\", \"雕\", \"攸\", \"葆\", \"锦\", \"酱\", \"柜\", \"跪\", \"爷\", \"泼\", \"棂\", \"讷\", \"瓷\", \"拙\", \"瞪\", \"铂\", \"币\", \"截\", \"续\", \"啡\", \"瑟\", \"挲\", \"撐\", \"硅\", \"ς\", \"诡\", \"靓\", \"镍\", \"鹈\", \"婷\", \"卧\", \"糠\", \""\", \"匙\", \"还\", \"贪\", \"俞\", \"荫\", \"爸\", \"华\", \"莱\", \"坷\", \"蒜\", \"跷\", \"袒\", \"榄\", \"搁\", \"俚\", \"赡\", \"货\", \"缘\", \"+\", \"劈\", \"冈\", \"棵\", \"插\", \"內\", \"忿\", \"獗\", \"倨\", \"驱\", \"恤\", \"哇\", \"雏\", \"啼\", \"荆\", \"據\", \"负\", \"扬\", \"蕾\", \"铸\", \"惠\", \"遐\", \"尔\", \"猝\", \"劳\", \"瞰\", \"飚\", \"拌\", \"啐\", \"淆\", \"稠\", \"驴\", \"痊\", \"吆\", \"嫂\", \"掐\", \"哧\", \"仍\", \"涛\", \"习\", \"奂\", \"邻\", \"怔\", \"问\", \"禧\", \"擂\", \"纰\", \"墒\", \"绩\", \"鸭\", \"晓\", \"罚\", \"笔\", \"呆\", \"镳\", \"假\", \"蔽\", \"挣\", \"惩\", \"钜\", \"竞\", \"踞\", \"哪\", \"挚\", \"愤\", \"靶\", \"诞\", \"瞅\", \"馏\", \"喝\", \"⑶\", \"淇\", \"瞩\", \"斥\", \"廖\", \"臻\", \"剽\", \"呃\", \"现\", \"卢\", \"访\", \"柯\", \"浓\", \"谬\", \"⑷\", \"裘\", \"辅\", \"赶\", \"诬\", \"圜\", \"玮\", \"值\", \"诨\", \"刨\", \"溪\", \"奎\", \"鸡\", \"弹\", \"喻\", \"蟀\", \"圈\", \"营\", \"冉\", \"鞠\", \"慑\", \"俨\", \"忧\", \"]\", \"鼯\", \"邃\", \"潘\", \"戮\", \"嗯\", \"鹤\", \"惺\", \"并\", \"&\", \"晾\", \"咀\", \"猖\", \"龄\", \"鸽\", \"趁\", \"涂\", \"\\u0006\", \"废\", \"蹈\", \"义\", \"邕\", \"茧\", \"夹\", \"s\", \"帜\", \"镑\", \"蛙\", \"胥\", \"渺\", \"潭\", \"褂\", \"欢\", \"淼\", \"框\", \"浏\", \"谎\", \"〖\", \"桥\", \"狞\", \"软\", \"绉\", \"书\", \"漪\", \"润\", \"泵\", \"踩\", \"轻\", \"谱\", \"锻\", \"恢\", \"湄\", \"窄\", \"î\", \"扔\", \"舆\", \"颓\", \"迪\", \"挈\", \"掀\", \"辫\", \"琢\", \"撇\", \"桌\", \"栏\", \"噶\", \"鹑\", \"醋\", \"灑\", \"烧\", \"运\", \"屄\", \"ㄓ\", \"析\", \"挖\", \"掬\", \"奘\", \"氧\", \"圾\", \"黛\", \"瑧\", \"赘\", \"渐\", \"黯\", \"湃\", \"毋\", \"梳\", \"焊\", \"戚\", \"沟\", \"郑\", \"牲\", \"蜕\", \"巍\", \"积\", \"萨\", \"蘸\", \"孪\", \"赛\", \"踪\", \"濒\", \"错\", \"酝\", \"卦\", \"夯\", \"娟\", \"凰\", \"焉\", \"沂\", \"烷\", \"渎\", \"炮\", \"盹\", \"门\", \"贿\", \"杰\", \"乐\", \"开\", \"妞\", \"嘿\", \"揣\", \"处\", \"锒\", \"丑\", \"衍\", \"佩\", \"抉\", \"吭\", \"婉\", \"徨\", \"咧\", \"喔\", \"嗓\", \"哈\", \"语\", \"铭\", \"无\", \"粮\", \"腥\", \"6\", \"霸\", \"阶\", \"蜡\", \"韫\", \"匕\", \"嗲\", \"协\", \"枪\", \"盯\", \"痰\", \"蹩\", \"嵌\", \"岚\", \"辄\", \"彬\", \"榆\", \"韩\", \"侈\", \"倏\", \"碍\", \"踝\", \"兽\", \"當\", \"臆\", \"聘\", \"霾\", \"灿\", \"颠\", \"唾\", \"怀\", \"闹\", \"潢\", \"∶\", \"毗\", \"划\", \"哼\", \"络\", \"蹿\", \"爻\", \"坠\", \"胧\", \"纵\", \"搂\", \"琐\", \"蛊\", \"惭\", \"军\", \"煜\", \"寞\", \"椰\", \"惧\", \"婴\", \"衔\", \"页\", \"滔\", \"档\", \"睐\", \"拟\", \"鸩\", \"萦\", \"翡\", \"矿\", \"荨\", \"塘\", \"桦\", \"涟\", \"骏\", \"[\", \"务\", \"姑\", \"垫\", \"诵\", \"乘\", \"览\", \"肚\", \"鲁\", \"谢\", \"拭\", \"紊\", \"库\", \"嚼\", \"从\", \"厕\", \"贯\", \";\", \"涵\", \"偌\", \"饲\", \"众\", \"抠\", \"琦\", \"癜\", \"蜒\", \"账\", \"溘\", \"馅\", \"绵\", \"镕\", \"躲\", \"奖\", \"塌\", \"甜\", \"戳\", \"旌\", \"喃\", \"鞋\", \"龇\", \"8\", \"偿\", \"椅\", \"羚\", \"钩\", \"汤\", \"沏\", \"对\", \"毙\", \"`\", \"碟\", \"绛\", \"厅\", \"拐\", \"诸\", \"啊\", \"窝\", \"谣\", \"歇\", \"顿\", \"绅\", \"葱\", \"蛛\", \"淤\", \"贩\", \"犁\", \"另\", \"①\", \"盒\", \"驭\", \"_\", \"撑\", \"杆\", \"甄\", \"烃\", \"掉\", \"驳\", \"伪\", \"涕\", \"砸\", \"讦\", \"氯\", \"逑\", \"疴\", \"權\", \"烦\", \"压\", \"鳃\", \"恿\", \"歹\", \"孽\", \"乍\", \"氰\", \"嘀\", \"涤\", \"德\", \"亚\", \"梧\", \"颂\", \"诟\", \"▪\", \"牺\", \"郝\", \"阀\", \"ὐ\", \"游\", \"洼\", \"傥\", \"发\", \"餐\", \"钞\", \"弛\", \"囊\", \"笃\", \"犹\", \"艰\", \"嚎\", \"势\", \"樊\", \"钟\", \"ě\", \"哭\", \"况\", \"黑\", \"综\", \"谴\", \"屹\", \" \", \"撅\", \"掖\", \"颧\", \"诉\", \"腓\", \"◆\", \"昕\", \"亩\", \"愉\", \"潦\", \"稳\", \"粹\", \"愧\", \"霄\", \"梭\", \"啸\", \"饮\", \"谐\", \"枣\", \"秽\", \"窘\", \"恺\", \"愣\", \"棕\", \"总\", \"冶\", \"窜\", \"霆\", \"阁\", \"铲\", \"择\", \"珀\", \"啬\", \"缉\", \"坝\", \"庙\", \"圣\", \"珉\", \"僻\", \"鼾\", \"吴\", \"厦\", \"赌\", \"忆\", \"寻\", \"d\", \"玷\", \"丢\", \"嚷\", \"趋\", \"镭\", \"询\", \"桅\", \"捂\", \"签\", \"佼\", \"喆\", \"沉\", \"妇\", \"矗\", \"溉\", \"伤\", \"蜥\", \"徙\", \"擤\", \"遏\", \"资\", \"巢\", \"睹\", \"狳\", \"耙\", \"瘩\", \"饷\", \"玖\", \"哗\", \"宁\", \"赵\", \"乌\", \"觉\", \"员\", \"悯\", \"泠\", \"呀\", \"夸\", \"镜\", \"您\", \"陇\", \"④\", \"雳\", \"炙\", \"孜\", \"蟑\", \"啥\", \"战\", \"卖\", \"济\", \"贴\", \"绕\", \"辟\", \"诀\", \"碾\", \"乎\", \"淫\", \"谦\", \"苍\", \"惴\", \"瑨\", \"毫\", \"挠\", \"详\", \"抒\", \"骼\", \"围\", \"烁\", \"际\", \"嘻\", \"箍\", \"砌\", \"红\", \"惰\", \"藏\", \"涣\", \"壳\", \"污\", \"决\", \"⑦\", \"〞\", \"举\", \"潇\", \"炕\", \"纤\", \"饿\", \"懊\", \"臊\", \"躇\", \"徇\", \"溃\", \"险\", \"剂\", \"垢\", \"豁\", \"统\", \"组\", \"叼\", \"鄂\", \"蘑\", \"(\", \"县\", \"阐\", \"孙\", \"沓\", \"补\", \"净\", \"铣\", \"衅\", \"灶\", \"迹\", \"绥\", \"椭\", \"缠\", \"闷\", \"蓝\", \"撩\", \"个\", \"每\", \"款\", \"岁\", \"蕃\", \"薯\", \"诗\", \"棍\", \"翩\", \"吗\", \"澎\", \"萃\", \"樱\", \"拼\", \"韦\", \"倩\", \"滨\", \"茄\", \"订\", \"佟\", \"风\", \"龙\", \"搞\", \"覃\", \"羔\", \"评\", \"夥\", \"r\", \"鹅\", \"礴\", \"鲨\", \"窥\", \"肆\", \"蚀\", \"肤\", \"违\", \"拖\", \"泄\", \"赃\", \"你\", \"记\", \"脉\", \"芮\", \"酬\", \"孩\", \"渊\", \"托\", \"贮\", \"垛\", \"载\", \"蔬\", \"财\", \"孀\", \"蝌\", \"卉\", \"旷\", \"韪\", \"恍\", \"陨\", \"创\", \"诈\", \"沧\", \"黝\", \"渲\", \"茵\", \"澜\", \"玻\", \"辈\", \"摄\", \"珏\", \"盈\", \"猜\", \"⑩\", \"赂\", \"终\", \"臧\", \"赢\", \"乒\", \"辉\", \"挪\", \"\\u0005\", \"娅\", \"瑢\", \"针\", \"骤\", \"逶\", \"鸣\", \"涡\", \"辑\", \"裔\", \"鲸\", \"忪\", \"删\", \"沪\", \"榜\", \"饶\", \"铺\", \"馁\", \"饵\", \"查\", \"挝\", \"瓢\", \"洽\", \"稍\", \"铜\", \"粤\", \"熹\", \"妆\", \".\", \"渗\", \"亟\", \"卤\", \"扫\", \"缔\", \"俪\", \"葫\", \"赏\", \"哄\", \"霖\", \"5\", \"坤\", \"瑥\", \"赠\", \"垄\", \"则\", \"秃\", \"磺\", \"苣\", \"间\", \"璎\", \"为\", \"D\", \"吁\", \"媛\", \"兴\", \"肮\", \"摇\", \"晟\", \"姻\", \"彤\", \"珞\", \"驻\", \"呵\", \"缆\", \"�\", \"铃\", \"冽\", \"胀\", \"⑨\", \"聊\", \"剪\", \"给\", \"怂\", \"搡\", \"暂\", \"•\", \"痹\", \"ό\", \"腊\", \"衫\", \"佣\", \"汉\", \"怡\", \"她\", \"码\", \"沫\", \"拦\", \"扣\", \"厌\", \"枷\", \"扩\", \"狄\", \"畸\", \"莺\", \"萧\", \"颤\", \"睑\", \"盎\", \"婪\", \"妒\", \"篡\", \"耸\", \"榨\", \"贷\", \"飓\", \"跌\", \"瘾\", \"咚\", \"亳\", \"犷\", \"攫\", \"袜\", \"遇\", \"递\", \"遁\", \"紧\", \"喀\", \"尧\", \"撼\", \"械\", \"拂\", \"隐\", \"瞥\", \"怎\", \"仿\", \"碌\", \"畅\", \"荐\", \"疯\", \"银\", \"煤\", \"瞧\", \"锂\", \"恼\", \"猴\", \"燎\", \"狈\", \"炫\", \"簧\", \"竭\", \"乔\", \"扭\", \"揪\", \"杀\", \"躺\", \"梗\", \"榷\", \"闻\", \"图\", \"靡\", \"吃\", \"础\", \"缭\", \"庐\", \"糊\", \"课\", \"烂\", \"洁\", \"缅\", \"额\", \"罢\", \"铎\", \"甬\", \"%\", \"滕\", \"呢\", \"瞟\", \"渠\", \"闫\", \"讼\", \"哮\", \"疸\", \"瑜\", \"咒\", \"醉\", \"扛\", \"监\", \"枉\", \"霈\", \"鉴\", \"堵\", \"骚\", \"祛\", \"揭\", \"熔\", \"悄\", \"叠\", \"仓\", \"矣\", \"达\", \"岭\", \"喱\", \"苯\", \"进\", \"憨\", \"挥\", \"态\", \"篱\", \"长\", \"擎\", \"变\", \"尬\", \"琅\", \"胺\", \"俭\", \"喊\", \"丝\", \"莞\", \"蜷\", \"毁\", \"鹉\", \"册\", \"肴\", \"苹\", \"沾\", \"艋\", \"踢\", \"贬\", \"穷\", \"绪\", \"业\", \"哦\", \"办\", \"遑\", \"纯\", \"坏\", \"漓\", \"循\", \"秸\", \"湮\", \"楷\", \"爹\", \"躁\", \"圆\", \"凑\", \"轴\", \"锁\", \"养\", \"乡\", \"⑧\", \"绸\", \"馒\", \"鄙\", \"鳞\", \"茉\", \"恰\", \"\", \"脯\", \"颌\", \"─\", \"联\", \"剑\", \"钵\", \"呸\", \"种\", \"临\", \"仄\", \"类\", \"披\", \"惯\", \"话\", \"仪\", \"栈\", \"咱\", \"攥\", \"暹\", \"咦\", \"谜\", \"盘\", \"焙\", \"②\", \"斋\", \"弯\", \"鑫\", \"痪\", \"宫\", \"菇\", \"赔\", \"咏\", \"姨\", \"磊\", \"沁\", \"职\", \"萝\", \"阑\", \"倜\", \"掷\", \"伞\", \"橄\", \"丛\", \"题\", \"绒\", \"啦\", \"壶\", \"0\", \"甸\", \"钧\", \"寰\", \"逞\", \"讪\", \"涨\", \"蝉\", \"娴\", \"淋\", \"蝇\", \"这\", \"飙\", \"蚊\", \"宵\", \"坯\", \"弗\", \"猾\", \"户\", \"皱\", \"铄\", \"陡\", \"慷\", \"历\", \"顶\", \"黏\", \"鹰\", \"晗\", \"赞\", \"嘛\", \"广\", \"咖\", \"搅\", \"辨\", \"沐\", \"烘\", \"窿\", \"陷\", \"启\", \"侠\", \"劑\", \"镏\", \"颊\", \"桔\", \"疵\", \"倪\", \"濮\", \"传\", \"筛\", \"诊\", \"懦\", \"护\", \"瘠\", \"炖\", \"⒌\", \"幢\", \"术\", \"t\", \"à\", \"偻\", \"铛\", \"劝\", \"织\", \"稻\", \"误\", \"增\", \"簇\", \"拆\", \"恙\", \"巷\", \"⒂\", \"尘\", \"诱\", \"侧\", \"浇\", \"动\", \"绽\", \"兑\", \"亲\", \"璜\", \"铩\", \"而\", \"ù\", \"说\", \"热\", \"瑰\", \"虽\", \"琛\", \")\", \"竖\", \"阱\", \"沥\", \"摒\", \"攒\", \"洒\", \"匾\", \"够\", \"鹌\", \"嘎\", \"刮\", \"搐\", \"牵\", \"坟\", \"虑\", \"顺\", \"摧\", \"炳\", \"旎\", \"驾\", \"斩\", \"舀\", \"价\", \"甩\", \"屌\", \"摊\", \"馋\", \"攀\", \"臀\", \"奶\", \"兔\", \"鬓\", \"谁\", \"~\", \"缓\", \"旖\", \"侥\", \"边\", \"鲍\", \"皙\", \"灸\", \"鳗\", \"售\", \"拥\", \"墙\", \"芷\", \"萍\", \"茁\", \"璨\", \"瘫\", \"迟\", \"离\", \"禾\", \"滚\", \"袍\", \"皑\", \"笨\", \"趾\", \"挤\", \"悉\", \"宾\", \"睽\", \"©\", \"肃\", \"愕\", \"皖\", \"凭\", \"啕\", \"璀\", \"摹\", \"赐\", \"掰\", \"涮\", \"煌\", \"绷\", \"么\", \"脐\", \"煞\", \"竟\", \"报\", \"邱\", \"啃\", \"迩\", \"踹\", \"愈\", \"滢\", \"瘀\", \"滤\", \"鲱\", \"恕\", \"陌\", \"烹\", \"雯\", \"专\", \"梦\", \"耽\", \"榭\", \"咨\", \"戏\", \"莓\", \"呜\", \"欸\", \"雾\", \"纸\", \"犰\", \"响\", \"睿\", \"汕\", \"羹\", \"槐\", \"罄\", \"③\", \"擅\", \"苇\", \"懈\", \"宽\", \"醛\", \"逼\", \"叹\", \"厢\", \"杂\", \"淌\", \"沦\", \"浆\", \"艾\", \"N\", \"绑\", \"谨\", \"纬\", \"吠\", \"狮\", \"剧\", \"弃\", \"耘\", \"咆\", \"敌\", \"刹\", \"胜\", \"击\", \"踵\", \"计\", \"筹\", \"穗\", \"坎\", \"诚\", \"樟\", \"储\", \"蜿\", \"痒\", \"渝\", \"缄\", \"摆\", \"锯\", \"宪\", \"梢\", \"疼\", \"诺\", \"←\", \"闵\", \"谓\", \"赖\", \"遴\", \"⒀\", \"带\", \"缺\", \"碴\", \"瞎\", \"挡\", \"匀\", \"厮\", \"单\", \"债\", \"埃\", \"浠\", \"齐\", \"漲\", \"娥\", \"辣\", \"粽\", \"脑\", \"媚\", \"跤\", \"灵\", \"莹\", \"找\", \"闯\", \"叮\", \"栋\", \"柬\", \"喂\", \"奢\", \"忑\", \"槛\", \"姣\", \"颇\", \"卫\", \"凉\", \"奋\", \"观\", \"换\", \"诧\", \"骇\", \"辖\", \"审\", \"艘\", \"摞\", \"猎\", \"荡\", \"棠\", \"烊\", \"呻\", \"飘\", \"阳\", \"踱\", \"媲\", \"飞\", \"!\", \"h\", \"妮\", \"谆\", \"葩\", \"导\", \"斌\", \"孕\", \"适\", \"烙\", \"哑\", \"苟\", \"汇\", \"兢\", \"拧\", \"效\", \"泛\", \"檐\", \"渴\", \"聪\", \"裹\", \"蚤\", \"较\", \"瘙\", \"?\", \"试\", \"猬\", \"谚\", \"鹕\", \"唷\", \"验\", \"扎\", \"慨\", \"惋\", \"玳\", \"龟\", \"嗔\", \"Ø\", \"惶\", \"芒\", \"\\u0007\", \"黩\", \"鸦\", \"权\", \"邵\", \"眯\", \"拇\", \"啪\", \"贺\", \"躯\", \"楂\", \"诙\", \"厂\", \"糟\", \"茸\", \"噢\", \"滇\", \"琼\", \"哎\", \"赚\", \"屡\", \"屿\", \"羞\", \"谈\", \"粥\", \"蒿\", \"瞠\", \"戈\", \"岌\", \"翰\", \"\", \"吧\", \"痴\", \"维\", \"勺\", \"练\", \"吓\", \"扳\", \"甯\", \"构\", \"酌\", \"忡\", \"缸\", \"隧\", \"柠\", \"飕\", \"颜\", \"倦\", \"壤\", \"崛\", \"跟\", \"疚\", \"螃\", \"劲\", \"奚\", \"蚂\", \"墅\", \"檬\", \"靠\", \"厥\", \"烯\", \"脖\", \"嵘\", \"坞\", \"谑\", \"诩\", \"妈\", \"疹\", \"钮\", \"虾\", \"饨\", \"粕\", \"鬣\", \"蜃\", \"频\", \"纪\", \"睬\", \"熬\", \"霍\", \"陕\", \"螂\", \"馄\", \"涅\", \"侦\", \"帕\", \"棣\", \"篓\", \"毯\", \"砾\", \"唏\", \"齿\", \"・\", \"冲\", \"扒\", \"聿\", \"俘\", \"拣\", \"疤\", \"气\", \"聋\", \"腭\", \"眷\", \"砍\", \"颁\", \"觅\", \"逻\", \"讨\", \"髓\", \"预\", \"辗\", \"钊\", \"墉\", \"绚\", \"巅\", \"孱\", \"裆\", \"颐\", \"鹦\", \"惘\", \"窗\", \"懒\", \"译\", \"屠\", \"轮\", \"议\", \"吝\", \"歧\", \"娄\", \"弈\", \"屎\", \"碎\", \"涌\", \"闺\", \"熄\", \"贵\", \"倘\", \"沛\", \"睫\", \"已\", \"帷\", \"懵\", \"價\", \"锏\", \"貌\", \"锤\", \"谊\", \"顷\", \"琪\", \"1\", \"扪\", \"茱\", \"俩\", \"伉\", \"悚\", \"缩\", \"蹦\", \"蜘\", \"袭\", \"壓\", \"眨\", \"阅\", \"烬\", \"樯\", \"彗\", \"侨\", \"咐\", \"撬\", \"粱\", \"辕\", \"谛\", \"仗\", \"贞\", \"颗\", \"坛\", \"吩\", \"剔\", \"锄\", \"马\", \"轰\", \"勋\", \"阽\", \"辱\", \"邀\", \"邋\", \"嘣\", \"瑑\", \"检\", \"诶\", \"线\", \"瀛\", \"菁\", \"捡\", \"竿\", \"屁\", \"绘\", \"趟\", \"祟\", \"绳\", \"é\", \"缮\", \"剩\", \"吵\", \"冻\", \"馨\", \"笆\", \"跑\", \"捅\", \"滓\", \"辽\", \"邯\", \"舍\", \"份\", \"编\", \"骂\", \"默\", \"旁\", \"盐\", \"旳\", \"捆\", \"转\", \"豌\", \"郅\", \"灭\", \"馕\", \"倚\", \"撷\", \"咕\", \"爰\", \"霓\", \"凯\", \"寐\", \"荟\", \"昊\", \"聆\", \"满\", \"屑\", \"杨\", \"拢\", \"轶\", \"宸\", \"钢\", \"碳\", \"饭\", \"赎\", \"读\", \"蓉\", \"坚\", \"2\", \"吞\", \"e\", \"耿\", \"\\u0000\", \"磅\", \"胖\", \"馍\", \"褪\", \"贫\", \"张\", \"伦\", \"灼\", \"诲\", \"骸\", \"邬\", \"囤\", \"窍\", \"认\", \"⒁\", \"吼\", \"璃\", \"拨\", \"糕\", \"咔\", \"埔\", \"规\", \"傻\", \"皈\", \"猡\", \"疮\", \"胶\", \"咋\", \"泱\", \"捺\", \"实\", \"窦\", \"凿\", \"擘\", \"鹜\", \"浑\", \"砖\", \"腑\", \"丧\", \"虱\", \"匆\", \"涸\", \"诠\", \"鄯\", \"歼\", \"抖\", \"\", \"疗\", \"汹\", \"裳\", \"V\", \"庚\", \"腻\", \"迦\", \"惊\", \"纱\", \"释\", \"谩\", \"难\", \"迁\", \"妤\", \"/\", \"莲\", \"娃\", \"诅\", \"佰\", \"瑕\", \"估\", \"药\", \"壑\", \"罗\", \"髻\", \"锲\", \"榻\", \":\", \"胁\", \"扼\", \"厘\", \"籽\", \"见\", \"牠\", \",\", \"龚\", \"廓\", \"词\", \"贾\", \"啤\", \"舐\", \"‘\", \"纨\", \"尤\", \"篢\", \"谔\", \"矫\", \"忐\", \"涝\", \"岛\", \"吨\", \"\", \"损\", \"缝\", \"顾\", \"剐\", \"乓\", \"敞\", \"⑴\", \"经\", \"谋\", \"剁\", \"咙\", \"缀\", \"腾\", \"惚\", \"胰\", \"霏\", \"饱\", \"娑\", \"俑\", \"⒋\", \"涯\", \"峥\", \"瀑\", \"丫\", \"i\", \"3\", \"婶\", \"抡\", \"茫\", \"站\", \"抓\", \"芜\", \"偎\", \"镇\", \"拗\", \"渔\", \"阔\", \"项\", \"棱\", \"冰\", \"搏\", \"悬\", \"呦\", \"汩\", \"狠\", \"逛\", \"焕\", \"镉\", \"旆\", \"戾\", \"践\", \"确\", \"A\", \"唠\", \"锡\", \"铝\", \"篮\", \"栾\", \"碰\", \"皂\", \"些\", \"昵\", \"耩\", \"宠\", \"远\", \"瀚\", \"连\", \"识\", \"掳\", \"藉\", \"膏\", \"蠢\", \"漩\", \"琳\", \"骄\", \"塑\", \"犄\", \"块\", \"岔\", \"疙\", \"曦\", \"擀\", \"岱\", \"级\", \"〗\", \"兹\", \"陋\", \"铨\", \"悖\", \"仑\", \"酿\", \"侄\", \"璇\", \"赁\", \"阜\", \"车\", \"牖\", \"玫\", \"凋\", \"茏\", \"轼\", \"槿\", \"掂\", \"穰\", \"槃\", \"黢\", \"团\", \"蹊\", \"拎\", \"让\", \"鸥\", \"烫\", \"祢\", \"啜\", \"朦\", \"薰\", \"莴\", \"狗\", \"姊\", \"9\", \"氛\", \"彙\", \"顽\", \"骅\", \"销\", \"哥\", \"娇\", \"秤\", \"几\", \"汀\", \"钻\", \"彪\", \"盖\", \"肠\", \"敲\", \"噌\", \"捍\", \"邹\", \"犀\", \"醒\", \"勖\", \"辩\", \"蚯\", \"糯\", \"骗\", \"姬\", \"\\b\", \"燥\", \"垃\", \"遢\", \"结\", \"嚣\", \"唤\", \"戢\", \"噩\", \"炼\", \"轿\", \"视\", \"鳌\", \"呛\", \"诫\", \"氨\", \"嫩\", \"鸠\", \"骆\", \"蔷\", \"抚\", \"减\", \"烤\", \"刁\", \"骁\", \"凤\", \"漉\", \"败\", \"貂\", \"备\", \"兮\", \"虏\", \"沽\", \"劫\", \"晖\", \"哟\", \"滥\", \"电\", \"闪\", \"讶\", \"逍\", \"噱\", \"氢\", \"绍\", \"浊\", \"娛\", \"煲\", \"柘\", \"咪\", \"肓\", \"袱\", \"暨\", \"4\", \"泯\", \"舱\", \"霉\", \"跚\", \"炅\", \"罩\", \"迈\", \"园\", \"泾\", \"厉\", \"址\", \"录\", \"姥\", \"礁\", \"头\", \"邮\", \"强\", \"咯\", \"锌\", \"譬\", \"馈\", \"晚\", \"羡\", \"尴\", \"\", \"们\", \"什\", \"谀\", \"迄\", \"昧\", \"摔\", \"盼\", \"匮\", \"裤\", \"酥\", \"费\", \"↑\", \"缚\", \"呷\", \"笼\", \"砺\", \"恃\", \"泸\", \"陛\", \"伫\", \"o\", \"眶\", \"颈\", \"汰\", \"诃\", \"鱼\", \"怜\", \"饼\", \"纲\", \"藕\", \"罐\", \"碗\", \"贱\", \"惫\", \"垒\", \"惕\", \"馆\", \"亵\", \"缈\", \"琶\", \"楞\", \" \", \"惦\", \"讲\", \"扰\", \"⑤\", \"荤\", \"锚\", \"耦\", \"贸\", \"蚪\", \"穹\", \"耻\", \"荣\", \"蓟\", \"铮\", \"敖\", \"褚\", \"妓\", \"隶\", \"弄\", \"俄\", \"\", \"屉\", \"靛\", \"逅\", \"褐\", \"忽\", \"阎\", \"黔\", \"步\", \"俱\", \"仅\", \"膊\", \"蟋\", \"产\", \"绎\", \"晦\", \"醇\", \"肾\", \"髦\", \"嗡\", \"嗪\", \"磕\", \"陈\", \"崽\", \"惮\", \"诣\", \"逾\", \"悴\", \"恶\", \"嫖\", \"标\", \"毕\", \"瞒\", \"毡\", \"撸\", \"刚\", \"躬\", \"搀\", \"获\", \"喷\", \"驶\", \"关\", \"狡\", \"应\", \"溯\", \"剖\", \"叭\", \"鹃\", \"场\", \"7\", \"韧\", \"树\", \"瓣\", \"闲\", \"摸\", \"呐\", \"萄\", \"该\", \"蹲\", \"窟\", \"鹭\", \"倡\", \"缕\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/fr": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 695164,
"_n_chars": 1484970,
"_n_oov_chars": 11491,
"oov_ratio": 0.007738203465389873,
"_oov_charset": "[\"ô\", \"̂\", \"à\", \"ğ\", \"̧\", \"™\", \"«\", \"😉\", \"Ç\", \"́\", \"❤\", \"ê\", \"℃\", \"§\", \"Î\", \"®\", \"œ\", \"
\", \"�\", \"^\", \"€\", \"Ô\", \"😀\", \"″\", \"È\", \"î\", \"û\", \"ë\", \"♕\", \"ï\", \"Ê\", \"²\", \"é\", \"»\", \"´\", \"è\", \"🙂\", \"ù\", \"Â\", \"\", \"ã\", \"•\", \"\", \"ç\", \"À\", \"â\", \"←\", \"🤔\", \"‘\", \"♠\", \"µ\", \"…\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/es": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 779440,
"_n_chars": 1630297,
"_n_oov_chars": 2658,
"oov_ratio": 0.0016303777777914087,
"_oov_charset": "[\"\", \"¿\", \"ó\", \"¡\", \"😉\", \"«\", \"😦\", \"❤\", \"Á\", \"✖\", \"👏\", \"®\", \"^\", \"€\", \"😀\", \"ö\", \"″\", \"🙁\", \"©\", \"²\", \"Ú\", \"ò\", \"é\", \"»\", \"´\", \"✔\", \"🙂\", \"Ñ\", \"\", \"Ó\", \"á\", \"•\", \"️\", \"ª\", \"ý\", \"\", \"М\", \"▷\", \"←\", \"ú\", \"‘\", \"👍\", \"\", \"…\", \"✓\", \"í\", \"º\", \"✪\", \"\", \"Í\"]",
"lossless": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/ar": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 2813283,
"_n_tokens": 1416103,
"_n_chars": 1560987,
"_n_oov_chars": 1,
"oov_ratio": 6.406203254735626e-07,
"_oov_charset": "[\"ö\"]",
"lossless": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/de": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1814876,
"_n_tokens": 632573,
"_n_chars": 1784021,
"_n_oov_chars": 13536,
"oov_ratio": 0.007587354633157345,
"_oov_charset": "[\"û\", \"ü\", \"Á\", \"ú\", \"ö\", \"ø\"]",
"lossless": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/fa": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 2054052,
"_n_tokens": 963451,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/ja": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1774770,
"_n_tokens": 751467,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/ko": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1524839,
"_n_tokens": 1071983,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"eson/kplug-base-encoder @ cc100/ar": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 2813283,
"_n_tokens": 311987,
"_n_chars": 1560987,
"_n_oov_chars": 1352386,
"oov_ratio": 0.8663659594858893,
"_oov_charset": "[\" \", \"ﷺ\", \"â\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"
\", \"۷\", \"▪\", \"٩\", \"ي\", \"۸\", \"د\", \"٣\", \"à\", \"ى\", \"I\", \"ة\", \"U\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"V\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"é\", \"،\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"چ\", \"ك\", \"♥\", \"ۗ\", \"Y\", \"½\", \"ٹ\", \"ظ\", \"\", \"🙂\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"\", \"ٱ\", \"\", \"ث\", \"W\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"®\", \"ص\", \"Q\", \"ؤ\", \"E\", \"ä\", \"\", \"م\", \"\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"�\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"و\", \"L\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/de": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1814876,
"_n_tokens": 769053,
"_n_chars": 1784021,
"_n_oov_chars": 111071,
"oov_ratio": 0.06225879628098548,
"_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"‚\", \"\", \"Ã\", \"\", \" \", \"ί\", \"Á\", \"̈\", \"™\", \"\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"¶\", \"œ\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"♥\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"½\", \"🙂\", \"❤\", \"X\", \"ư\", \"´\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"‐\", \"ö\", \"😢\", \"ô\", \"¬\", \"`\", \"M\", \"J\", \"û\", \"H\", \"š\", \"\", \"İ\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"©\", \"😦\", \"\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"\", \"ń\", \"😆\", \"♦\", \"¿\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/fa": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 2054052,
"_n_tokens": 254671,
"_n_chars": 1145876,
"_n_oov_chars": 1017925,
"oov_ratio": 0.8883378306204162,
"_oov_charset": "[\" \", \"T\", \"۲\", \"ع\", \"\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"I\", \"ى\", \"ة\", \"ۀ\", \"U\", \"گ\", \"ن\", \"◄\", \"ب\", \"پ\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"V\", \"غ\", \"۰\", \"ء\", \"ط\", \"،\", \"G\", \"٪\", \"A\", \"N\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"Y\", \"ے\", \"ظ\", \"\", \"❤\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"F\", \"\", \"ج\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"\", \"ث\", \"۵\", \"W\", \"▐\", \"©\", \"ل\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"Q\", \"۹\", \"ؤ\", \"E\", \"\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"�\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"و\", \"L\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/ja": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1774770,
"_n_tokens": 318023,
"_n_chars": 603065,
"_n_oov_chars": 416951,
"oov_ratio": 0.691386500625969,
"_oov_charset": "[\"ネ\", \"逡\", \"+\", \"陰\", \"ハ\", \"靄\", \"カ\", \"イ\", \"漁\", \"納\", \"樺\", \"猶\", \"標\", \"̈\", \"詐\", \"謎\", \"鍵\", \"ぇ\", \"堅\", \"サ\", \"業\", \"ま\", \"軟\", \"斉\", \"報\", \"謗\", \"艸\", \"I\", \"%\", \"斂\", \"習\", \"書\", \"喚\", \"こ\", \"個\", \"プ\", \"U\", \"渦\", \"濫\", \"縦\", \"築\", \"筆\", \"編\", \"預\", \"モ\", \"ィ\", \"長\", \"ざ\", \"V\", \"託\", \"龍\", \"偵\", \"棲\", \"遊\", \"&\", \"塚\", \"㎞\", \"憶\", \"W\", \"侶\", \"A\", \"殲\", \"鈴\", \"ぅ\", \"瘍\", \"ブ\", \"膿\", \"誇\", \"N\", \"ひ\", \"挿\", \"ゃ\", \"疎\", \"謝\", \"o\", \"傘\", \"謀\", \"な\", \"勢\", \"詞\", \"雲\", \"凍\", \"Y\", \"鳴\", \"E\", \"質\", \"彙\", \"妬\", \">\", \"穢\", \"穀\", \"頷\", \"瞭\", \"リ\", \"週\", \"還\", \"頂\", \"⑪\", \"計\", \"緩\", \"よ\", \"護\", \"B\", \"錬\", \"憤\", \"縞\", \"ツ\", \"ぞ\", \"ゼ\", \"袴\", \"鞄\", \"腫\", \"ㅂ\", \"捗\", \"滅\", \"ペ\", \"蓮\", \"館\", \"軒\", \"輩\", \"韓\", \"備\", \"創\", \"m\", \"導\", \"輔\", \"糾\", \"シ\", \"開\", \"ベ\", \"ぷ\", \"棟\", \"れ\", \"謂\", \"ヶ\", \"ね\", \"積\", \"び\", \"劇\", \"暫\", \"捨\", \"該\", \"た\", \"牽\", \"蒔\", \"⻑\", \"傷\", \"細\", \"`\", \"y\", \"絆\", \"N\", \"診\", \"許\", \"錠\", \"唄\", \"滲\", \"゚\", \"騰\", \"躊\", \"塵\", \"澪\", \"鳥\", \"H\", \"側\", \"記\", \"7\", \"響\", \"あ\", \"賀\", \"r\", \"グ\", \"貝\", \"並\", \"撫\", \"ニ\", \"ヒ\", \"賊\", \"漬\", \"贈\", \"誌\", \"ユ\", \"Ⅱ\", \"動\", \"飾\", \"辿\", \"💦\", \"そ\", \"紅\", \"ヨ\", \"ォ\", \"殺\", \"ル\", \"©\", \"岡\", \"譚\", \"潔\", \"漢\", \"3\", \"誕\", \"\\u001b\", \"費\", \"級\", \"く\", \"砦\", \"り\", \"聾\", \"針\", \"説\", \"Q\", \"w\", \"貴\", \"娯\", \"題\", \"賞\", \"ぱ\", \"給\", \"姦\", \"奪\", \"5\", \"ふ\", \"ヘ\", \"復\", \"い\", \"闊\", \"呑\", \"冊\", \"セ\", \"わ\", \"録\", \"D\", \"涼\", \"灘\", \"顎\", \"綜\", \"潤\", \"厭\", \"闖\", \"蝋\", \"疇\", \"ケ\", \"綾\", \"�\", \"艶\", \"償\", \"責\", \"砕\", \"X\", \"這\", \"運\", \"O\", \"B\", \"恥\", \"陸\", \"儀\", \"f\", \"L\", \"糞\", \"襲\", \"拠\", \"O\", \"駕\", \"ウ\", \"⇔\", \"ば\", \"え\", \"揚\", \"敵\", \"鍛\", \"バ\", \"ギ\", \"L\", \"衛\", \"債\", \"磯\", \"〟\", \"蘇\", \"節\", \"庫\", \"ッ\", \"輪\", \"墜\", \"ワ\", \"ゎ\", \"傾\", \"簡\", \"っ\", \"賭\", \"鬱\", \"類\", \"終\", \"陥\", \"隕\", \"R\", \"療\", \"贋\", \"罠\", \"視\", \"屓\", \"於\", \"痩\", \"〆\", \"準\", \"陳\", \"損\", \"コ\", \"暁\", \"に\", \"則\", \"ボ\", \"ミ\", \"惣\", \"纒\", \"強\", \"壇\", \"譜\", \"頭\", \"僅\", \"縫\", \"養\", \"で\", \"煩\", \"揮\", \"掻\", \"購\", \"韮\", \"ゅ\", \"Y\", \"時\", \"メ\", \"摂\", \"賑\", \"兎\", \"ゆ\", \"驚\", \"P\", \"す\", \"墾\", \"傑\", \"誘\", \"應\", \"結\", \"せ\", \"係\", \"聖\", \"頻\", \"曖\", \"K\", \"審\", \"詩\", \"紐\", \"Ⅶ\", \"賢\", \"嗚\", \"聞\", \"詠\", \"郵\", \"箋\", \"D\", \"艦\", \"桟\", \"衝\", \"阪\", \"盤\", \"ち\", \"ゲ\", \"ぼ\", \"嚥\", \"勲\", \"噴\", \"や\", \"醸\", \"‐\", \"蛍\", \"▷\", \"ポ\", \"飲\", \"場\", \"猟\", \"=\", \"ガ\", \"め\", \"b\", \"詮\", \"∇\", \"間\", \"フ\", \"ピ\", \"優\", \"談\", \"務\", \"奨\", \"園\", \"賃\", \"✨\", \"極\", \"欄\", \"陽\", \"飽\", \"華\", \"濃\", \"鍋\", \"ヨ\", \"貨\", \"贔\", \"訝\", \"デ\", \"W\", \"楊\", \"順\", \"員\", \"遼\", \"渕\", \"軸\", \"*\", \"環\", \"\", \"親\", \"ダ\", \"/\", \"貸\", \"綻\", \"徹\", \"況\", \"幾\", \"ス\", \"測\", \"謙\", \"楓\", \"張\", \"倫\", \"梱\", \"絡\", \"9\", \"ろ\", \"紛\", \"悶\", \"n\", \"鋲\", \"彡\", \"缶\", \"鉱\", \"︎\", \"2\", \"ビ\", \"ュ\", \"啓\", \"須\", \"は\", \"貼\", \"過\", \"陣\", \"ゞ\", \"醤\", \"噛\", \"諏\", \"髭\", \"敗\", \"慮\", \"資\", \"薩\", \"G\", \"渇\", \"礫\", \"し\", \"糧\", \"嘆\", \"コ\", \"見\", \"礎\", \"﨑\", \"殻\", \"\\b\", \"機\", \"縛\", \"閑\", \"織\", \"S\", \"づ\", \"ゴ\", \"簗\", \"師\", \"減\", \"鯖\", \"貫\", \"a\", \"ン\", \"Ⅹ\", \"絶\", \"緒\", \"興\", \"餅\", \"黙\", \"腎\", \"獲\", \"臥\", \"謡\", \"確\", \"M\", \"連\", \"ぉ\", \"膚\", \"詈\", \"_\", \"Z\", \"d\", \"劉\", \"顕\", \"擬\", \"貞\", \"義\", \"テ\", \"協\", \"]\", \"C\", \"曇\", \"紋\", \"適\", \"婦\", \"0\", \"霧\", \"嶽\", \"軌\", \"臨\", \"奮\", \"綴\", \"ャ\", \"篤\", \"鏡\", \"ず\", \"駐\", \"飯\", \"虜\", \"穫\", \"監\", \"ド\", \"請\", \"H\", \"帳\", \"儲\", \"國\", \"澤\", \"誹\", \"憲\", \"揺\", \"罵\", \"約\", \"斬\", \"^\", \"潰\", \"純\", \"販\", \"き\", \"ヌ\", \"\\", \"G\", \"讐\", \"規\", \"ク\", \"鱈\", \"貧\", \"飛\", \"軋\", \"\", \"墳\", \"駒\", \"討\", \"課\", \"鈍\", \"沖\", \"捜\", \"さ\", \"誠\", \"懐\", \"銘\", \"̀\", \"ゝ\", \"島\", \"競\", \"ょ\", \"職\", \"喪\", \"併\", \"頃\", \"ナ\", \"慄\", \"衆\", \"諦\", \"覗\", \"A\", \"羅\", \"駿\", \"懇\", \"東\", \"憑\", \"e\", \"ノ\", \"掛\", \"買\", \"戯\", \"遙\", \"◯\", \"ラ\", \"緻\", \"無\", \"紡\", \"絞\", \"摯\", \"C\", \"匂\", \"偉\", \"腸\", \"轄\", \"問\", \"塊\", \"語\", \"メ\", \"銃\", \"財\", \"瘻\", \"閲\", \"飢\", \"オ\", \"趨\", \"F\", \"h\", \"ゥ\", \"漑\", \"麗\", \"て\", \"勝\", \"P\", \"$\", \" \", \"タ\", \"R\", \"か\", \"チ\", \"ぶ\", \"4\", \"尋\", \"ア\", \"愛\", \"鎖\", \"釘\", \"執\", \"貪\", \"遠\", \"議\", \"ぃ\", \"が\", \"ぐ\", \"ゾ\", \"範\", \"カ\", \"諸\", \"I\", \"統\", \"採\", \"噂\", \"釈\", \"ア\", \"宮\", \"壌\", \"ヤ\", \"ト\", \"る\", \"k\", \"8\", \"馳\", \"諺\", \"藁\", \"ョ\", \"舘\", \"ヵ\", \"廻\", \"囁\", \"́\", \"嘗\", \"繍\", \"綬\", \"餓\", \"リ\", \"貯\", \"葉\", \"罰\", \"輿\", \"調\", \"ウ\", \"寧\", \"[\", \"訴\", \"ぬ\", \"鮮\", \"粋\", \"キ\", \"®\", \"K\", \"煙\", \".\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"貢\", \"繰\", \"賛\", \"塗\", \"ぽ\", \"紙\", \"ロ\", \"遡\", \"じ\", \"頒\", \"線\", \"鉢\", \"諾\", \"ら\", \"離\", \"貿\", \"飼\", \"欝\", \"お\", \"網\", \"酔\", \"鶏\", \"謄\", \"綺\", \"l\", \"進\", \"馬\", \"倉\", \"識\", \"慶\", \"繊\", \"ー\", \"裏\", \"籠\", \"違\", \"紹\", \"緑\", \"別\", \"レ\", \"ロ\", \"農\", \"貰\", \"層\", \"暦\", \"😊\", \"T\", \"訊\", \"脈\", \"構\", \"拶\", \"ぎ\", \"◡\", \"🌙\", \"緊\", \"鴻\", \"訃\", \"製\", \"を\", \"顔\", \"T\", \"ヴ\", \"顧\", \"詳\", \"😌\", \"閃\", \"練\", \"ど\", \"訣\", \"燭\", \"餃\", \"門\", \"贅\", \"S\", \"槍\", \"馴\", \"鉛\", \"g\", \"偽\", \"鵜\", \"遜\", \"絨\", \"@\", \"車\", \"態\", \"訪\", \"難\", \"鶴\", \"渓\", \"ヲ\", \"麹\", \"`\", \"i\", \"額\", \"ヽ\", \"電\", \"災\", \"ヘ\", \"t\", \"願\", \"\", \"複\", \"領\", \"遺\", \"鐘\", \"嘩\", \"認\", \"も\", \"項\", \"犠\", \"ヾ\", \"ホ\", \"薦\", \"熱\", \"蓋\", \"話\", \"種\", \"ム\", \"レ\", \"績\", \"懸\", \"X\", \"❤\", \"暢\", \"喩\", \"嵐\", \"訟\", \"む\", \"醜\", \"夢\", \"訂\", \"頑\", \"´\", \"慣\", \"ェ\", \"ジ\", \"維\", \"凱\", \"脅\", \"論\", \"・\", \"誰\", \"幣\", \"ぁ\", \"綱\", \"Z\", \"騒\", \"<\", \"湯\", \"鎮\", \"頓\", \"頬\", \"汚\", \"窪\", \"マ\", \"✧\", \"騙\", \"べ\", \"欽\", \"だ\", \"ソ\", \"パ\", \"組\", \"俵\", \"魚\", \"決\", \"😢\", \"げ\", \"詰\", \"爾\", \"獄\", \"釣\", \"ァ\", \"謬\", \"讃\", \"橋\", \"跡\", \"M\", \"試\", \"孫\", \"う\", \"纏\", \"J\", \"掃\", \"😭\", \"彌\", \"銀\", \"僕\", \"為\", \"ほ\", \"呂\", \"V\", \"ご\", \"J\", \"テ\", \"淵\", \"ザ\", \"負\", \"術\", \"‼\", \"設\", \"隊\", \"餌\", \"ぴ\", \"ん\", \"樹\", \"剰\", \"風\", \"躍\", \"エ\", \"U\", \"幹\", \"巣\", \"講\", \"と\", \"軍\", \"1\", \"擁\", \"評\", \"ズ\", \"産\", \"補\", \"撲\", \"現\", \"Д\", \"|\", \"へ\", \"閉\", \"曽\", \"轢\", \"異\", \"較\", \"ハ\", \"換\", \"詫\", \"饉\", \"呟\", \"誤\", \"穏\", \"賠\", \"訓\", \"選\", \"E\", \"紗\", \"ノ\", \"鋭\", \"拝\", \"゙\", \"躾\", \"階\", \"憂\", \"フ\", \"輸\", \"Q\", \"謳\", \"け\", \"筈\", \"載\", \"ぜ\", \"つ\", \"懲\", \"-\", \"峠\", \"億\", \"6\", \"際\", \"の\", \"輝\", \"閣\", \"縮\", \"錯\", \"緯\", \"貶\", \"達\", \"佇\", \"F\", \"枠\", \"後\", \"s\", \"棄\", \"紀\", \"و\", \"窮\", \"み\"]",
"lossless": false
},
"eson/kplug-base-encoder @ cc100/ko": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1524839,
"_n_tokens": 202771,
"_n_chars": 655190,
"_n_oov_chars": 478807,
"oov_ratio": 0.7307910682397473,
"_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"접\", \"냄\", \"힘\", \"A\", \"눌\", \"藝\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"녀\", \"數\", \"택\", \"슴\", \"퀄\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"녜\", \"헌\", \"識\", \"숨\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"섹\", \"룩\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"첨\", \"웃\", \"💕\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"풋\", \"딛\", \"㎍\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"K\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"D\", \"합\", \"싼\", \"올\", \"폐\", \"띤\", \"닙\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"춧\", \"悧\", \"콤\", \"박\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"면\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"촌\", \"팽\", \"석\", \"쿄\", \"쌈\", \"굳\", \"갉\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"無\", \"샹\", \"\", \"🍔\", \"語\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"愛\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"®\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"앵\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"용\", \"륜\", \"쪄\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"%\", \"♣\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"룰\", \"즘\", \"익\", \"씀\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"動\", \"돔\", \"飾\", \"엌\", \"헉\", \"너\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"낙\", \"줏\", \"옌\", \"샴\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"쿨\", \"뜬\", \"고\", \"췌\", \"빗\", \"무\", \"배\", \"瀧\", \"브\", \"밧\", \"길\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"榮\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"쥔\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"跏\", \"🦄\", \"삭\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"ㅝ\", \"맥\", \"력\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"뜩\", \"렷\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"세\", \"뉜\", \"임\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"아\", \"휩\", \"훗\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"낫\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"J\", \"목\", \"뱅\", \"퀵\", \"쏜\", \"얻\", \"몫\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"경\", \"묘\", \"냉\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"陰\", \"왁\", \"힙\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"꽝\", \"➎\", \"맛\", \"滅\", \"韓\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"값\", \"짬\", \"뻐\", \"呪\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"쏘\", \"닥\", \"Ⅱ\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"빵\", \"題\", \"씽\", \"웹\", \"い\", \"훅\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"頭\", \"🔹\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"밑\", \"샀\", \"샵\", \"す\", \"렛\", \"훔\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"굵\", \"끈\", \"훑\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"師\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"톱\", \"ㅐ\", \"춥\", \"털\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"믐\", \"았\", \"귈\", \"듭\", \"베\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"혀\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"천\", \"짧\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"코\", \"뒀\", \"쒀\", \"상\", \"즌\", \"魯\", \"ㅘ\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"떼\", \"얼\", \"청\", \"씩\", \"앱\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"슷\", \"後\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"치\", \"핍\", \"칸\", \"잴\", \"꾀\", \"業\", \"둬\", \"여\", \"손\", \"長\", \"V\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"v\", \"雲\", \"쳐\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"벽\", \"기\", \"↕\", \"자\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"콜\", \"딤\", \"겁\", \"時\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"셀\", \"키\", \"갇\", \"し\", \"걍\", \"不\", \"멈\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"챨\", \"샘\", \"\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"駐\", \"최\", \"쨌\", \"몬\", \"찮\", \"龍\", \"슬\", \"쟁\", \"븐\", \"흗\", \"톤\", \"양\", \"G\", \"핫\", \"셔\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"밉\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"파\", \"밥\", \"멀\", \"폍\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"넓\", \"쉬\", \"먼\", \"變\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"희\", \"크\", \"제\", \"패\", \"할\", \"현\", \"전\", \"선\", \"㉣\", \"셉\", \"췄\", \"왘\", \"ㅡ\", \"쑥\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"낼\", \"ㅞ\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\"]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/ar": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 2813283,
"_n_tokens": 1557671,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/de": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1814876,
"_n_tokens": 683401,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/fa": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 2054052,
"_n_tokens": 1285426,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/ja": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1774770,
"_n_tokens": 600011,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"fnlp/moss-moon-003-sft @ cc100/ko": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1524839,
"_n_tokens": 1305249,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/ar": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 2813283,
"_n_tokens": 1212449,
"_n_chars": 1560987,
"_n_oov_chars": 16458,
"oov_ratio": 0.010543329316643892,
"_oov_charset": "[\"ﻷ\", \" \", \"ﷺ\", \"↩\", \"٪\", \"﴾\", \"\", \"٨\", \"٤\", \"ۖ\", \"ۚ\", \"ﻻ\", \"١\", \"٢\", \"٦\", \"😊\", \"😀\", \"۲\", \"ً\", \"ٍ\", \"ۤ\", \"▫\", \"ُ\", \"ؤ\", \"ﻹ\", \"ۗ\", \"\", \"
\", \"۷\", \"\", \"🙂\", \"\", \"٧\", \"▪\", \"٩\", \"‹\", \"؟\", \"ّ\", \"ـ\", \"٣\", \"ٌ\", \"۸\", \"﴿\", \"ٱ\", \"\", \"ٰ\", \"٥\", \"⤴\", \"�\", \"ْ\", \"›\", \"؛\", \"۰\", \"█\", \"٠\", \"ھ\", \"\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/de": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1814876,
"_n_tokens": 711022,
"_n_chars": 1784021,
"_n_oov_chars": 447,
"oov_ratio": 0.0002505575887279354,
"_oov_charset": "[\"😦\", \"↩\", \"\", \"\", \"☺\", \"😀\", \"\", \"Ã\", \"▼\", \"😢\", \"\", \"🙁\", \" \", \"😂\", \"̈\", \"😃\", \"™\", \"\", \"🙂\", \"❤\", \"\", \"‹\", \"😆\", \"\", \"😉\", \"�\", \"Ÿ\", \"‽\", \"›\", \"♡\", \"😈\", \"🙄\", \"¤\", \"➔\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/fa": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 2054052,
"_n_tokens": 883078,
"_n_chars": 1145876,
"_n_oov_chars": 14745,
"oov_ratio": 0.012867884483137791,
"_oov_charset": "[\" \", \"٪\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"٢\", \"۔\", \"۲\", \"ً\", \"ٍ\", \"ۆ\", \"۶\", \"۳\", \"\", \"ُ\", \"۹\", \"ؤ\", \"ڪ\", \"\", \"ٴ\", \"۷\", \"ژ\", \"\", \"❤\", \"٧\", \"✿\", \"٩\", \"ٔ\", \"؟\", \"ّ\", \"۱\", \"۸\", \"ـ\", \"ٌ\", \"٣\", \"ﮧ\", \"۴\", \"ۀ\", \"\", \"◄\", \"٥\", \"�\", \"۵\", \"ْ\", \"›\", \"؛\", \"۰\", \"٠\", \"ھ\", \"٫\", \"▐\", \"\", \"\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/ja": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1774770,
"_n_tokens": 390483,
"_n_chars": 603065,
"_n_oov_chars": 216189,
"oov_ratio": 0.3584837455332344,
"_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"曹\", \"開\", \"恰\", \"ぷ\", \"段\", \"捉\", \"送\", \"浩\", \"邸\", \"琢\", \"隆\", \"朝\", \"伊\", \"疾\", \"串\", \"笛\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"滲\", \"虐\", \"騰\", \"捐\", \"塵\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"倭\", \"表\", \"圃\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"汁\", \"塔\", \"鍋\", \"妻\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"爪\", \"媒\", \"猿\", \"変\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"競\", \"々\", \"群\", \"救\", \"覗\", \"羅\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"署\", \"塾\", \"募\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"ア\", \"号\", \"奔\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"綬\", \"端\", \"秤\", \"魂\", \"建\", \"輿\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"延\", \"飼\", \"模\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"空\", \"往\", \"票\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"崩\", \"覆\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"舟\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"精\", \"洋\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"糸\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"勿\", \"欣\", \"迦\", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"効\", \"応\", \"%\", \"習\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"恣\", \"碓\", \"梶\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"優\", \"ピ\", \"彷\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"粒\", \"張\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"冒\", \"措\", \"雄\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"注\", \"足\", \"繰\", \"凡\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"裏\", \"羽\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"贅\", \"科\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"ェ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"砂\", \"密\", \"闘\", \"✧\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"呂\", \"ほ\", \"V\", \"ご\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"落\", \"※\", \"使\", \"守\", \"漱\", \"泊\", \"編\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"末\", \"稼\", \"耳\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"需\", \"目\", \"没\", \"呑\", \"仮\", \"善\", \"闊\", \"肉\", \"D\", \"秀\", \"墓\", \"押\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"戒\", \"債\", \"磯\", \"匡\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"莫\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"短\", \"ぼ\", \"択\", \"届\", \"篇\", \"晋\", \"旋\", \"ポ\", \"=\", \"代\", \"誉\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"栃\", \"耗\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"併\", \"掲\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"h\", \"趨\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"区\", \"楚\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"望\", \"ロ\", \"紙\", \"尿\", \"庭\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"昧\", \"倉\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"帰\", \"g\", \"幽\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"幣\", \"徨\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"牛\", \"広\", \"化\", \"掃\", \"自\", \"父\", \"銀\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"設\", \"昨\", \"屈\", \"蹴\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"臆\", \"幅\", \"轢\", \"異\", \"八\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"憂\", \"伐\", \"炎\", \"迫\", \"筈\", \"寂\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"甲\", \"業\", \"謗\", \"拙\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"功\", \"岬\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"幕\", \"記\", \"航\", \"あ\", \"肌\", \"溢\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"旗\", \"苑\", \"聾\", \"観\", \"殊\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"舗\", \"淫\", \"暁\", \"ボ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"\", \"綻\", \"芸\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"擬\", \"媚\", \"非\", \"駅\", \"供\", \"霧\", \"癌\", \"居\", \"座\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"曰\", \"讐\", \"鱈\", \"寛\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"底\", \"墳\", \"鈍\", \"沖\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"餓\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"理\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"欽\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"雅\", \"評\", \"現\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]",
"lossless": false
},
"google-bert/bert-base-cased @ cc100/ko": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1524839,
"_n_tokens": 202828,
"_n_chars": 655190,
"_n_oov_chars": 435031,
"oov_ratio": 0.663976861673713,
"_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"그\", \"튼\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"뤄\", \"友\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"辰\", \"굳\", \"갉\", \"쌈\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"▲\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"먹\", \"%\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"雄\", \"릅\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"樺\", \"펠\", \"빠\", \"😱\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"守\", \"∙\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"典\", \"쿤\", \"治\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"⑧\", \"렛\", \"□\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"님\", \"客\", \"師\", \"臀\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"射\", \"떼\", \"얼\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"자\", \"色\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/ar": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 2813283,
"_n_tokens": 516389,
"_n_chars": 1560987,
"_n_oov_chars": 313181,
"oov_ratio": 0.2006301141521358,
"_oov_charset": "[\" \", \"ﷺ\", \"â\", \"L\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ί\", \"ذ\", \"ﻹ\", \"
\", \"۷\", \"٩\", \"۸\", \"٣\", \"à\", \"ى\", \"I\", \"U\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"V\", \"غ\", \"¡\", \"۰\", \"ء\", \"ط\", \"é\", \"،\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"چ\", \"ك\", \"ۗ\", \"Y\", \"½\", \"ٹ\", \"ظ\", \"\", \"🙂\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ö\", \"ٍ\", \"ُ\", \"“\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"ٱ\", \"\", \"ث\", \"”\", \"W\", \"ή\", \"ﻷ\", \"\", \"٨\", \"٤\", \"١\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"Q\", \"ؤ\", \"E\", \"ä\", \"\", \"—\", \"\", \"–\", \"ق\", \"﴿\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/de": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1814876,
"_n_tokens": 541246,
"_n_chars": 1784021,
"_n_oov_chars": 113119,
"oov_ratio": 0.06340676483068304,
"_oov_charset": "[\" \", \"â\", \"\", \"ó\", \"T\", \"‚\", \"\", \"Ã\", \"\", \" \", \"ί\", \"Á\", \"̈\", \"\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"¶\", \"œ\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"ï\", \"Y\", \"😃\", \"½\", \"🙂\", \"ư\", \"X\", \"´\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"‐\", \"ö\", \"😢\", \"ô\", \"“\", \"¬\", \"`\", \"M\", \"J\", \"û\", \"H\", \"š\", \"\", \"İ\", \"”\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"—\", \"\", \"ń\", \"😆\", \"–\", \"¿\", \"‘\", \"…\", \"’\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/fa": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 2054052,
"_n_tokens": 376414,
"_n_chars": 1145876,
"_n_oov_chars": 273120,
"oov_ratio": 0.23835039742520134,
"_oov_charset": "[\" \", \"T\", \"۲\", \"\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"۱\", \"۸\", \"٣\", \"I\", \"ى\", \"ۀ\", \"U\", \"گ\", \"◄\", \"پ\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"V\", \"غ\", \"۰\", \"ء\", \"ط\", \"،\", \"G\", \"٪\", \"A\", \"N\", \"چ\", \"ك\", \"۔\", \"ט\", \"ڪ\", \"Y\", \"ے\", \"ظ\", \"\", \"X\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"F\", \"\", \"ج\", \"P\", \"أ\", \"R\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"“\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"\", \"ث\", \"”\", \"۵\", \"W\", \"▐\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"Q\", \"۹\", \"ؤ\", \"E\", \"\", \"–\", \"ق\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"O\", \"ھ\", \"S\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/ja": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1774770,
"_n_tokens": 376831,
"_n_chars": 603065,
"_n_oov_chars": 53113,
"oov_ratio": 0.08807176672497989,
"_oov_charset": "[\" \", \"拠\", \"逡\", \"O\", \"Ⅹ\", \"ウ\", \"暦\", \"罠\", \"😊\", \"黙\", \"T\", \"ば\", \"⇔\", \"ハ\", \"M\", \"Z\", \"ぉ\", \"謡\", \"詈\", \"拶\", \"ぎ\", \"◡\", \"顕\", \"🌙\", \"バ\", \"テ\", \"̈\", \"訃\", \"C\", \"ギ\", \"L\", \"T\", \"ヴ\", \"︎\", \"〟\", \"ゎ\", \"噛\", \"😌\", \"ど\", \"斉\", \"ず\", \"艸\", \"I\", \"S\", \"ド\", \"プ\", \"U\", \"H\", \"陥\", \"渓\", \"縦\", \"R\", \"贋\", \"麹\", \"ィ\", \"屓\", \"揺\", \"痩\", \"ざ\", \"V\", \"〆\", \"暁\", \"㎞\", \"惣\", \"ボ\", \"纒\", \"ヘ\", \"W\", \"\", \"G\", \"讐\", \"A\", \"ぅ\", \"ブ\", \"N\", \"\", \"挿\", \"疎\", \"で\", \"犠\", \"捜\", \"ヾ\", \"懐\", \"̀\", \"掻\", \"韮\", \"Y\", \"Y\", \"E\", \"妬\", \"レ\", \"摂\", \"リ\", \"X\", \"覗\", \"A\", \"喩\", \"兎\", \"⑪\", \"P\", \"戯\", \"´\", \"B\", \"錬\", \"◯\", \"縞\", \"K\", \"ジ\", \"ぞ\", \"ゼ\", \"袴\", \"鞄\", \"ㅂ\", \"彡\", \"捗\", \"C\", \"匂\", \"ペ\", \"Ⅶ\", \"Z\", \"D\", \"騒\", \"桟\", \"メ\", \"瘻\", \"ベ\", \"汚\", \"頬\", \"ぷ\", \"F\", \"漑\", \"ゲ\", \"ぼ\", \"✧\", \"勲\", \"P\", \"べ\", \" \", \"―\", \"R\", \"醸\", \"だ\", \"蛍\", \"パ\", \"ぶ\", \"び\", \"俵\", \"‐\", \"😢\", \"▷\", \"げ\", \"ポ\", \"⻑\", \"“\", \"猟\", \"`\", \"讃\", \"M\", \"😭\", \"N\", \"ア\", \"ガ\", \"J\", \"゚\", \"∇\", \"V\", \"ご\", \"J\", \"澪\", \"ピ\", \"遡\", \"H\", \"が\", \"ぐ\", \"ザ\", \"奨\", \"‼\", \"ゾ\", \"カ\", \"ぴ\", \"I\", \"グ\", \"剰\", \"ヨ\", \"”\", \"噂\", \"U\", \"釈\", \"贔\", \"缶\", \"巣\", \"デ\", \"W\", \"Ⅱ\", \"壌\", \"辿\", \"💦\", \"藁\", \"舘\", \"ヵ\", \"廻\", \"ズ\", \"́\", \"囁\", \"渕\", \"繍\", \"Д\", \"曽\", \"轢\", \"\\u001b\", \"\", \"ダ\", \"砦\", \"饉\", \"呟\", \"粋\", \"穏\", \"K\", \"Q\", \"梱\", \"E\", \"娯\", \"ぱ\", \"—\", \"鋭\", \"飴\", \"゙\", \"ゥ\", \"躾\", \"鋲\", \"繰\", \"呑\", \"鉱\", \"賛\", \"ぽ\", \"拝\", \"ビ\", \"ゴ\", \"ロ\", \"じ\", \"Q\", \"鉢\", \"D\", \"謳\", \"–\", \"ぜ\", \"ゞ\", \"醤\", \"筈\", \"髭\", \"峠\", \"G\", \"渇\", \"蝋\", \"欝\", \"…\", \"’\", \"艶\", \"�\", \"酔\", \"鶏\", \"コ\", \"﨑\", \"F\", \"砕\", \"殻\", \"\\b\", \"X\", \"枠\", \"O\", \"繊\", \"B\", \"S\", \"づ\", \"簗\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-chinese @ cc100/ko": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1524839,
"_n_tokens": 199752,
"_n_chars": 655190,
"_n_oov_chars": 495564,
"oov_ratio": 0.7563668554159863,
"_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"접\", \"냄\", \"힘\", \"A\", \"눌\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"녀\", \"택\", \"슴\", \"퀄\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"뤄\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"섹\", \"룩\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"첨\", \"웃\", \"💕\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"풋\", \"딛\", \"㎍\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"K\", \"왓\", \"꿕\", \"헨\", \"옵\", \"팡\", \"D\", \"합\", \"싼\", \"올\", \"폐\", \"띤\", \"닙\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"테\", \"ㅎ\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"탓\", \"춧\", \"悧\", \"콤\", \"박\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"면\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"촌\", \"팽\", \"석\", \"쿄\", \"쌈\", \"굳\", \"갉\", \"킁\", \"넉\", \"잔\", \"더\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"럽\", \"롬\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"샹\", \"\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"쁜\", \"윙\", \"셋\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"탱\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"맡\", \"씬\", \"ㅛ\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"됐\", \"앙\", \"퍼\", \"“\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"봄\", \"뜰\", \"긋\", \"중\", \"묵\", \"컷\", \"펩\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"앵\", \"채\", \"찍\", \"럼\", \"뭐\", \"징\", \"마\", \"혔\", \"널\", \"릉\", \"걷\", \"톡\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"용\", \"륜\", \"쪄\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"룰\", \"즘\", \"익\", \"씀\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"돔\", \"엌\", \"헉\", \"너\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"끼\", \"롱\", \"죠\", \"낙\", \"줏\", \"옌\", \"샴\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"쿨\", \"뜬\", \"고\", \"췌\", \"빗\", \"무\", \"배\", \"브\", \"밧\", \"길\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"빕\", \"숍\", \"르\", \"갈\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"쿡\", \"철\", \"쥔\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"오\", \"저\", \"닭\", \"홑\", \"방\", \"높\", \"깥\", \"울\", \"슐\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"跏\", \"🦄\", \"삭\", \"탁\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"촉\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"픕\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"ㅝ\", \"맥\", \"력\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"뜩\", \"렷\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"세\", \"뉜\", \"임\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"아\", \"휩\", \"훗\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"체\", \"독\", \"작\", \"딪\", \"낫\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"랴\", \"쇼\", \"찢\", \"ㄹ\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"섣\", \"콥\", \"텅\", \"―\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"J\", \"목\", \"뱅\", \"퀵\", \"쏜\", \"얻\", \"몫\", \"”\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"경\", \"묘\", \"냉\", \"추\", \"햄\", \"🗺\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"눔\", \"짓\", \"떄\", \"왁\", \"힙\", \"뽀\", \"원\", \"뻔\", \"펠\", \"빠\", \"😱\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"얀\", \"찰\", \"탄\", \"따\", \"앉\", \"격\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"끊\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"꽝\", \"➎\", \"맛\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"값\", \"짬\", \"뻐\", \"呪\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"쏘\", \"닥\", \"Ⅱ\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"빵\", \"씽\", \"—\", \"웹\", \"훅\", \"끄\", \"넷\", \"‘\", \"벚\", \"펑\", \"’\", \"댓\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"쏠\", \"토\", \"픽\", \"좆\", \"🔹\", \"ㅇ\", \"똥\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"밑\", \"샀\", \"샵\", \"렛\", \"훔\", \"갛\", \"쩌\", \"ㄴ\", \"유\", \"숭\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"굵\", \"끈\", \"훑\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"뎀\", \"굽\", \"ã\", \"괜\", \"님\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"톱\", \"ㅐ\", \"춥\", \"털\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"금\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"믐\", \"았\", \"귈\", \"듭\", \"베\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"–\", \"킵\", \"짤\", \"챌\", \"권\", \"색\", \"찾\", \"션\", \"혀\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"천\", \"짧\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"♧\", \"문\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"코\", \"뒀\", \"쒀\", \"상\", \"즌\", \"ㅘ\", \"닳\", \"척\", \"낱\", \"랑\", \"떼\", \"얼\", \"청\", \"씩\", \"앱\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"팎\", \"슷\", \"쩍\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"카\", \"혹\", \"치\", \"핍\", \"칸\", \"잴\", \"꾀\", \"둬\", \"여\", \"손\", \"V\", \"인\", \"픈\", \"앤\", \"ㅅ\", \"횟\", \"쁠\", \"앓\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"쳐\", \"업\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"벽\", \"기\", \"↕\", \"자\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"참\", \"섭\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"땠\", \"칵\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"콜\", \"딤\", \"겁\", \"숱\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"가\", \"셀\", \"키\", \"갇\", \"걍\", \"不\", \"멈\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"챨\", \"샘\", \"\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"최\", \"쨌\", \"몬\", \"찮\", \"龍\", \"슬\", \"쟁\", \"븐\", \"흗\", \"톤\", \"양\", \"G\", \"핫\", \"셔\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"밉\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"범\", \"절\", \"낀\", \"볕\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"파\", \"밥\", \"멀\", \"폍\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"넓\", \"쉬\", \"먼\", \"붙\", \"쟤\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"희\", \"크\", \"제\", \"패\", \"할\", \"현\", \"전\", \"선\", \"㉣\", \"셉\", \"췄\", \"왘\", \"ㅡ\", \"쑥\", \"❍\", \"릭\", \"켓\", \"요\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"낼\", \"ㅞ\", \"딸\", \"압\", \"죤\", \"덧\", \"모\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/ar": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 2813283,
"_n_tokens": 310312,
"_n_chars": 1560987,
"_n_oov_chars": 1361552,
"oov_ratio": 0.87223788538918,
"_oov_charset": "[\" \", \"α\", \"â\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"à\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"é\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"«\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"»\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"“\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"\", \"η\", \"″\", \"ث\", \"”\", \"ρ\", \"©\", \"ή\", \"ﻷ\", \"•\", \"ل\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"®\", \"ص\", \"ؤ\", \"\", \"—\", \"م\", \"\", \"ر\", \"ا\", \"س\", \"–\", \"ق\", \"﴿\", \"ه\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"█\", \"ھ\", \"و\", \"\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/de": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1814876,
"_n_tokens": 384241,
"_n_chars": 1784021,
"_n_oov_chars": 3522,
"oov_ratio": 0.0019741920078295045,
"_oov_charset": "[\"α\", \"â\", \"\", \"ó\", \"‚\", \"→\", \"\", \"Ã\", \"▼\", \"\", \" \", \"ί\", \"Á\", \"̈\", \"™\", \"¼\", \"\", \"‹\", \"à\", \"å\", \"á\", \"ς\", \"É\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"é\", \"ç\", \"😀\", \"♥\", \"🙁\", \"«\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"»\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"„\", \"ô\", \"“\", \"¬\", \"★\", \"£\", \"û\", \"−\", \"š\", \"\", \"İ\", \"ø\", \"”\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"ρ\", \"è\", \"➔\", \"©\", \"😦\", \"•\", \"ß\", \"ι\", \"\", \"q\", \"☺\", \"č\", \"—\", \"°\", \"\", \"ń\", \"😆\", \"–\", \"♦\", \"¿\", \"‘\", \"…\", \"’\", \"�\", \"²\", \"🙄\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/fa": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 2054052,
"_n_tokens": 254518,
"_n_chars": 1145876,
"_n_oov_chars": 1029578,
"oov_ratio": 0.8985073428538516,
"_oov_charset": "[\" \", \"۲\", \"ع\", \"\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"«\", \"ڪ\", \"ے\", \"ظ\", \"\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"»\", \"٫\", \"\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"“\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"\", \"ث\", \"”\", \"۵\", \"▐\", \"©\", \"•\", \"ل\", \"️\", \"\", \"٨\", \"٤\", \"q\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"\", \"م\", \"ر\", \"ا\", \"س\", \"–\", \"ق\", \"ه\", \"‘\", \"…\", \"�\", \"’\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/ja": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1774770,
"_n_tokens": 318073,
"_n_chars": 603065,
"_n_oov_chars": 586458,
"oov_ratio": 0.972462338222248,
"_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"林\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"夫\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"事\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"シ\", \"曹\", \"開\", \"恰\", \"ぷ\", \"心\", \"段\", \"捉\", \"れ\", \"送\", \"浩\", \"邸\", \"琢\", \"力\", \"隆\", \"朝\", \"伊\", \"た\", \"疾\", \"串\", \"笛\", \"星\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"北\", \"虐\", \"騰\", \"捐\", \"塵\", \"滲\", \"和\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"©\", \"•\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"〜\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"尚\", \"倭\", \"表\", \"圃\", \"→\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"道\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"に\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"史\", \"ゆ\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \",\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"★\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"陽\", \"汁\", \"塔\", \"鍋\", \"妻\", \"″\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"同\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"版\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"年\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"正\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"木\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"村\", \"爪\", \"媒\", \"猿\", \"変\", \"公\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"李\", \"城\", \"競\", \"々\", \"群\", \"ナ\", \"救\", \"覗\", \"羅\", \"東\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"て\", \"署\", \"塾\", \"募\", \"タ\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"子\", \"号\", \"愛\", \"奔\", \"ア\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"三\", \"秤\", \"魂\", \"建\", \"輿\", \"ウ\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"®\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"ら\", \"延\", \"飼\", \"模\", \"お\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"レ\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"⇒\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"真\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"食\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"井\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"口\", \"空\", \"往\", \"票\", \"・\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"マ\", \"覆\", \"崩\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"安\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"“\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"テ\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"q\", \"洋\", \"精\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"-\", \"糸\", \"の\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"光\", \"勿\", \"欣\", \"迦\", \"み\", \"社\", \" \", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"宿\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"ま\", \"文\", \"効\", \"応\", \"%\", \"習\", \"こ\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"ひ\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"な\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"青\", \"恣\", \"碓\", \"梶\", \"水\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \":\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"ニ\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"え\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"国\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"西\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"や\", \"‐\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"フ\", \"ピ\", \"彷\", \"優\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"》\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"方\", \"張\", \"粒\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \")\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"は\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"松\", \"冒\", \"措\", \"雄\", \"國\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"、\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"田\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"»\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"太\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"宮\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"キ\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"凡\", \"注\", \"足\", \"繰\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"州\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"ー\", \"羽\", \"裏\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"門\", \"科\", \"贅\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"吉\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"■\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"´\", \"ェ\", \"ジ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"谷\", \"砂\", \"密\", \"闘\", \"✧\", \"―\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"神\", \"呂\", \"ほ\", \"V\", \"ご\", \"山\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"”\", \"薄\", \"率\", \"稲\", \"U\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"京\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"女\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"け\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"カ\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"金\", \"落\", \"※\", \"使\", \"書\", \"守\", \"漱\", \"●\", \"泊\", \"編\", \"龍\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"ブ\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"«\", \"勢\", \"石\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"←\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"氏\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"美\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"稼\", \"末\", \"耳\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"—\", \"滓\", \"5\", \"盆\", \"い\", \"目\", \"没\", \"呑\", \"仮\", \"需\", \"善\", \"闊\", \"肉\", \"D\", \"省\", \"秀\", \"押\", \"墓\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"ω\", \"’\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"武\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"本\", \"戒\", \"バ\", \"債\", \"磯\", \"』\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"匡\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"十\", \"莫\", \"『\", \"日\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"す\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"高\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"ち\", \"短\", \"ぼ\", \"択\", \"届\", \"μ\", \"篇\", \"藤\", \"大\", \"晋\", \"旋\", \"ポ\", \"土\", \"代\", \"士\", \"=\", \"誉\", \"め\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"月\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"ュ\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"ン\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"天\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"×\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"野\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"オ\", \"趨\", \"h\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"「\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"二\", \"区\", \"楚\", \"ア\", \"ト\", \"る\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"¥\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"犬\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"花\", \"望\", \"紙\", \"尿\", \"庭\", \"ロ\", \"母\", \"線\", \"–\", \"遇\", \"漠\", \"離\", \"貿\", \"河\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"馬\", \"倉\", \"昧\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"☆\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"中\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"原\", \"帰\", \"g\", \"幽\", \"車\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"も\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"ム\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"↑\", \"幣\", \"徨\", \"下\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"人\", \"《\", \"郎\", \"牛\", \"広\", \"化\", \"掃\", \"う\", \"自\", \"父\", \"銀\", \"王\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"部\", \"−\", \"設\", \"─\", \"昨\", \"ん\", \"屈\", \"蹴\", \"海\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"八\", \"ハ\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"戸\", \"憂\", \"佐\", \"炎\", \"伐\", \"迫\", \"筈\", \"寂\", \"つ\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"و\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"イ\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"サ\", \"業\", \"甲\", \"拙\", \"謗\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"長\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"よ\", \"功\", \"岬\", \"上\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"。\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"白\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"新\", \"記\", \"幕\", \"航\", \"あ\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"そ\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"皇\", \"ル\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"く\", \"旗\", \"り\", \"苑\", \"聾\", \"観\", \"殊\", \"(\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"β\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"ッ\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"コ\", \"郡\", \"舗\", \"淫\", \"暁\", \"ボ\", \"ミ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"一\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"せ\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"仁\", \"\", \"/\", \"綻\", \"芸\", \"ス\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"し\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"川\", \"擬\", \"媚\", \"義\", \"非\", \"駅\", \"供\", \"霧\", \"南\", \"癌\", \"ャ\", \"座\", \"居\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"き\", \"曰\", \"讐\", \"ク\", \"鱈\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"寛\", \"底\", \"墳\", \"鈍\", \"沖\", \"さ\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"島\", \"ε\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"ラ\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"平\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"か\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"侍\", \"餓\", \"リ\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"江\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"生\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"ロ\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"」\", \"理\", \"!\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"司\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"む\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"竹\", \"欽\", \"明\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"エ\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"と\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"小\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"…\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]",
"lossless": false
},
"google-bert/bert-base-german-cased @ cc100/ko": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1524839,
"_n_tokens": 203846,
"_n_chars": 655190,
"_n_oov_chars": 490211,
"oov_ratio": 0.7481967062989362,
"_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"林\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"事\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"心\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"星\", \"友\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"北\", \"和\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"•\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"→\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"道\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"史\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"·\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"★\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"¹\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"同\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"年\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"正\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"公\", \"굳\", \"辰\", \"갉\", \"쌈\", \"劍\", \"킁\", \"넉\", \"잔\", \"더\", \"▲\", \"城\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"子\", \"愛\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"三\", \"윙\", \"셋\", \"鮮\", \"엄\", \"®\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"²\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"⇒\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"食\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"口\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"安\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"“\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"光\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"社\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"文\", \"먹\", \"%\", \"♣\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"水\", \"씨\", \"없\", \"컵\", \":\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"》\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"方\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"雄\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"»\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"■\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"谷\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"―\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"神\", \"£\", \"山\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"”\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"京\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"女\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"⋅\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"金\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"守\", \"∙\", \"얀\", \"●\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"典\", \"쿤\", \"治\", \"ç\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"←\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"美\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"—\", \"웹\", \"°\", \"い\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"‘\", \"ω\", \"벚\", \"펑\", \"’\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"武\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"』\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"十\", \"『\", \"日\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"±\", \"한\", \"놔\", \"′\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"す\", \"⑧\", \"렛\", \"□\", \"高\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"μ\", \"맞\", \"大\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"土\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"月\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"α\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"天\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"×\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"野\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"「\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"犬\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"–\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"☆\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"中\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"原\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"↑\", \"간\", \"下\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"人\", \"《\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"王\", \"척\", \"낱\", \"랑\", \"射\", \"部\", \"떼\", \"얼\", \"海\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"長\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"上\", \"국\", \"쌀\", \"샬\", \"≤\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"。\", \"자\", \"色\", \"白\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"新\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"皇\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"一\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"뇌\", \"득\", \"투\", \"㈜\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"仁\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"し\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"\", \"각\", \"갓\", \"川\", \"랭\", \"옥\", \"엮\", \"펴\", \"南\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"平\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"江\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"生\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"」\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"竹\", \"明\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/ar": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 2813283,
"_n_tokens": 627501,
"_n_chars": 1560987,
"_n_oov_chars": 1800,
"oov_ratio": 0.0011531165858524126,
"_oov_charset": "[\"ﻷ\", \"↩\", \"\", \"٨\", \"ۖ\", \"ۚ\", \"ﻻ\", \"😀\", \"😊\", \"٦\", \"ۤ\", \"▫\", \"“\", \"ﻹ\", \"ۗ\", \"\", \"—\", \"
\", \"\", \"🙂\", \"\", \"٧\", \"–\", \"ٱ\", \"\", \"‘\", \"⤴\", \"”\", \"…\", \"�\", \"’\", \"\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/de": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1814876,
"_n_tokens": 445764,
"_n_chars": 1784021,
"_n_oov_chars": 2205,
"oov_ratio": 0.0012359719980874664,
"_oov_charset": "[\"😦\", \"↩\", \"\", \"\", \"☺\", \"😀\", \"‐\", \"\", \"😢\", \"\", \"🙁\", \" \", \"😂\", \"“\", \"`\", \"̈\", \"😃\", \"—\", \"\", \"🙂\", \"❤\", \"\", \"😆\", \"–\", \"\", \"´\", \"😉\", \"‘\", \"”\", \"…\", \"’\", \"�\", \"Ÿ\", \"‽\", \"😈\", \"🙄\", \"¤\", \"➔\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/fa": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 2054052,
"_n_tokens": 400799,
"_n_chars": 1145876,
"_n_oov_chars": 8034,
"oov_ratio": 0.007011229836387183,
"_oov_charset": "[\"️\", \"\", \"٨\", \"\", \"“\", \"ڪ\", \"\", \"ٴ\", \"\", \"❤\", \"٧\", \"–\", \"ﮧ\", \"\", \"◄\", \"‘\", \"”\", \"…\", \"�\", \"’\", \"▐\", \"✿\", \"\", \"\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/ja": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1774770,
"_n_tokens": 469446,
"_n_chars": 603065,
"_n_oov_chars": 2029,
"oov_ratio": 0.0033644797824446786,
"_oov_charset": "[\"¥\", \"逡\", \"O\", \"a\", \"Ⅹ\", \"ウ\", \"😊\", \"ハ\", \"Z\", \"ぉ\", \"d\", \"詈\", \"🌙\", \"テ\", \"̈\", \"L\", \"T\", \"〟\", \"ゎ\", \"😌\", \"艸\", \"g\", \"H\", \"R\", \"ィ\", \"`\", \"屓\", \"i\", \"〆\", \"^\", \"纒\", \"㎞\", \"ヽ\", \"ヘ\", \"⑩\", \"W\", \"t\", \"\", \"ぅ\", \"\", \"o\", \"ヾ\", \"丿\", \"Y\", \"E\", \"レ\", \"❤\", \"リ\", \"頷\", \" ̄\", \"P\", \"⑪\", \"e\", \"⑧\", \"´\", \"◯\", \"ㅂ\", \"Ⅶ\", \"ー\", \"メ\", \"m\", \"瘻\", \"h\", \"嚥\", \"✧\", \"$\", \" \", \"―\", \"▽\", \"‐\", \"😢\", \"▷\", \"⻑\", \"“\", \"`\", \"y\", \"😭\", \"ア\", \"N\", \"゚\", \"b\", \"V\", \"J\", \"噤\", \"‼\", \"✨\", \"カ\", \"r\", \"I\", \"ヨ\", \"”\", \"U\", \"贔\", \"k\", \"💦\", \"゙\", \"\\u001b\", \"\", \"K\", \"w\", \"—\", \"ノ\", \"゙\", \"ゥ\", \"躾\", \"鋲\", \"彡\", \"n\", \"ロ\", \"︎\", \"フ\", \"Q\", \"D\", \"–\", \"G\", \"欝\", \"…\", \"’\", \"�\", \"♫\", \"コ\", \"l\", \"F\", \"゚\", \"\\b\", \"s\", \"⌒\", \"f\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-cased @ cc100/ko": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1524839,
"_n_tokens": 427953,
"_n_chars": 655190,
"_n_oov_chars": 5121,
"oov_ratio": 0.007816053358567743,
"_oov_charset": "[\" \", \"ᴇ\", \"떄\", \"낚\", \"왁\", \"뵙\", \"💡\", \"듐\", \"뽀\", \"金\", \"롸\", \"璣\", \"🤭\", \"쎄\", \"❏\", \"욜\", \"쪄\", \"😱\", \"ⅰ\", \"잴\", \"💰\", \"쏭\", \"⑨\", \"✔\", \"둬\", \"솥\", \"짚\", \"㎞\", \"ㅅ\", \"쁠\", \"깅\", \"v\", \"꿍\", \"퍙\", \"팰\", \"꽉\", \"궈\", \"퀄\", \"숟\", \"㉰\", \"퓰\", \"➊\", \"웍\", \"꽝\", \"➎\", \"㎥\", \"ⅲ\", \"섦\", \"튄\", \"🤗\", \"ᴡ\", \"잼\", \"뵐\", \"뺏\", \"짢\", \"🥁\", \"👏\", \"똘\", \"Ⅷ\", \"↕\", \"◐\", \"ㅓ\", \"✈\", \"쌩\", \"☞\", \"`\", \"ㅢ\", \"폄\", \"볶\", \"짬\", \"삣\", \"뭘\", \"流\", \"뺑\", \"뮐\", \"쫀\", \"⑸\", \"귤\", \"즙\", \"쿰\", \"쪼\", \"눴\", \"💦\", \"엌\", \"쫒\", \"밌\", \"헉\", \"뺐\", \"띈\", \"녜\", \"ㅔ\", \"ᴀ\", \"ㅑ\", \"識\", \"뛸\", \"샷\", \"▒\", \"씽\", \"—\", \"퍽\", \"🍕\", \"쩐\", \"훅\", \"잤\", \"Ⅸ\", \"걔\", \"\", \"\", \"👨\", \"맬\", \"얍\", \"ㅆ\", \"‘\", \"믄\", \"�\", \"’\", \"찼\", \"꽁\", \"쩡\", \"뜯\", \"\", \"⚀\", \"ㅕ\", \"🙆\", \"꺄\", \"뱉\", \"줏\", \"앰\", \"숏\", \"샴\", \"💕\", \"썹\", \"봅\", \"🍟\", \"꿰\", \"◈\", \"렜\", \"땠\", \"읊\", \"빡\", \"칵\", \"핏\", \"빳\", \"🚨\", \"뱃\", \"◦\", \"띕\", \"🍰\", \"∮\", \"💌\", \"쏠\", \"숯\", \"딛\", \"좆\", \"㎍\", \"🔹\", \"ㅇ\", \"똥\", \"갭\", \"덥\", \"욥\", \"딤\", \"😂\", \"쌉\", \"➋\", \"놔\", \"밧\", \"헛\", \"◑\", \"쓕\", \"껑\", \"쭙\", \"땀\", \"샵\", \"휙\", \"ㅗ\", \"⑧\", \"💣\", \"숱\", \"꿕\", \"㎡\", \"ᴏ\", \"Ⅶ\", \"갛\", \"켤\", \"👍\", \"ㄴ\", \"뿍\", \"⑥\", \"닙\", \"긁\", \"卽\", \"▷\", \"팹\", \"ㄱ\", \"ㅣ\", \"🌿\", \"봬\", \"굶\", \"㈜\", \"💸\", \"🍎\", \"🚿\", \"훑\", \"쬐\", \"촘\", \"綃\", \"빕\", \"뿜\", \"ㅋ\", \"빤\", \"💥\", \"칫\", \"됬\", \"땐\", \"ㅎ\", \"️\", \"\", \"◾\", \"씹\", \"츈\", \"끽\", \"Ⅴ\", \"놨\", \"⑹\", \"춧\", \"悧\", \"➍\", \"\", \"ⅱ\", \"︎\", \"ᴄ\", \"쫗\", \"쥔\", \"걍\", \"不\", \"😗\", \"뎀\", \"⑴\", \"쳇\", \"쵸\", \"Ⅹ\", \"툭\", \"큽\", \"뮈\", \"🍭\", \"홑\", \"챨\", \"\", \"ㅁ\", \"良\", \"🙋\", \"🏻\", \"튿\", \"뗀\", \"쨍\", \"⑦\", \"⑶\", \"ㅐ\", \"춥\", \"낍\", \"쨌\", \"ㅜ\", \"댔\", \"꺽\", \"삐\", \"龍\", \"릅\", \"跏\", \"🦄\", \"흗\", \"☀\", \"▶\", \"틔\", \"끙\", \"🤔\", \"팥\", \"갉\", \"쉼\", \"쌈\", \"킁\", \"🏫\", \"넉\", \"뜹\", \"㏊\", \"쐬\", \"ㅍ\", \"짊\", \"깡\", \"累\", \"쾨\", \"🤟\", \"흠\", \"셌\", \"틋\", \"믐\", \"픕\", \"귈\", \"ⓒ\", \"ⓔ\", \"넹\", \"눕\", \"\", \"🍔\", \"텨\", \"잖\", \"삘\", \"㉠\", \"ʏ\", \"뜸\", \"ㅝ\", \"㉿\", \"ㅟ\", \"떴\", \"뀔\", \"ʟ\", \" \", \"🤕\", \"짖\", \"女\", \"텁\", \"뾱\", \"理\", \"떳\", \"쏙\", \"냅\", \"樂\", \"立\", \"웁\", \"껀\", \"팠\", \"뜩\", \"밉\", \"잣\", \"썸\", \"\", \"ㅖ\", \"🌳\", \"흄\", \"솨\", \"🦅\", \"힉\", \"썅\", \"樂\", \"땡\", \"왠\", \"볕\", \"엎\", \"梁\", \"댁\", \"Ⅵ\", \"얏\", \"냠\", \"챗\", \"쾅\", \"💅\", \"ㅚ\", \"飮\", \"–\", \"맙\", \"킵\", \"짤\", \"녘\", \"뭥\", \"씻\", \"폿\", \"➏\", \"ⅳ\", \"폈\", \"폍\", \"😣\", \"😊\", \"둡\", \"ᴍ\", \"쉘\", \"맴\", \"잰\", \"➌\", \"뛴\", \"탰\", \"쟤\", \"ㅈ\", \"앎\", \"킌\", \"趺\", \"〮\", \"훠\", \"🏷\", \"뎅\", \"궜\", \"쿵\", \"퀀\", \"▣\", \"🌵\", \"깽\", \"젓\", \"ᴛ\", \"벙\", \"ㅒ\", \"♧\", \"㉣\", \"췄\", \"꽂\", \"왘\", \"🙌\", \"◀\", \"ㅡ\", \"뺀\", \"쑥\", \"힜\", \"❍\", \"엡\", \"넵\", \"❤\", \"찢\", \"뽐\", \"ㄹ\", \"쫄\", \"ㅙ\", \"됩\", \"캇\", \"뻑\", \"좇\", \"◼\", \"ㅛ\", \"쉰\", \"🙇\", \"\", \"쎈\", \"靈\", \"섣\", \"텅\", \"쭈\", \"―\", \"찜\", \"쒀\", \"꿇\", \"슝\", \"⑵\", \"쐐\", \"“\", \"ㄷ\", \"ㅏ\", \"😭\", \"ㅘ\", \"닳\", \"돠\", \"켐\", \"뜰\", \"쫑\", \"펩\", \"핥\", \"줍\", \"퀵\", \"”\", \"ㅞ\", \"빴\", \"👋\", \"뻤\", \"짠\", \"♤\", \"ㅠ\", \"죤\", \"뼘\", \"陸\", \"웖\", \"짭\", \"푹\", \"ㅊ\", \"팁\", \"켠\", \"☎\", \"🗺\", \"⬇\", \"…\", \"팎\", \"🍞\", \"槪\", \"s\", \"쩍\", \"눔\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/ar": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 2813283,
"_n_tokens": 586110,
"_n_chars": 1560987,
"_n_oov_chars": 71436,
"oov_ratio": 0.045763353570529415,
"_oov_charset": "[\"â\", \"L\", \"ﻻ\", \"😊\", \"T\", \"ί\", \"ﻹ\", \"
\", \"à\", \"I\", \"U\", \"⤴\", \"V\", \"é\", \"G\", \"A\", \"ۚ\", \"😀\", \"N\", \"ۗ\", \"Y\", \"\", \"🙂\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"F\", \"↩\", \"ۖ\", \"P\", \"أ\", \"R\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"“\", \"M\", \"J\", \"ِ\", \"Х\", \"H\", \"ٱ\", \"\", \"”\", \"W\", \"ή\", \"ﻷ\", \"\", \"ً\", \"ۤ\", \"Q\", \"ؤ\", \"E\", \"ä\", \"\", \"—\", \"\", \"–\", \"‘\", \"…\", \"�\", \"’\", \"O\", \"S\", \"\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/de": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1814876,
"_n_tokens": 425738,
"_n_chars": 1784021,
"_n_oov_chars": 112869,
"oov_ratio": 0.06326663195108129,
"_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"\", \"Ã\", \"\", \" \", \"ί\", \"Á\", \"̈\", \"\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"🙂\", \"❤\", \"X\", \"ư\", \"´\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"‐\", \"ö\", \"😢\", \"ô\", \"“\", \"`\", \"M\", \"J\", \"û\", \"H\", \"š\", \"\", \"İ\", \"”\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"—\", \"\", \"ń\", \"😆\", \"–\", \"‘\", \"…\", \"’\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/fa": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 2054052,
"_n_tokens": 398911,
"_n_chars": 1145876,
"_n_oov_chars": 18375,
"oov_ratio": 0.01603576652273021,
"_oov_charset": "[\"G\", \"A\", \"️\", \"\", \"P\", \"أ\", \"N\", \"R\", \"T\", \"ً\", \"ٍ\", \"\", \"ُ\", \"Q\", \"“\", \"E\", \"ؤ\", \"ڪ\", \"Y\", \"\", \"M\", \"J\", \"\", \"❤\", \"X\", \"ِ\", \"✿\", \"ٔ\", \"آ\", \"ّ\", \"H\", \"\", \"ٌ\", \"–\", \"I\", \"ۀ\", \"B\", \"\", \"إ\", \"U\", \"K\", \"ּ\", \"◄\", \"َ\", \"‘\", \"ئ\", \"”\", \"…\", \"�\", \"C\", \"’\", \"\", \"ْ\", \"W\", \"D\", \"V\", \"Z\", \"O\", \"S\", \"▐\", \"F\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/ja": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1774770,
"_n_tokens": 466785,
"_n_chars": 603065,
"_n_oov_chars": 52508,
"oov_ratio": 0.08706855811562601,
"_oov_charset": "[\"O\", \"Ⅹ\", \"ウ\", \"😊\", \"ハ\", \"T\", \"ば\", \"M\", \"Z\", \"ぎ\", \"🌙\", \"バ\", \"テ\", \"๑\", \"̈\", \"C\", \"ギ\", \"L\", \"T\", \"ヴ\", \"ゎ\", \"😌\", \"ど\", \"ず\", \"I\", \"S\", \"ド\", \"プ\", \"U\", \"H\", \"R\", \"ィ\", \"`\", \"ざ\", \"V\", \"^\", \"纒\", \"ボ\", \"ヽ\", \"⑩\", \"ヘ\", \"W\", \"\", \"G\", \"A\", \"ブ\", \"N\", \"\", \"で\", \"ヾ\", \"̀\", \"丿\", \"Y\", \"Y\", \"E\", \"レ\", \"❤\", \"X\", \"リ\", \"A\", \" ̄\", \"P\", \"⑪\", \"´\", \"B\", \"K\", \"ジ\", \"ぞ\", \"ゼ\", \"Ⅶ\", \"C\", \"ペ\", \"Z\", \"D\", \"メ\", \"瘻\", \"ベ\", \"F\", \"ぷ\", \"ゲ\", \"ぼ\", \"✧\", \"P\", \"$\", \"べ\", \" \", \"―\", \"R\", \"だ\", \"‐\", \"パ\", \"ぶ\", \"び\", \"😢\", \"▷\", \"げ\", \"ポ\", \"⻑\", \"“\", \"`\", \"y\", \"M\", \"😭\", \"N\", \"ア\", \"ガ\", \"J\", \"゚\", \"V\", \"ご\", \"J\", \"ピ\", \"H\", \"が\", \"ぐ\", \"ザ\", \"✨\", \"ゾ\", \"カ\", \"ぴ\", \"I\", \"グ\", \"ヨ\", \"”\", \"U\", \"デ\", \"W\", \"Ⅱ\", \"💦\", \"゙\", \"ズ\", \"́\", \"Д\", \"\\u001b\", \"\", \"ダ\", \"K\", \"Q\", \"E\", \"ぱ\", \"—\", \"ノ\", \"゙\", \"ゥ\", \"ぽ\", \"ロ\", \"ビ\", \"ゴ\", \"︎\", \"じ\", \"Q\", \"フ\", \"D\", \"–\", \"ゞ\", \"ぜ\", \"G\", \"欝\", \"…\", \"’\", \"�\", \"♫\", \"コ\", \"F\", \"゚\", \"X\", \"\\b\", \"O\", \"⌒\", \"B\", \"S\", \"づ\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/ko": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1524839,
"_n_tokens": 538172,
"_n_chars": 655190,
"_n_oov_chars": 440964,
"oov_ratio": 0.6730322501869687,
"_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"접\", \"냄\", \"힘\", \"A\", \"눌\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"녀\", \"택\", \"슴\", \"퀄\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"섹\", \"룩\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"첨\", \"웃\", \"💕\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"풋\", \"딛\", \"㎍\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"😂\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"K\", \"왓\", \"꿕\", \"헨\", \"👍\", \"옵\", \"팡\", \"D\", \"합\", \"싼\", \"올\", \"폐\", \"띤\", \"닙\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"테\", \"ㅎ\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"탓\", \"춧\", \"콤\", \"박\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"면\", \"⑶\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"촌\", \"팽\", \"석\", \"쿄\", \"쌈\", \"굳\", \"갉\", \"킁\", \"넉\", \"잔\", \"더\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"럽\", \"롬\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"샹\", \"\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"쁜\", \"윙\", \"셋\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"탱\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"맡\", \"씬\", \"ㅛ\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"됐\", \"앙\", \"퍼\", \"“\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"봄\", \"뜰\", \"긋\", \"중\", \"묵\", \"컷\", \"펩\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"앵\", \"채\", \"찍\", \"럼\", \"뭐\", \"징\", \"마\", \"혔\", \"널\", \"릉\", \"걷\", \"톡\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \"므\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"용\", \"륜\", \"쪄\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"룰\", \"즘\", \"익\", \"씀\", \"⑸\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"돔\", \"엌\", \"헉\", \"너\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"끼\", \"롱\", \"죠\", \"낙\", \"줏\", \"옌\", \"샴\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"깃\", \"💌\", \"쿨\", \"뜬\", \"고\", \"췌\", \"빗\", \"무\", \"배\", \"브\", \"밧\", \"길\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"빕\", \"숍\", \"르\", \"갈\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"쿡\", \"철\", \"쥔\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"오\", \"저\", \"닭\", \"홑\", \"방\", \"높\", \"깥\", \"울\", \"슐\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"🦄\", \"삭\", \"☀\", \"탁\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"촉\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"픕\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"ㅝ\", \"맥\", \"력\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"뜩\", \"렷\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"세\", \"뉜\", \"임\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"아\", \"휩\", \"훗\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"째\", \"체\", \"독\", \"작\", \"딪\", \"낫\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"랴\", \"쇼\", \"찢\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"섣\", \"콥\", \"텅\", \"―\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"J\", \"목\", \"뱅\", \"퀵\", \"쏜\", \"얻\", \"몫\", \"”\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"경\", \"묘\", \"냉\", \"추\", \"햄\", \"🗺\", \"을\", \"책\", \"럭\", \"숲\", \"눔\", \"짓\", \"떄\", \"왁\", \"힙\", \"뽀\", \"원\", \"뻔\", \"펠\", \"빠\", \"😱\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"끊\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"꽝\", \"➎\", \"맛\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"값\", \"짬\", \"뻐\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"쏘\", \"닥\", \"Ⅱ\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"빵\", \"씽\", \"—\", \"웹\", \"훅\", \"끄\", \"넷\", \"‘\", \"벚\", \"펑\", \"’\", \"댓\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"쏠\", \"토\", \"픽\", \"좆\", \"🔹\", \"똥\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"밑\", \"샀\", \"샵\", \"렛\", \"훔\", \"갛\", \"쩌\", \"유\", \"숭\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"셸\", \"별\", \"햇\", \"굵\", \"끈\", \"훑\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"뎀\", \"굽\", \"ã\", \"괜\", \"님\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"톱\", \"ㅐ\", \"춥\", \"털\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"금\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"–\", \"킵\", \"짤\", \"챌\", \"권\", \"색\", \"찾\", \"션\", \"혀\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"천\", \"짧\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"♧\", \"문\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"코\", \"뒀\", \"쒀\", \"상\", \"즌\", \"ㅘ\", \"닳\", \"척\", \"낱\", \"랑\", \"떼\", \"얼\", \"청\", \"씩\", \"앱\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"팎\", \"슷\", \"쩍\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"퉁\", \"대\", \"롸\", \"벤\", \"언\", \"🤭\", \"카\", \"혹\", \"치\", \"핍\", \"칸\", \"잴\", \"꾀\", \"⑨\", \"둬\", \"여\", \"손\", \"V\", \"인\", \"픈\", \"앤\", \"횟\", \"쁠\", \"앓\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"쳐\", \"업\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"벽\", \"기\", \"↕\", \"자\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"찼\", \"조\", \"O\", \"쩡\", \"참\", \"섭\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"땠\", \"칵\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"콜\", \"딤\", \"겁\", \"숱\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"가\", \"셀\", \"키\", \"갇\", \"걍\", \"不\", \"⑴\", \"멈\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"챨\", \"샘\", \"\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"최\", \"쨌\", \"몬\", \"찮\", \"龍\", \"슬\", \"쟁\", \"븐\", \"흗\", \"톤\", \"양\", \"G\", \"핫\", \"셔\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"밉\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"범\", \"절\", \"낀\", \"볕\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"파\", \"밥\", \"멀\", \"폍\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"넓\", \"쉬\", \"먼\", \"붙\", \"쟤\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"희\", \"크\", \"제\", \"패\", \"할\", \"현\", \"전\", \"선\", \"㉣\", \"셉\", \"췄\", \"왘\", \"쑥\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"M\", \"칩\", \"켐\", \"빔\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"낼\", \"ㅞ\", \"딸\", \"압\", \"죤\", \"덧\", \"모\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/ar": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2813283,
"_n_tokens": 1249370,
"_n_chars": 1560987,
"_n_oov_chars": 71615,
"oov_ratio": 0.04587802460878918,
"_oov_charset": "[\"ﷺ\", \"â\", \"L\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ί\", \"ﻹ\", \"
\", \"۷\", \"٩\", \"‹\", \"۸\", \"٣\", \"à\", \"I\", \"U\", \"٥\", \"⤴\", \"V\", \"۰\", \"é\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"ۗ\", \"Y\", \"\", \"🙂\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"ٱ\", \"\", \"W\", \"ή\", \"ﻷ\", \"\", \"٨\", \"٤\", \"١\", \"ً\", \"ۤ\", \"Q\", \"ؤ\", \"E\", \"ä\", \"\", \"\", \"﴿\", \"�\", \"؛\", \"█\", \"O\", \"S\", \"\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/de": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1814876,
"_n_tokens": 626485,
"_n_chars": 1784021,
"_n_oov_chars": 110979,
"oov_ratio": 0.062207227381292036,
"_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"\", \"Ã\", \"▼\", \"\", \" \", \"ί\", \"Á\", \"̈\", \"\", \"‹\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"♡\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"🙂\", \"❤\", \"X\", \"ư\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"ö\", \"😢\", \"ô\", \"M\", \"J\", \"û\", \"H\", \"š\", \"\", \"İ\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"\", \"ń\", \"😆\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/fa": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2054052,
"_n_tokens": 890783,
"_n_chars": 1145876,
"_n_oov_chars": 23791,
"oov_ratio": 0.020762281433593165,
"_oov_charset": "[\" \", \"T\", \"۲\", \"\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"۱\", \"۸\", \"٣\", \"I\", \"ۀ\", \"U\", \"◄\", \"٥\", \"V\", \"۰\", \"✿\", \"G\", \"٪\", \"A\", \"N\", \"۔\", \"ڪ\", \"Y\", \"\", \"❤\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"\", \"F\", \"P\", \"أ\", \"R\", \"٢\", \"ٍ\", \"ۆ\", \"ُ\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"\", \"۵\", \"W\", \"▐\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"ً\", \"۶\", \"۳\", \"Q\", \"۹\", \"ؤ\", \"E\", \"\", \"�\", \"؛\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/ja": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1774770,
"_n_tokens": 560634,
"_n_chars": 603065,
"_n_oov_chars": 169388,
"oov_ratio": 0.2808785122665053,
"_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"暴\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"循\", \"喚\", \"惨\", \"U\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"草\", \"憶\", \"截\", \"侶\", \"A\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"護\", \"点\", \"眠\", \"鎌\", \"狭\", \"腫\", \"ゼ\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"曹\", \"開\", \"恰\", \"ぷ\", \"段\", \"捉\", \"送\", \"浩\", \"邸\", \"琢\", \"隆\", \"疾\", \"串\", \"笛\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"滲\", \"虐\", \"騰\", \"捐\", \"塵\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"珍\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"L\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"倭\", \"表\", \"圃\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"可\", \"杉\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"冷\", \"強\", \"壇\", \"祠\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"泣\", \"候\", \"米\", \"勤\", \"K\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"D\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \"必\", \"蛍\", \"材\", \"跨\", \"胞\", \"潜\", \"猟\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"汁\", \"塔\", \"鍋\", \"妻\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"楓\", \"妊\", \"徳\", \"悔\", \"抱\", \"剃\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"亀\", \"促\", \"膚\", \"Z\", \"嘘\", \"脳\", \"卑\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"嗅\", \"役\", \"0\", \"稚\", \"臨\", \"奮\", \"羊\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"収\", \"略\", \"爪\", \"斬\", \"媒\", \"猿\", \"変\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"競\", \"々\", \"群\", \"救\", \"覗\", \"羅\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"飢\", \"腺\", \"F\", \"漑\", \"署\", \"塾\", \"募\", \"」\", \"掬\", \"律\", \"床\", \"狩\", \"ア\", \"号\", \"奔\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"秤\", \"魂\", \"建\", \"輿\", \"駆\", \"[\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"延\", \"飼\", \"模\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"特\", \"貰\", \"払\", \"放\", \"T\", \"叉\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"レ\", \"懸\", \"X\", \"睡\", \"喩\", \"嵐\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"往\", \"票\", \"団\", \"涅\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"崩\", \"覆\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"紫\", \"豚\", \"釣\", \"謬\", \"孫\", \"悪\", \"試\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"精\", \"洋\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"糸\", \"輝\", \"校\", \"等\", \"達\", \"勿\", \"欣\", \"迦\", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"赤\", \"努\", \"効\", \"応\", \"I\", \"%\", \"習\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"躇\", \"誇\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"頂\", \"B\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"恣\", \"碓\", \"梶\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \"棟\", \"退\", \"叫\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"礼\", \"賀\", \"揄\", \"膜\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"屋\", \"関\", \"優\", \"ピ\", \"彷\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"親\", \"翔\", \"垣\", \"痢\", \"粒\", \"絡\", \"乱\", \"紛\", \"揉\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"寄\", \"鹿\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"冒\", \"措\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"拘\", \"幡\", \"P\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"範\", \"斡\", \"噂\", \"様\", \"景\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"施\", \"惧\", \"痺\", \"巨\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"注\", \"足\", \"繰\", \"凡\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"磋\", \"椒\", \"慈\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"裏\", \"羽\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"贅\", \"科\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"ジ\", \"脅\", \"ぁ\", \"Z\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"砂\", \"密\", \"闘\", \"✧\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"J\", \"呂\", \"V\", \"ご\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"映\", \"補\", \"婿\", \"工\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"幼\", \"繋\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"落\", \"※\", \"使\", \"守\", \"漱\", \"泊\", \"編\", \"遊\", \"尊\", \"典\", \"W\", \"ブ\", \"N\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"膝\", \"捗\", \"批\", \"滅\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"H\", \"響\", \"己\", \"敏\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"末\", \"稼\", \"\\u001b\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"需\", \"没\", \"善\", \"呑\", \"闊\", \"肉\", \"D\", \"墓\", \"押\", \"蝋\", \"揃\", \"壮\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"戒\", \"バ\", \"債\", \"磯\", \"匡\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"配\", \"付\", \"纒\", \"袈\", \"莫\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"Y\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"短\", \"ぼ\", \"択\", \"届\", \"篇\", \"晋\", \"旋\", \"ポ\", \"=\", \"誉\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"W\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"順\", \"匠\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"懇\", \"午\", \"e\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"h\", \"趨\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"楚\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"体\", \"解\", \"【\", \"勘\", \"雇\", \"訴\", \"吸\", \"身\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"望\", \"ロ\", \"紙\", \"尿\", \"庭\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"昧\", \"倉\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"暖\", \"序\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"帰\", \"g\", \"幽\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"敷\", \"丈\", \"堵\", \"弓\", \"逢\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"幣\", \"徨\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"牛\", \"化\", \"広\", \"掃\", \"自\", \"父\", \"銀\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"設\", \"昨\", \"屈\", \"蹴\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"憂\", \"伐\", \"炎\", \"迫\", \"筈\", \"寂\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"改\", \"塞\", \"狐\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"甲\", \"業\", \"謗\", \"拙\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"V\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"功\", \"岬\", \"丹\", \"ぞ\", \"経\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"険\", \"色\", \"姉\", \"傷\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"幕\", \"記\", \"航\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"贈\", \"ユ\", \"稜\", \"全\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"旗\", \"歳\", \"苑\", \"聾\", \"観\", \"殊\", \"Q\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"冨\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"O\", \"B\", \"糞\", \"暗\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"墜\", \"簡\", \"彿\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"舗\", \"淫\", \"暁\", \"ボ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"極\", \"棚\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"\", \"綻\", \"芸\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"コ\", \"「\", \"冬\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"S\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"警\", \"凶\", \"能\", \"_\", \"更\", \"姑\", \"怠\", \"擬\", \"媚\", \"非\", \"駅\", \"供\", \"霧\", \"癌\", \"居\", \"座\", \"篤\", \"推\", \"駐\", \"穫\", \"宜\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"曰\", \"G\", \"讐\", \"鱈\", \"寛\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"底\", \"墳\", \"鈍\", \"沖\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"尺\", \"職\", \"烹\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"蔑\", \"C\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"遍\", \"$\", \"髪\", \" \", \"R\", \"縄\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"沈\", \"任\", \"壌\", \"馳\", \"ヵ\", \"督\", \"燥\", \"餓\", \"簿\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"理\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"晴\", \"頬\", \"汚\", \"揶\", \"起\", \"番\", \"洒\", \"欽\", \"累\", \"破\", \"讃\", \"M\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"楼\", \"始\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"E\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]",
"lossless": false
},
"google-bert/bert-base-uncased @ cc100/ko": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1524839,
"_n_tokens": 884756,
"_n_chars": 655190,
"_n_oov_chars": 439583,
"oov_ratio": 0.6709244646591065,
"_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"A\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"友\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"可\", \"💕\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"K\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"D\", \"합\", \"싼\", \"述\", \"올\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"辰\", \"굳\", \"갉\", \"쌈\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"▲\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"%\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"⑸\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"J\", \"목\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"樺\", \"펠\", \"빠\", \"😱\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"守\", \"∙\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"典\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"쏠\", \"토\", \"픽\", \"좆\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"⑧\", \"렛\", \"□\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"邦\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"至\", \"상\", \"즌\", \"魯\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"射\", \"떼\", \"얼\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"V\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"자\", \"色\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"居\", \"駐\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"G\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/ar": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2813283,
"_n_tokens": 558855,
"_n_chars": 1560987,
"_n_oov_chars": 1249848,
"oov_ratio": 0.8006780325524813,
"_oov_charset": "[\"α\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"~\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"}\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ھ\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"\", \"η\", \"″\", \"ث\", \"{\", \"ρ\", \"\\\\\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"ؤ\", \"\", \"م\", \"\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"…\", \"�\", \"^\", \"ف\", \"؛\", \"█\", \"<\", \"و\", \"\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/de": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1814876,
"_n_tokens": 470254,
"_n_chars": 1784021,
"_n_oov_chars": 2034,
"oov_ratio": 0.001140121108439867,
"_oov_charset": "[\"α\", \"\", \"‚\", \"→\", \"\", \"Ã\", \"▼\", \" \", \"ί\", \"Á\", \"̈\", \"~\", \"™\", \"¼\", \"\", \"‹\", \"å\", \"ς\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"}\", \"😀\", \"♥\", \"🙁\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"¬\", \"`\", \"★\", \"−\", \"š\", \"\", \"İ\", \"ø\", \"{\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"Ä\", \"ρ\", \"\\\\\", \"➔\", \"©\", \"😦\", \"ι\", \"\", \"☺\", \"č\", \"\", \"§\", \"ń\", \"😆\", \"♦\", \"¿\", \"�\", \"…\", \"^\", \"Ö\", \"²\", \"🙄\", \"<\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/fa": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2054052,
"_n_tokens": 483767,
"_n_chars": 1145876,
"_n_oov_chars": 898637,
"oov_ratio": 0.7842358160917935,
"_oov_charset": "[\" \", \"۲\", \"ع\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"}\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"ے\", \"ظ\", \"\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"٫\", \"\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"\", \"ث\", \"{\", \"۵\", \"▐\", \"\\\\\", \"©\", \"ل\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"<\", \"…\", \"�\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/ja": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1774770,
"_n_tokens": 41947,
"_n_chars": 603065,
"_n_oov_chars": 585967,
"oov_ratio": 0.9716481639624253,
"_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"林\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"夫\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"事\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"シ\", \"曹\", \"開\", \"恰\", \"ぷ\", \"心\", \"段\", \"捉\", \"れ\", \"送\", \"浩\", \"邸\", \"琢\", \"力\", \"隆\", \"朝\", \"伊\", \"た\", \"疾\", \"串\", \"笛\", \"星\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"北\", \"虐\", \"騰\", \"捐\", \"塵\", \"滲\", \"和\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"©\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"〜\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"<\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"尚\", \"倭\", \"表\", \"圃\", \"→\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"道\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"に\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"史\", \"ゆ\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \",\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"★\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"陽\", \"汁\", \"塔\", \"鍋\", \"妻\", \"″\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"同\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"版\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"年\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"正\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"木\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"村\", \"爪\", \"媒\", \"猿\", \"変\", \"公\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"李\", \"城\", \"競\", \"々\", \"群\", \"ナ\", \"救\", \"覗\", \"羅\", \"東\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"て\", \"署\", \"塾\", \"募\", \"タ\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"子\", \"号\", \"愛\", \"奔\", \"ア\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"三\", \"秤\", \"魂\", \"建\", \"輿\", \"ウ\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"ら\", \"延\", \"飼\", \"模\", \"お\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"レ\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"⇒\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"真\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"食\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"井\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"口\", \"空\", \"往\", \"票\", \"・\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"マ\", \"覆\", \"崩\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"安\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"テ\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"洋\", \"精\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"-\", \"糸\", \"の\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"光\", \"勿\", \"欣\", \"迦\", \"み\", \"社\", \" \", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"宿\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"ま\", \"文\", \"効\", \"応\", \"%\", \"習\", \"こ\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"ひ\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"な\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"青\", \"恣\", \"碓\", \"梶\", \"水\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \":\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"ニ\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"え\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"国\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"西\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"や\", \"‐\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"フ\", \"ピ\", \"彷\", \"優\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"》\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"方\", \"張\", \"粒\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \")\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"は\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"~\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"松\", \"冒\", \"措\", \"雄\", \"國\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"、\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"田\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"太\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"宮\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"キ\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"凡\", \"注\", \"足\", \"繰\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"州\", \"判\", \"酔\", \"杜\", \"悟\", \"^\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"ー\", \"羽\", \"裏\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"門\", \"科\", \"贅\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"吉\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"■\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"´\", \"ェ\", \"ジ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"谷\", \"砂\", \"密\", \"闘\", \"✧\", \"―\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"神\", \"呂\", \"ほ\", \"V\", \"ご\", \"山\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"京\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"女\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"け\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"カ\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"金\", \"落\", \"※\", \"使\", \"書\", \"守\", \"漱\", \"●\", \"泊\", \"編\", \"龍\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"ブ\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"石\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"←\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"氏\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"美\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"稼\", \"末\", \"耳\", \"\\\\\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"い\", \"目\", \"没\", \"呑\", \"仮\", \"需\", \"善\", \"闊\", \"肉\", \"D\", \"省\", \"秀\", \"押\", \"墓\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"ω\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"武\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"本\", \"戒\", \"バ\", \"債\", \"磯\", \"』\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"匡\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"十\", \"莫\", \"『\", \"日\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"す\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"高\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"ち\", \"短\", \"ぼ\", \"択\", \"届\", \"μ\", \"篇\", \"藤\", \"大\", \"晋\", \"旋\", \"ポ\", \"土\", \"代\", \"士\", \"=\", \"誉\", \"め\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"月\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"ュ\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"ン\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"天\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"×\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"野\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"オ\", \"趨\", \"h\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"「\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"二\", \"区\", \"楚\", \"ア\", \"ト\", \"る\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"¥\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"犬\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"花\", \"望\", \"紙\", \"尿\", \"庭\", \"ロ\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"河\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"馬\", \"倉\", \"昧\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"☆\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"中\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"原\", \"帰\", \"g\", \"幽\", \"車\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"も\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"ム\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"↑\", \"幣\", \"徨\", \"下\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"人\", \"《\", \"郎\", \"牛\", \"広\", \"化\", \"掃\", \"う\", \"自\", \"父\", \"銀\", \"王\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"部\", \"−\", \"設\", \"─\", \"昨\", \"ん\", \"屈\", \"蹴\", \"海\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"八\", \"ハ\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"戸\", \"憂\", \"佐\", \"炎\", \"伐\", \"迫\", \"筈\", \"寂\", \"つ\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"و\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"イ\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"サ\", \"業\", \"甲\", \"拙\", \"謗\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"長\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"よ\", \"功\", \"岬\", \"上\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"。\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"白\", \"細\", \"囲\", \"`\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"新\", \"記\", \"幕\", \"航\", \"あ\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"そ\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"皇\", \"ル\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"く\", \"旗\", \"り\", \"苑\", \"聾\", \"観\", \"殊\", \"(\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"β\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"ッ\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"コ\", \"郡\", \"舗\", \"淫\", \"暁\", \"ボ\", \"ミ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"一\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"せ\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"仁\", \"\", \"/\", \"綻\", \"芸\", \"ス\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"し\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"川\", \"擬\", \"媚\", \"義\", \"非\", \"駅\", \"供\", \"霧\", \"南\", \"癌\", \"ャ\", \"座\", \"居\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"き\", \"曰\", \"讐\", \"ク\", \"鱈\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"寛\", \"底\", \"墳\", \"鈍\", \"沖\", \"さ\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"島\", \"ε\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"ラ\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"平\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"か\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"侍\", \"餓\", \"リ\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"江\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"生\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"ロ\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"」\", \"理\", \"!\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"司\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"む\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"竹\", \"欽\", \"明\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"エ\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"と\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"小\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"…\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]",
"lossless": false
},
"google-t5/t5-large @ cc100/ko": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1524839,
"_n_tokens": 334457,
"_n_chars": 655190,
"_n_oov_chars": 433242,
"oov_ratio": 0.6612463560188647,
"_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"林\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"事\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"心\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"星\", \"友\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"北\", \"和\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"<\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"→\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"道\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"史\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"·\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"★\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"¹\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"同\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"年\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"正\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"公\", \"굳\", \"辰\", \"갉\", \"쌈\", \"劍\", \"킁\", \"넉\", \"잔\", \"더\", \"▲\", \"城\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"子\", \"愛\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"三\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"²\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"⇒\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"食\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"口\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"安\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"光\", \"삶\", \"농\", \"쏟\", \"빼\", \"므\", \" \", \"社\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"文\", \"먹\", \"%\", \"♣\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"水\", \"씨\", \"없\", \"컵\", \":\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"》\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"方\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"~\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"雄\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"^\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"■\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"谷\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"―\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"神\", \"山\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"京\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"女\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"⋅\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"金\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"守\", \"∙\", \"얀\", \"●\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"}\", \"典\", \"쿤\", \"治\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"←\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"美\", \"Ⅱ\", \"投\", \"奉\", \"\\\\\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"い\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"ω\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"武\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"』\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"十\", \"『\", \"日\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"±\", \"한\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"す\", \"⑧\", \"렛\", \"□\", \"高\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"μ\", \"맞\", \"大\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"土\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"{\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"月\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"α\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"天\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"×\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"野\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"「\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"犬\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"☆\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"中\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"原\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"↑\", \"간\", \"下\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"人\", \"《\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"王\", \"척\", \"낱\", \"랑\", \"射\", \"部\", \"떼\", \"얼\", \"海\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"§\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"長\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"上\", \"국\", \"쌀\", \"샬\", \"≤\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"。\", \"자\", \"色\", \"白\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"新\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"皇\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"一\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"뇌\", \"득\", \"투\", \"㈜\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"仁\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"し\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"각\", \"갓\", \"川\", \"랭\", \"옥\", \"엮\", \"펴\", \"南\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"平\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"江\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"生\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"」\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"竹\", \"明\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]",
"lossless": false
},
"google/byt5-small @ cc100/ar": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 2813283,
"_n_tokens": 2813283,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/de": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1814876,
"_n_tokens": 1814876,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/fa": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 2054052,
"_n_tokens": 2054052,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/ja": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1774770,
"_n_tokens": 1774770,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/byt5-small @ cc100/ko": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1524839,
"_n_tokens": 1524839,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/gemma-7b @ cc100/ar": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2813283,
"_n_tokens": 563788,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/de": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1814876,
"_n_tokens": 406876,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/fa": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2054052,
"_n_tokens": 363762,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/ja": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1774770,
"_n_tokens": 307873,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-7b @ cc100/ko": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1524839,
"_n_tokens": 454410,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/mobilebert-uncased @ cc100/ar": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2813283,
"_n_tokens": 1249370,
"_n_chars": 1560987,
"_n_oov_chars": 71615,
"oov_ratio": 0.04587802460878918,
"_oov_charset": "[\"ﷺ\", \"â\", \"L\", \"ﻻ\", \"😊\", \"٦\", \"T\", \"۲\", \"ί\", \"ﻹ\", \"
\", \"۷\", \"٩\", \"‹\", \"۸\", \"٣\", \"à\", \"I\", \"U\", \"٥\", \"⤴\", \"V\", \"۰\", \"é\", \"G\", \"٪\", \"A\", \"ۚ\", \"😀\", \"N\", \"ۗ\", \"Y\", \"\", \"🙂\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"إ\", \"B\", \"K\", \"ٰ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"F\", \"↩\", \"﴾\", \"ۖ\", \"P\", \"أ\", \"R\", \"٢\", \"ö\", \"ٍ\", \"▫\", \"ُ\", \"M\", \"J\", \"ِ\", \"٧\", \"؟\", \"Х\", \"H\", \"ٱ\", \"\", \"W\", \"ή\", \"ﻷ\", \"\", \"٨\", \"٤\", \"١\", \"ً\", \"ۤ\", \"Q\", \"ؤ\", \"E\", \"ä\", \"\", \"\", \"﴿\", \"�\", \"؛\", \"█\", \"O\", \"S\", \"\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/de": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1814876,
"_n_tokens": 626485,
"_n_chars": 1784021,
"_n_oov_chars": 110979,
"oov_ratio": 0.062207227381292036,
"_oov_charset": "[\"â\", \"\", \"ó\", \"T\", \"\", \"Ã\", \"▼\", \"\", \" \", \"ί\", \"Á\", \"̈\", \"\", \"‹\", \"à\", \"I\", \"å\", \"á\", \"U\", \"É\", \"♡\", \"V\", \"ú\", \"≠\", \"ā\", \"ớ\", \"é\", \"G\", \"A\", \"ç\", \"😀\", \"N\", \"Ü\", \"🙁\", \"😂\", \"ï\", \"Y\", \"😃\", \"🙂\", \"❤\", \"X\", \"ư\", \"B\", \"K\", \"😉\", \"Ø\", \"C\", \"Z\", \"D\", \"😈\", \"F\", \"↩\", \"ć\", \"P\", \"R\", \"ö\", \"😢\", \"ô\", \"M\", \"J\", \"û\", \"H\", \"š\", \"\", \"İ\", \"ė\", \"Ÿ\", \"‽\", \"W\", \"Ä\", \"è\", \"➔\", \"😦\", \"\", \"☺\", \"ü\", \"č\", \"Q\", \"ä\", \"E\", \"\", \"ń\", \"😆\", \"�\", \"Ö\", \"🙄\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/fa": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2054052,
"_n_tokens": 890783,
"_n_chars": 1145876,
"_n_oov_chars": 23791,
"oov_ratio": 0.020762281433593165,
"_oov_charset": "[\" \", \"T\", \"۲\", \"\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"۱\", \"۸\", \"٣\", \"I\", \"ۀ\", \"U\", \"◄\", \"٥\", \"V\", \"۰\", \"✿\", \"G\", \"٪\", \"A\", \"N\", \"۔\", \"ڪ\", \"Y\", \"\", \"❤\", \"X\", \"آ\", \"ّ\", \"ٌ\", \"ﮧ\", \"۴\", \"B\", \"إ\", \"K\", \"ּ\", \"َ\", \"ئ\", \"C\", \"ْ\", \"Z\", \"D\", \"٠\", \"٫\", \"\", \"F\", \"P\", \"أ\", \"R\", \"٢\", \"ٍ\", \"ۆ\", \"ُ\", \"M\", \"ٴ\", \"J\", \"ِ\", \"٧\", \"؟\", \"H\", \"\", \"\", \"۵\", \"W\", \"▐\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"ً\", \"۶\", \"۳\", \"Q\", \"۹\", \"ؤ\", \"E\", \"\", \"�\", \"؛\", \"O\", \"S\", \"L\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/ja": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1774770,
"_n_tokens": 560634,
"_n_chars": 603065,
"_n_oov_chars": 169388,
"oov_ratio": 0.2808785122665053,
"_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"暴\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"循\", \"喚\", \"惨\", \"U\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"草\", \"憶\", \"截\", \"侶\", \"A\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"護\", \"点\", \"眠\", \"鎌\", \"狭\", \"腫\", \"ゼ\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"曹\", \"開\", \"恰\", \"ぷ\", \"段\", \"捉\", \"送\", \"浩\", \"邸\", \"琢\", \"隆\", \"疾\", \"串\", \"笛\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"滲\", \"虐\", \"騰\", \"捐\", \"塵\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"珍\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"陸\", \"亜\", \"f\", \"L\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"倭\", \"表\", \"圃\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"可\", \"杉\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"冷\", \"強\", \"壇\", \"祠\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"泣\", \"候\", \"米\", \"勤\", \"K\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"D\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \"必\", \"蛍\", \"材\", \"跨\", \"胞\", \"潜\", \"猟\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"汁\", \"塔\", \"鍋\", \"妻\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"楓\", \"妊\", \"徳\", \"悔\", \"抱\", \"剃\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"亀\", \"促\", \"膚\", \"Z\", \"嘘\", \"脳\", \"卑\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"嗅\", \"役\", \"0\", \"稚\", \"臨\", \"奮\", \"羊\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"収\", \"略\", \"爪\", \"斬\", \"媒\", \"猿\", \"変\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"競\", \"々\", \"群\", \"救\", \"覗\", \"羅\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"飢\", \"腺\", \"F\", \"漑\", \"署\", \"塾\", \"募\", \"」\", \"掬\", \"律\", \"床\", \"狩\", \"ア\", \"号\", \"奔\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"秤\", \"魂\", \"建\", \"輿\", \"駆\", \"[\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"延\", \"飼\", \"模\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"特\", \"貰\", \"払\", \"放\", \"T\", \"叉\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"レ\", \"懸\", \"X\", \"睡\", \"喩\", \"嵐\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"往\", \"票\", \"団\", \"涅\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"崩\", \"覆\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"紫\", \"豚\", \"釣\", \"謬\", \"孫\", \"悪\", \"試\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"精\", \"洋\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"糸\", \"輝\", \"校\", \"等\", \"達\", \"勿\", \"欣\", \"迦\", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"赤\", \"努\", \"効\", \"応\", \"I\", \"%\", \"習\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"躇\", \"誇\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"頂\", \"B\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"恣\", \"碓\", \"梶\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \"棟\", \"退\", \"叫\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"礼\", \"賀\", \"揄\", \"膜\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"屋\", \"関\", \"優\", \"ピ\", \"彷\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"親\", \"翔\", \"垣\", \"痢\", \"粒\", \"絡\", \"乱\", \"紛\", \"揉\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"寄\", \"鹿\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"冒\", \"措\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"拘\", \"幡\", \"P\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"範\", \"斡\", \"噂\", \"様\", \"景\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"施\", \"惧\", \"痺\", \"巨\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"注\", \"足\", \"繰\", \"凡\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"磋\", \"椒\", \"慈\", \"判\", \"酔\", \"杜\", \"悟\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"裏\", \"羽\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"贅\", \"科\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"ジ\", \"脅\", \"ぁ\", \"Z\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"砂\", \"密\", \"闘\", \"✧\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"J\", \"呂\", \"V\", \"ご\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"映\", \"補\", \"婿\", \"工\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"幼\", \"繋\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"落\", \"※\", \"使\", \"守\", \"漱\", \"泊\", \"編\", \"遊\", \"尊\", \"典\", \"W\", \"ブ\", \"N\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"膝\", \"捗\", \"批\", \"滅\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"H\", \"響\", \"己\", \"敏\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"末\", \"稼\", \"\\u001b\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"需\", \"没\", \"善\", \"呑\", \"闊\", \"肉\", \"D\", \"墓\", \"押\", \"蝋\", \"揃\", \"壮\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"戒\", \"バ\", \"債\", \"磯\", \"匡\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"配\", \"付\", \"纒\", \"袈\", \"莫\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"Y\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"短\", \"ぼ\", \"択\", \"届\", \"篇\", \"晋\", \"旋\", \"ポ\", \"=\", \"誉\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"W\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"順\", \"匠\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"懇\", \"午\", \"e\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"h\", \"趨\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"楚\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"体\", \"解\", \"【\", \"勘\", \"雇\", \"訴\", \"吸\", \"身\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"望\", \"ロ\", \"紙\", \"尿\", \"庭\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"昧\", \"倉\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"暖\", \"序\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"帰\", \"g\", \"幽\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"敷\", \"丈\", \"堵\", \"弓\", \"逢\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"幣\", \"徨\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"牛\", \"化\", \"広\", \"掃\", \"自\", \"父\", \"銀\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"設\", \"昨\", \"屈\", \"蹴\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"憂\", \"伐\", \"炎\", \"迫\", \"筈\", \"寂\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"改\", \"塞\", \"狐\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"甲\", \"業\", \"謗\", \"拙\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"V\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"功\", \"岬\", \"丹\", \"ぞ\", \"経\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"険\", \"色\", \"姉\", \"傷\", \"細\", \"囲\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"幕\", \"記\", \"航\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"贈\", \"ユ\", \"稜\", \"全\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"旗\", \"歳\", \"苑\", \"聾\", \"観\", \"殊\", \"Q\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"冨\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"O\", \"B\", \"糞\", \"暗\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"墜\", \"簡\", \"彿\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"舗\", \"淫\", \"暁\", \"ボ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"極\", \"棚\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"\", \"綻\", \"芸\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"コ\", \"「\", \"冬\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"S\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"警\", \"凶\", \"能\", \"_\", \"更\", \"姑\", \"怠\", \"擬\", \"媚\", \"非\", \"駅\", \"供\", \"霧\", \"癌\", \"居\", \"座\", \"篤\", \"推\", \"駐\", \"穫\", \"宜\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"曰\", \"G\", \"讐\", \"鱈\", \"寛\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"底\", \"墳\", \"鈍\", \"沖\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"尺\", \"職\", \"烹\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"蔑\", \"C\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"遍\", \"$\", \"髪\", \" \", \"R\", \"縄\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"沈\", \"任\", \"壌\", \"馳\", \"ヵ\", \"督\", \"燥\", \"餓\", \"簿\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"理\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"晴\", \"頬\", \"汚\", \"揶\", \"起\", \"番\", \"洒\", \"欽\", \"累\", \"破\", \"讃\", \"M\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"楼\", \"始\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"E\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]",
"lossless": false
},
"google/mobilebert-uncased @ cc100/ko": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1524839,
"_n_tokens": 884756,
"_n_chars": 655190,
"_n_oov_chars": 439583,
"oov_ratio": 0.6709244646591065,
"_oov_charset": "[\"교\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"차\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"쏭\", \"딴\", \"U\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"A\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"켜\", \"◐\", \"ㅓ\", \"✈\", \"뤄\", \"友\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"몽\", \"L\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"可\", \"💕\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"K\", \"왓\", \"꿕\", \"歲\", \"헨\", \"👍\", \"옵\", \"팡\", \"詠\", \"D\", \"합\", \"싼\", \"述\", \"올\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"콩\", \"리\", \"⑹\", \"說\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"날\", \"입\", \"못\", \"났\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"🙋\", \"튿\", \"끔\", \"適\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"辰\", \"굳\", \"갉\", \"쌈\", \"킁\", \"劍\", \"넉\", \"잔\", \"더\", \"▲\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"\", \"🍔\", \"㉠\", \"존\", \"F\", \"생\", \"은\", \"훨\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"T\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"렁\", \"X\", \"롤\", \"꼭\", \"꿨\", \"디\", \"實\", \"맡\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"삶\", \"농\", \"쏟\", \"빼\", \" \", \"므\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"덩\", \"왼\", \"먹\", \"I\", \"%\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"B\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"씨\", \"없\", \"컵\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"⑸\", \"닐\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"샐\", \"같\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"릅\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"P\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"🦅\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"덮\", \"좇\", \"밭\", \"Z\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"J\", \"목\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"흡\", \"놈\", \"퀴\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"樺\", \"펠\", \"빠\", \"😱\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"守\", \"∙\", \"얀\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"격\", \"典\", \"쿤\", \"ç\", \"곁\", \"워\", \"N\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"H\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"Ⅱ\", \"投\", \"奉\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"ᴀ\", \"든\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"쏠\", \"토\", \"픽\", \"좆\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"한\", \"Y\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"⑧\", \"렛\", \"□\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"맞\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"W\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"객\", \"덕\", \"邦\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"간\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"至\", \"상\", \"즌\", \"魯\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"척\", \"낱\", \"랑\", \"射\", \"떼\", \"얼\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"V\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"국\", \"쌀\", \"샬\", \"뚜\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"자\", \"色\", \"쌩\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"쫒\", \"밌\", \"건\", \"콕\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"불\", \"품\", \"찌\", \"Q\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"O\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"득\", \"㈜\", \"투\", \"뇌\", \"賣\", \"쇠\", \"🍎\", \"클\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"S\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"\", \"각\", \"갓\", \"랭\", \"옥\", \"엮\", \"펴\", \"居\", \"駐\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"G\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"C\", \"눕\", \"젊\", \"뀔\", \"R\", \" \", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"M\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"E\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]",
"lossless": false
},
"google/mt5-large @ cc100/ar": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 2813283,
"_n_tokens": 621736,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"ﻷ\", \"ﷺ\", \"…\", \"�\", \"\", \"ﻹ\", \"ﻻ\", \"½\", \"\", \"\", \"
\", \"\", \"″\", \"\"]",
"lossless": false
},
"google/mt5-large @ cc100/de": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1814876,
"_n_tokens": 470418,
"_n_chars": 1784021,
"_n_oov_chars": 497,
"oov_ratio": 0.00027858416464828607,
"_oov_charset": "[\" \", \"…\", \"¹\", \"�\", \"\", \"²\", \"½\", \"\", \"´\", \"™\", \"¼\"]",
"lossless": false
},
"google/mt5-large @ cc100/fa": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 2054052,
"_n_tokens": 419922,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\" \", \"…\", \"�\", \"\", \"ﮧ\", \"\", \"\", \"\", \"\", \"\"]",
"lossless": false
},
"google/mt5-large @ cc100/ja": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1774770,
"_n_tokens": 290542,
"_n_chars": 603065,
"_n_oov_chars": 6762,
"oov_ratio": 0.011212721680084236,
"_oov_charset": "[\"¥\", \" \", \";\", \"+\", \"O\", \"a\", \"Ⅹ\", \"ウ\", \"ハ\", \"M\", \"Z\", \"d\", \"_\", \"テ\", \"]\", \"C\", \"L\", \"T\", \"0\", \"S\", \"%\", \"。\", \"g\", \"H\", \"@\", \"R\", \"ィ\", \"`\", \"i\", \"!\", \"^\", \"&\", \"纒\", \"㎞\", \"ヘ\", \"⑩\", \"\\", \"W\", \"t\", \"②\", \"o\", \"Y\", \"E\", \"レ\", \">\", \"リ\", \"A\", \" ̄\", \"P\", \"⑪\", \"e\", \"⑧\", \"´\", \"①\", \"④\", \"ㅂ\", \"Ⅶ\", \"?\", \"ー\", \"<\", \"メ\", \"m\", \"h\", \":\", \"$\", \" \", \",\", \"」\", \"③\", \"・\", \"4\", \"⻑\", \"y\", \"=\", \"ア\", \"N\", \"b\", \"V\", \"J\", \"‼\", \"7\", \"カ\", \"r\", \"I\", \"″\", \"ヨ\", \"U\", \"℃\", \"k\", \"Ⅱ\", \"8\", \"゙\", \"1\", \"*\", \"|\", \"\\u001b\", \"3\", \"\", \"/\", \"[\", \"K\", \"w\", \"(\", \".\", \"9\", \"ノ\", \")\", \"‥\", \"5\", \"n\", \"ゥ\", \"ロ\", \"2\", \"フ\", \"Q\", \"D\", \"-\", \"G\", \"6\", \"…\", \"�\", \"コ\", \"「\", \"l\", \"F\", \"゚\", \"X\", \"\\b\", \"、\", \"s\", \"B\", \"f\"]",
"lossless": false
},
"google/mt5-large @ cc100/ko": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1524839,
"_n_tokens": 424586,
"_n_chars": 655190,
"_n_oov_chars": 1365,
"oov_ratio": 0.0020833651307254385,
"_oov_charset": "[\"폍\", \"ㅕ\", \"Ⅹ\", \"金\", \"璣\", \"챨\", \"ㅁ\", \"Ⅲ\", \"良\", \"⑦\", \"렜\", \"⑶\", \"ㅐ\", \"ⅰ\", \"ㅈ\", \"킌\", \"ㅜ\", \"%\", \"〮\", \"⑨\", \"@\", \"Ⅳ\", \"龍\", \"흗\", \"⁴\", \"㎞\", \"ㅅ\", \"㎍\", \"②\", \"ㅒ\", \"⑤\", \"ㅇ\", \"ⅳ\", \"㉣\", \"㏊\", \"v\", \"왘\", \"퍙\", \"ㅍ\", \"ㅡ\", \"힜\", \"累\", \"Ⅰ\", \"쓕\", \"ㄹ\", \"㉰\", \"ㅗ\", \"⑧\", \"①\", \"ㅙ\", \"ⓒ\", \"④\", \"꿕\", \"ⓔ\", \"㎡\", \"㎥\", \"Ⅶ\", \"ⅲ\", \"?\", \"ㄴ\", \"ㅛ\", \"㉠\", \"\", \"ㅝ\", \":\", \"靈\", \"⑥\", \"㉿\", \"ㅟ\", \"③\", \" \", \"Ⅷ\", \"」\", \"쒀\", \"女\", \"ㅓ\", \"뾱\", \"⑵\", \"理\", \"ㄷ\", \"ㅢ\", \"ㅏ\", \"樂\", \"ㄱ\", \"ㅘ\", \"立\", \"ㅣ\", \"삣\", \"流\", \"\", \"⑸\", \"ㅖ\", \"㈜\", \"ㅞ\", \"¹\", \"℃\", \"綃\", \"힉\", \"Ⅱ\", \"ㅋ\", \"ㅠ\", \"*\", \"|\", \"樂\", \"陸\", \"ㅎ\", \"ㅔ\", \"\", \"ㅑ\", \"츈\", \"識\", \"웖\", \"Ⅴ\", \"ㅊ\", \"⑹\", \"梁\", \"Ⅵ\", \"‥\", \"ⅱ\", \"Ⅸ\", \"ㅚ\", \"\", \"ㅆ\", \"�\", \"…\", \"뭥\", \"쫗\", \"「\", \"ㆍ\", \"不\", \"²\", \"⑴\", \"s\", \"➏\", \"․\", \"\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/ar": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2813283,
"_n_tokens": 558855,
"_n_chars": 1560987,
"_n_oov_chars": 1249848,
"oov_ratio": 0.8006780325524813,
"_oov_charset": "[\"α\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"~\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"}\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ھ\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"\", \"η\", \"″\", \"ث\", \"{\", \"ρ\", \"\\\\\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"ؤ\", \"\", \"م\", \"\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"…\", \"�\", \"^\", \"ف\", \"؛\", \"█\", \"<\", \"و\", \"\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/de": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1814876,
"_n_tokens": 470254,
"_n_chars": 1784021,
"_n_oov_chars": 2034,
"oov_ratio": 0.001140121108439867,
"_oov_charset": "[\"α\", \"\", \"‚\", \"→\", \"\", \"Ã\", \"▼\", \" \", \"ί\", \"Á\", \"̈\", \"~\", \"™\", \"¼\", \"\", \"‹\", \"å\", \"ς\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"}\", \"😀\", \"♥\", \"🙁\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"¬\", \"`\", \"★\", \"−\", \"š\", \"\", \"İ\", \"ø\", \"{\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"Ä\", \"ρ\", \"\\\\\", \"➔\", \"©\", \"😦\", \"ι\", \"\", \"☺\", \"č\", \"\", \"§\", \"ń\", \"😆\", \"♦\", \"¿\", \"�\", \"…\", \"^\", \"Ö\", \"²\", \"🙄\", \"<\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/fa": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2054052,
"_n_tokens": 483767,
"_n_chars": 1145876,
"_n_oov_chars": 898637,
"oov_ratio": 0.7842358160917935,
"_oov_charset": "[\" \", \"۲\", \"ع\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"}\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"ے\", \"ظ\", \"\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"٫\", \"\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"\", \"ث\", \"{\", \"۵\", \"▐\", \"\\\\\", \"©\", \"ل\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"<\", \"…\", \"�\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/ja": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1774770,
"_n_tokens": 41947,
"_n_chars": 603065,
"_n_oov_chars": 585967,
"oov_ratio": 0.9716481639624253,
"_oov_charset": "[\"仕\", \"ネ\", \"逡\", \"卓\", \"幌\", \"帝\", \"柏\", \"濯\", \"程\", \"胸\", \"納\", \"扉\", \"差\", \"合\", \"暴\", \"之\", \"携\", \"尻\", \"軟\", \"報\", \"処\", \"矢\", \"撤\", \"失\", \"艸\", \"林\", \"循\", \"喚\", \"惨\", \"渦\", \"濫\", \"拒\", \"再\", \"倍\", \"ィ\", \"栽\", \"塚\", \"某\", \"夫\", \"草\", \"憶\", \"截\", \"侶\", \"据\", \"殲\", \"膿\", \"昼\", \"祉\", \"升\", \"添\", \"窟\", \"宙\", \"楽\", \"照\", \"槽\", \"忌\", \"泳\", \"彙\", \"意\", \"忘\", \"還\", \"啜\", \"店\", \"族\", \"渉\", \"事\", \"護\", \"点\", \"法\", \"眠\", \"狭\", \"鎌\", \"ツ\", \"腫\", \"ゼ\", \"歌\", \"虫\", \"迭\", \"ㅂ\", \"楠\", \"蓮\", \"牲\", \"シ\", \"曹\", \"開\", \"恰\", \"ぷ\", \"心\", \"段\", \"捉\", \"れ\", \"送\", \"浩\", \"邸\", \"琢\", \"力\", \"隆\", \"朝\", \"伊\", \"た\", \"疾\", \"串\", \"笛\", \"星\", \"友\", \"y\", \"伯\", \"音\", \"眉\", \"北\", \"虐\", \"騰\", \"捐\", \"塵\", \"滲\", \"和\", \"鳥\", \"兼\", \"欠\", \"r\", \"彫\", \"波\", \"栄\", \"庶\", \"漬\", \"杓\", \"槌\", \"💦\", \"憎\", \"旧\", \"紅\", \"垂\", \"圏\", \"ォ\", \"©\", \"譚\", \"潔\", \"侮\", \"級\", \"老\", \"房\", \"針\", \"暑\", \"貴\", \"珍\", \"〜\", \"授\", \"拍\", \"共\", \"旦\", \"燃\", \"歯\", \"録\", \"尽\", \"剤\", \"熟\", \"艶\", \"喜\", \"清\", \"家\", \"甚\", \"灌\", \"糖\", \"X\", \"這\", \"<\", \"陸\", \"亜\", \"f\", \"悲\", \"駕\", \"吾\", \"扱\", \"狼\", \"尚\", \"倭\", \"表\", \"圃\", \"→\", \"服\", \"牧\", \"灯\", \"集\", \"活\", \"衿\", \"〉\", \"可\", \"章\", \"杉\", \"氷\", \"弊\", \"営\", \"披\", \"看\", \"〟\", \"ゎ\", \"置\", \"彼\", \"嗜\", \"道\", \"賭\", \"只\", \"曜\", \"猛\", \"終\", \"限\", \"翻\", \"伺\", \"戻\", \"核\", \"珪\", \"蒙\", \"に\", \"冷\", \"強\", \"壇\", \"祠\", \"五\", \"胆\", \"影\", \"揮\", \"甥\", \"韮\", \"俊\", \"静\", \"悩\", \"史\", \"ゆ\", \"泣\", \"候\", \"米\", \"勤\", \"夕\", \"恋\", \"汎\", \"詩\", \"紐\", \"奢\", \"横\", \"詠\", \"述\", \"根\", \"桟\", \"衝\", \"阪\", \"惜\", \"嬢\", \"彩\", \"手\", \"池\", \"死\", \"噴\", \"鑑\", \"依\", \",\", \"必\", \"蛍\", \"材\", \"跨\", \"場\", \"胞\", \"潜\", \"猟\", \"★\", \"味\", \"践\", \"窒\", \"蛋\", \"奨\", \"務\", \"園\", \"獣\", \"欄\", \"争\", \"陽\", \"汁\", \"塔\", \"鍋\", \"妻\", \"″\", \"贔\", \"訝\", \"崖\", \"薬\", \"厚\", \"怒\", \"兵\", \"渕\", \"員\", \"咲\", \"挫\", \"臓\", \"着\", \"貸\", \"褒\", \"梁\", \"立\", \"徹\", \"況\", \"幾\", \"謙\", \"郷\", \"植\", \"煮\", \"同\", \"楓\", \"妊\", \"徳\", \"ろ\", \"悔\", \"抱\", \"剃\", \"版\", \"彡\", \"祖\", \"膨\", \"ビ\", \"2\", \"貼\", \"支\", \"醤\", \"椿\", \"嬉\", \"慮\", \"蝶\", \"嘆\", \"箭\", \"年\", \"見\", \"研\", \"\\b\", \"瑞\", \"以\", \"荷\", \"減\", \"a\", \"罠\", \"餅\", \"旺\", \"彰\", \"我\", \"促\", \"膚\", \"亀\", \"嘘\", \"脳\", \"卑\", \"正\", \"Z\", \"絵\", \"貞\", \"テ\", \"C\", \"呼\", \"適\", \"信\", \"役\", \"0\", \"稚\", \"嗅\", \"臨\", \"奮\", \"羊\", \"木\", \"琵\", \"宅\", \"ず\", \"即\", \"勉\", \"臣\", \"帳\", \"芝\", \"澤\", \"溜\", \"介\", \"収\", \"略\", \"斬\", \"村\", \"爪\", \"媒\", \"猿\", \"変\", \"公\", \"辰\", \"汲\", \"駒\", \"室\", \"娘\", \"懐\", \"̀\", \"李\", \"城\", \"競\", \"々\", \"群\", \"ナ\", \"救\", \"覗\", \"羅\", \"東\", \"憑\", \"削\", \"遙\", \"折\", \"戯\", \"粗\", \"把\", \"緻\", \"刺\", \"先\", \"無\", \"休\", \"轄\", \"距\", \"徊\", \"問\", \"裂\", \"語\", \"飢\", \"腺\", \"漑\", \"て\", \"署\", \"塾\", \"募\", \"タ\", \"」\", \"チ\", \"掬\", \"律\", \"床\", \"狩\", \"子\", \"号\", \"愛\", \"奔\", \"ア\", \"癖\", \"貪\", \"硝\", \"遠\", \"ぃ\", \"眩\", \"が\", \"ゾ\", \"カ\", \"諸\", \"恩\", \"採\", \"那\", \"衰\", \"最\", \"釈\", \"梓\", \"ヤ\", \"藁\", \"央\", \"取\", \"́\", \"綬\", \"端\", \"三\", \"秤\", \"魂\", \"建\", \"輿\", \"ウ\", \"駆\", \"[\", \"ぬ\", \"遂\", \"鮮\", \"粋\", \"想\", \"粉\", \"煙\", \"去\", \"移\", \"叱\", \"湾\", \"弥\", \"油\", \"姥\", \"品\", \"局\", \"塗\", \"刊\", \"庁\", \"じ\", \"頒\", \"ら\", \"延\", \"飼\", \"模\", \"お\", \"封\", \"綺\", \"嵯\", \"宛\", \"゚\", \"仰\", \"繊\", \"双\", \"半\", \"籠\", \"但\", \"酷\", \"別\", \"レ\", \"特\", \"貰\", \"払\", \"放\", \"叉\", \"博\", \"訊\", \"♪\", \"当\", \"怪\", \"堪\", \"⇒\", \"誓\", \"祝\", \"私\", \"由\", \"踏\", \"を\", \"成\", \"顔\", \"且\", \"ど\", \"列\", \"餃\", \"援\", \"槍\", \"馴\", \"要\", \"撃\", \"難\", \"`\", \"裟\", \"杏\", \"i\", \"乗\", \"炒\", \"ヽ\", \"曝\", \"領\", \"型\", \"真\", \"坂\", \"坪\", \"犠\", \"寇\", \"均\", \"痛\", \"肯\", \"舞\", \"住\", \"系\", \"種\", \"食\", \"レ\", \"懸\", \"久\", \"睡\", \"喩\", \"嵐\", \"井\", \"似\", \"量\", \"励\", \"播\", \"醜\", \"拡\", \"訂\", \"丁\", \"口\", \"空\", \"往\", \"票\", \"・\", \"団\", \"涅\", \"止\", \"ー\", \"矛\", \"<\", \"湯\", \"婆\", \"浸\", \"伽\", \"薪\", \"琶\", \"マ\", \"覆\", \"崩\", \"接\", \"熊\", \"惑\", \"妨\", \"兆\", \"◆\", \"べ\", \"是\", \"安\", \"舟\", \"パ\", \"告\", \"詰\", \"画\", \"爾\", \"昭\", \"豚\", \"釣\", \"紫\", \"謬\", \"悪\", \"橋\", \"試\", \"孫\", \"喉\", \"😭\", \"煽\", \"遭\", \"拗\", \"僕\", \"弟\", \"愚\", \"碌\", \"聴\", \"テ\", \"寮\", \"術\", \"邪\", \"‼\", \"冥\", \"多\", \"歓\", \"汰\", \"風\", \"躍\", \"窓\", \"滴\", \"巣\", \"妹\", \"擁\", \"産\", \"撲\", \"枝\", \"曽\", \"較\", \"洋\", \"精\", \"束\", \"途\", \"戚\", \"泉\", \"妥\", \"遥\", \"用\", \"誤\", \"滑\", \"穏\", \"選\", \"萼\", \"存\", \"縁\", \"裁\", \"藻\", \"撰\", \"査\", \"幻\", \"載\", \"ぜ\", \"栗\", \"-\", \"糸\", \"の\", \"面\", \"輝\", \"校\", \"等\", \"達\", \"光\", \"勿\", \"欣\", \"迦\", \"み\", \"社\", \" \", \"亭\", \"嫁\", \"澄\", \"捺\", \"壊\", \"値\", \"宿\", \"各\", \"魔\", \"仏\", \"傍\", \"染\", \"猶\", \"価\", \"唐\", \"拓\", \"英\", \"赤\", \"努\", \"ま\", \"文\", \"効\", \"応\", \"%\", \"習\", \"こ\", \"プ\", \"麓\", \"炉\", \"縦\", \"考\", \"築\", \"預\", \"履\", \"借\", \"尾\", \"ざ\", \"託\", \"渋\", \"偵\", \"免\", \"&\", \"萎\", \"㎞\", \"速\", \"福\", \"躇\", \"鈴\", \"誇\", \"ひ\", \"挿\", \"ゃ\", \"捕\", \"声\", \"o\", \"刃\", \"な\", \"箇\", \"角\", \"肪\", \"赦\", \"質\", \"富\", \"凛\", \"リ\", \"頷\", \"保\", \"頂\", \"既\", \"追\", \"縞\", \"痒\", \"鞄\", \"青\", \"恣\", \"碓\", \"梶\", \"水\", \"備\", \"洪\", \"糾\", \"斑\", \"祀\", \"ベ\", \"棒\", \":\", \"棟\", \"退\", \"叫\", \"ね\", \"圧\", \"首\", \"積\", \"劇\", \"暫\", \"戦\", \"捨\", \"遽\", \"該\", \"⻑\", \"堡\", \"常\", \"診\", \"惚\", \"做\", \"躊\", \"沙\", \"澪\", \"盾\", \"仔\", \"7\", \"羨\", \"胎\", \"主\", \"礼\", \"賀\", \"揄\", \"膜\", \"ニ\", \"入\", \"誌\", \"夜\", \"動\", \"飾\", \"皮\", \"造\", \"殺\", \"玉\", \"概\", \"岡\", \"忙\", \"少\", \"切\", \"倒\", \"砦\", \"交\", \"感\", \"豪\", \"w\", \"給\", \"附\", \"脚\", \"仲\", \"復\", \"衡\", \"セ\", \"降\", \"わ\", \"潤\", \"修\", \"徴\", \"漏\", \"斎\", \"綾\", \"償\", \"⌒\", \"恥\", \"醐\", \"刑\", \"儀\", \"襲\", \"拠\", \"恒\", \"猫\", \"厄\", \"ウ\", \"ば\", \"荒\", \"え\", \"枯\", \"揚\", \"思\", \"握\", \"鍛\", \"世\", \"雰\", \"ギ\", \"L\", \"衛\", \"翌\", \"民\", \"雨\", \"策\", \"蘇\", \"堀\", \"偏\", \"国\", \"嘲\", \"軋\", \"鬱\", \"昂\", \"焦\", \"R\", \"帽\", \"弁\", \"碍\", \"枚\", \"痩\", \"峨\", \"損\", \"笠\", \"則\", \"灼\", \"痕\", \"暇\", \"脆\", \"宝\", \"童\", \"礁\", \"刷\", \"僅\", \"縫\", \"咽\", \"養\", \"菅\", \"〔\", \"径\", \"何\", \"埃\", \"挑\", \"ゅ\", \"】\", \"享\", \"忍\", \"虚\", \"煎\", \"歩\", \"兎\", \"P\", \"掌\", \"予\", \"結\", \"審\", \"混\", \"西\", \"遵\", \"盗\", \"箋\", \"防\", \"洗\", \"泄\", \"艦\", \"度\", \"盤\", \"套\", \"沼\", \"嚥\", \"や\", \"‐\", \"都\", \"阿\", \"奏\", \"触\", \"括\", \"銭\", \"慨\", \"提\", \"詮\", \"∇\", \"屋\", \"関\", \"フ\", \"ピ\", \"彷\", \"優\", \"談\", \"賃\", \"✨\", \"飽\", \"腑\", \"余\", \"霊\", \"莽\", \"独\", \"式\", \"殖\", \"快\", \"軸\", \"*\", \"彦\", \"愕\", \"〈\", \"》\", \"親\", \"翔\", \"垣\", \"永\", \"痢\", \"方\", \"張\", \"粒\", \"香\", \"絡\", \"乱\", \"紛\", \"揉\", \")\", \"n\", \"鋲\", \"鉱\", \"︎\", \"奥\", \"曲\", \"は\", \"跳\", \"髭\", \"薩\", \"徘\", \"資\", \"咎\", \"申\", \"礫\", \"催\", \"滝\", \"待\", \"留\", \"裕\", \"符\", \"殻\", \"縛\", \"づ\", \"鯖\", \"緒\", \"姜\", \"興\", \"獲\", \"臥\", \"確\", \"連\", \"涙\", \"虹\", \"反\", \"茂\", \"協\", \"唾\", \"~\", \"曇\", \"紋\", \"焼\", \"魏\", \"初\", \"鹿\", \"寄\", \"験\", \"抜\", \"飯\", \"虜\", \"監\", \"。\", \"請\", \"汗\", \"松\", \"冒\", \"措\", \"雄\", \"國\", \"憲\", \"召\", \"乞\", \"^\", \"障\", \"\\", \"吟\", \"欧\", \"湖\", \"含\", \"危\", \"姓\", \"疹\", \"唆\", \"字\", \"、\", \"瓦\", \"捜\", \"抑\", \"恨\", \"穂\", \"ゝ\", \"梗\", \"有\", \"梅\", \"淳\", \"ょ\", \"著\", \"嵌\", \"喪\", \"了\", \"頃\", \"慄\", \"瓶\", \"激\", \"駿\", \" ̄\", \"算\", \"四\", \"ノ\", \"①\", \"血\", \"紡\", \"温\", \"祇\", \"摯\", \"田\", \"背\", \"疲\", \"鼻\", \"魅\", \"銃\", \"財\", \"股\", \"閲\", \"乳\", \"勝\", \"拘\", \"幡\", \"教\", \"ぶ\", \"・\", \"逐\", \"駄\", \"執\", \"朴\", \"言\", \"雑\", \"出\", \"範\", \"斡\", \"太\", \"街\", \"不\", \"様\", \"噂\", \"健\", \"景\", \"宮\", \"k\", \"湘\", \"舘\", \"格\", \"浅\", \"廻\", \"盛\", \"囁\", \"嘗\", \"例\", \"市\", \"貯\", \"総\", \"架\", \"濡\", \"調\", \"行\", \"施\", \"惧\", \"痺\", \"キ\", \"巨\", \".\", \"炭\", \"承\", \"慰\", \"答\", \"又\", \"凡\", \"注\", \"足\", \"繰\", \"賛\", \"ぽ\", \"遡\", \"鉢\", \"古\", \"磋\", \"椒\", \"慈\", \"州\", \"判\", \"酔\", \"杜\", \"悟\", \"^\", \"鶏\", \"陶\", \"班\", \"蔵\", \"緑\", \"ー\", \"羽\", \"裏\", \"挟\", \"百\", \"、\", \"蔓\", \"農\", \";\", \"層\", \"暦\", \"重\", \"廉\", \"雪\", \"情\", \"拶\", \"昏\", \"🌙\", \"嫉\", \"定\", \"万\", \"訃\", \"ヴ\", \"割\", \"弄\", \"刀\", \"泰\", \"旬\", \"門\", \"科\", \"贅\", \"壬\", \"鉛\", \"絨\", \"@\", \"ヲ\", \"吉\", \"♡\", \"洩\", \"斗\", \"苗\", \"電\", \"名\", \"■\", \"株\", \"漫\", \"壁\", \"域\", \"舌\", \"乙\", \"埋\", \"淹\", \"薦\", \"操\", \"熱\", \"盟\", \"若\", \"妃\", \"云\", \"透\", \"玄\", \"琴\", \"柱\", \"訟\", \"趣\", \"頑\", \"´\", \"ェ\", \"ジ\", \"脅\", \"ぁ\", \"騒\", \"殆\", \"浮\", \"譲\", \"鎮\", \"頓\", \"察\", \"装\", \"谷\", \"砂\", \"密\", \"闘\", \"✧\", \"―\", \"だ\", \"ソ\", \"却\", \"組\", \"魚\", \"吐\", \"祥\", \"次\", \"罵\", \"跡\", \"引\", \"幸\", \"神\", \"呂\", \"ほ\", \"V\", \"ご\", \"山\", \"回\", \"ザ\", \"負\", \"逆\", \"珂\", \"剰\", \"府\", \"巡\", \"発\", \"薄\", \"U\", \"率\", \"稲\", \"除\", \"菓\", \"講\", \"札\", \"写\", \"軍\", \"映\", \"補\", \"京\", \"婿\", \"工\", \"へ\", \"閉\", \"腔\", \"杼\", \"来\", \"今\", \"里\", \"幼\", \"繋\", \"内\", \"訓\", \"桃\", \"紗\", \"才\", \"躾\", \"女\", \"羞\", \"寿\", \"院\", \"厨\", \"擢\", \"兄\", \"謳\", \"け\", \"懲\", \"演\", \"酒\", \"寸\", \"妙\", \"際\", \"脂\", \"浴\", \"F\", \"佇\", \"烙\", \"枠\", \"s\", \"刻\", \"紀\", \"消\", \"参\", \"乏\", \"逼\", \"槃\", \"比\", \"知\", \"陰\", \"故\", \"ハ\", \"靄\", \"翼\", \"カ\", \"漁\", \"樺\", \"葬\", \"๑\", \"珠\", \"鍵\", \"弾\", \"岩\", \"靴\", \"季\", \"ぇ\", \"堅\", \"闇\", \"辣\", \"斉\", \"金\", \"落\", \"※\", \"使\", \"書\", \"守\", \"漱\", \"●\", \"泊\", \"編\", \"龍\", \"遊\", \"尊\", \"典\", \"W\", \"治\", \"ブ\", \"器\", \"疎\", \"豊\", \"庄\", \"畳\", \"隠\", \"勢\", \"石\", \"黄\", \"党\", \"裸\", \"酸\", \"鳴\", \"働\", \"妬\", \"苛\", \"計\", \"丸\", \"緩\", \"火\", \"←\", \"徐\", \"隔\", \"錬\", \"憤\", \"袴\", \"④\", \"忠\", \"膝\", \"捗\", \"批\", \"滅\", \"沢\", \"ペ\", \"館\", \"垠\", \"韓\", \"創\", \"相\", \"陵\", \"m\", \"導\", \"惹\", \"陛\", \"害\", \"左\", \"急\", \"謂\", \"ヶ\", \"漂\", \"抹\", \"び\", \"氏\", \"迅\", \"牽\", \"桁\", \"蒔\", \"榴\", \"地\", \"摩\", \"抽\", \"斐\", \"困\", \"N\", \"涯\", \"錠\", \"唄\", \"゚\", \"唱\", \"〕\", \"隈\", \"響\", \"己\", \"敏\", \"貝\", \"撫\", \"乃\", \"衷\", \"賊\", \"些\", \"美\", \"泌\", \"Ⅱ\", \"辿\", \"゙\", \"投\", \"込\", \"奉\", \"断\", \"索\", \"灰\", \"巷\", \"稼\", \"末\", \"耳\", \"\\\\\", \"\\u001b\", \"漢\", \"3\", \"誕\", \"専\", \"乾\", \"覚\", \"秒\", \"阜\", \"念\", \"○\", \"説\", \"皿\", \"齢\", \"姦\", \"題\", \"賞\", \"滓\", \"5\", \"盆\", \"い\", \"目\", \"没\", \"呑\", \"仮\", \"需\", \"善\", \"闊\", \"肉\", \"D\", \"省\", \"秀\", \"押\", \"墓\", \"蝋\", \"揃\", \"ケ\", \"壮\", \"ω\", \"♫\", \"怖\", \"胚\", \"責\", \"運\", \"満\", \"越\", \"杖\", \"武\", \"普\", \"固\", \"O\", \"排\", \"伏\", \"本\", \"戒\", \"バ\", \"債\", \"磯\", \"』\", \"庫\", \"噛\", \"輪\", \"受\", \"板\", \"匡\", \"ワ\", \"蜂\", \"傾\", \"称\", \"篠\", \"類\", \"隕\", \"歴\", \"療\", \"椅\", \"贋\", \"僭\", \"於\", \"円\", \"〆\", \"陳\", \"配\", \"付\", \"纒\", \"袈\", \"十\", \"莫\", \"『\", \"日\", \"②\", \"頭\", \"哀\", \"鉄\", \"作\", \"で\", \"形\", \"吠\", \"墟\", \"丿\", \"踪\", \"睦\", \"琉\", \"祐\", \"辺\", \"墾\", \"隅\", \"す\", \"委\", \"遣\", \"疑\", \"露\", \"⑧\", \"高\", \"曖\", \"□\", \"亮\", \"捩\", \"裾\", \"攫\", \"第\", \"鞘\", \"賢\", \"嗚\", \"托\", \"ち\", \"短\", \"ぼ\", \"択\", \"届\", \"μ\", \"篇\", \"藤\", \"大\", \"晋\", \"旋\", \"ポ\", \"土\", \"代\", \"士\", \"=\", \"誉\", \"め\", \"寡\", \"埼\", \"耐\", \"隙\", \"洞\", \"凪\", \"瞑\", \"好\", \"従\", \"充\", \"℃\", \"デ\", \"昇\", \"填\", \"拭\", \"登\", \"箱\", \"斜\", \"楊\", \"順\", \"匠\", \"月\", \"栃\", \"耗\", \"ダ\", \"唸\", \"醍\", \"頼\", \"酵\", \"倫\", \"悶\", \"叶\", \"缶\", \"息\", \"ュ\", \"陣\", \"喇\", \"諏\", \"敗\", \"及\", \"G\", \"渇\", \"偶\", \"礎\", \"杞\", \"怯\", \"期\", \"機\", \"織\", \"客\", \"妖\", \"簗\", \"育\", \"師\", \"潟\", \"麺\", \"貫\", \"ン\", \"伴\", \"Ⅹ\", \"甘\", \"謡\", \"控\", \"ぉ\", \"数\", \"詈\", \"劉\", \"船\", \"喰\", \"嫌\", \"顕\", \"敬\", \"盲\", \"]\", \"朗\", \"秘\", \"怨\", \"天\", \"婦\", \"慌\", \"嶽\", \"軌\", \"孝\", \"綴\", \"挨\", \"鏡\", \"峙\", \"虎\", \"腰\", \"液\", \"ド\", \"眺\", \"企\", \"県\", \"児\", \"奈\", \"喧\", \"済\", \"蠍\", \"揺\", \"氾\", \"潰\", \"販\", \"ヌ\", \"悍\", \"規\", \"港\", \"被\", \"勇\", \"机\", \"\", \"討\", \"〇\", \"課\", \"脇\", \"皆\", \"赴\", \"堰\", \"鼓\", \"掲\", \"併\", \"尼\", \"唯\", \"磨\", \"粧\", \"気\", \"諦\", \"宗\", \"懇\", \"午\", \"e\", \"×\", \"邦\", \"掛\", \"菌\", \"腕\", \"◯\", \"荻\", \"姿\", \"絞\", \"恵\", \"旭\", \"匂\", \"野\", \"沿\", \"塊\", \"剣\", \"毅\", \"瘻\", \"オ\", \"趨\", \"h\", \"ゥ\", \"属\", \"麗\", \"衣\", \"覇\", \"爽\", \"走\", \"恭\", \"令\", \"逸\", \"佳\", \"商\", \"祭\", \"「\", \"叩\", \"鎖\", \"暮\", \"岐\", \"議\", \"梯\", \"ぐ\", \"僚\", \"寓\", \"抗\", \"所\", \"統\", \"般\", \"二\", \"区\", \"楚\", \"ア\", \"ト\", \"る\", \"8\", \"諺\", \"臭\", \"繍\", \"官\", \"¥\", \"体\", \"解\", \"【\", \"勘\", \"良\", \"雇\", \"訴\", \"吸\", \"身\", \"犬\", \"K\", \"崔\", \"締\", \"飴\", \"ゥ\", \"ィ\", \"花\", \"望\", \"紙\", \"尿\", \"庭\", \"ロ\", \"母\", \"線\", \"遇\", \"漠\", \"離\", \"貿\", \"河\", \"示\", \"網\", \"突\", \"貌\", \"寝\", \"進\", \"馬\", \"倉\", \"昧\", \"他\", \"違\", \"紹\", \"病\", \"卒\", \"☆\", \"暖\", \"序\", \"宇\", \"税\", \"労\", \"ぎ\", \"◡\", \"嵩\", \"緊\", \"製\", \"詳\", \"禁\", \"😌\", \"閃\", \"練\", \"中\", \"性\", \"繁\", \"克\", \"窃\", \"S\", \"原\", \"帰\", \"g\", \"幽\", \"車\", \"渓\", \"檀\", \"鶴\", \"麹\", \"額\", \"災\", \"⑩\", \"葵\", \"畑\", \"遺\", \"鐘\", \"黒\", \"隣\", \"震\", \"舎\", \"君\", \"も\", \"敷\", \"丈\", \"堵\", \"ホ\", \"弓\", \"逢\", \"ム\", \"件\", \"周\", \"暢\", \"愉\", \"歪\", \"否\", \"占\", \"慣\", \"也\", \"卵\", \"維\", \"通\", \"喝\", \"凱\", \"勧\", \"早\", \"婚\", \"↑\", \"幣\", \"徨\", \"下\", \"征\", \"梨\", \"蓄\", \"痴\", \"窪\", \"宴\", \"基\", \"騙\", \"球\", \"席\", \"腹\", \"肺\", \"技\", \"俵\", \"秋\", \"決\", \"打\", \"苦\", \"至\", \"徒\", \"淡\", \"😢\", \"げ\", \"獄\", \"浣\", \"蒸\", \"人\", \"《\", \"郎\", \"牛\", \"広\", \"化\", \"掃\", \"う\", \"自\", \"父\", \"銀\", \"王\", \"噤\", \"旅\", \"蔽\", \"笑\", \"射\", \"部\", \"−\", \"設\", \"─\", \"昨\", \"ん\", \"屈\", \"蹴\", \"海\", \"麦\", \"孤\", \"者\", \"浦\", \"柄\", \"憧\", \"助\", \"1\", \"印\", \"ズ\", \"幅\", \"臆\", \"轢\", \"異\", \"八\", \"ハ\", \"腐\", \"詫\", \"替\", \"就\", \"展\", \"恐\", \"瞬\", \"ノ\", \"鋭\", \"硬\", \"゙\", \"戸\", \"憂\", \"佐\", \"炎\", \"伐\", \"迫\", \"筈\", \"寂\", \"つ\", \"摘\", \"械\", \"烈\", \"穴\", \"縮\", \"康\", \"続\", \"与\", \"貶\", \"緯\", \"錯\", \"滞\", \"後\", \"改\", \"塞\", \"狐\", \"و\", \"窮\", \"晩\", \"振\", \"亡\", \"到\", \"+\", \"〝\", \"廊\", \"浪\", \"拳\", \"イ\", \"標\", \"̈\", \"戴\", \"詐\", \"謎\", \"菊\", \"抵\", \"旨\", \"サ\", \"業\", \"甲\", \"拙\", \"謗\", \"斂\", \"拾\", \"個\", \"制\", \"訳\", \"隼\", \"筆\", \"直\", \"侵\", \"モ\", \"長\", \"◎\", \"棲\", \"夷\", \"ぅ\", \"瘍\", \"近\", \"茫\", \"拉\", \"拷\", \"謝\", \"停\", \"傘\", \"謀\", \"狙\", \"筒\", \"包\", \"低\", \"融\", \"雲\", \"詞\", \"凍\", \"Y\", \"E\", \"毛\", \">\", \"穢\", \"穀\", \"瞭\", \"週\", \"堺\", \"⑪\", \"厳\", \"狂\", \"境\", \"匙\", \"よ\", \"功\", \"岬\", \"上\", \"丹\", \"ぞ\", \"経\", \"御\", \"軒\", \"輩\", \"呆\", \"希\", \"増\", \"輔\", \"殿\", \"骨\", \"捏\", \"郭\", \"持\", \"撒\", \"然\", \"料\", \"完\", \"位\", \"③\", \"互\", \"。\", \"崎\", \"険\", \"色\", \"姉\", \"傷\", \"白\", \"細\", \"囲\", \"`\", \"慢\", \"帆\", \"絆\", \"対\", \"許\", \"浜\", \"屹\", \"匹\", \"側\", \"新\", \"記\", \"幕\", \"航\", \"あ\", \"肌\", \"溢\", \"グ\", \"並\", \"筋\", \"哲\", \"ヒ\", \"贈\", \"ユ\", \"稜\", \"全\", \"そ\", \"渡\", \"胃\", \"伸\", \"蛇\", \"ヨ\", \"皇\", \"ル\", \"俄\", \"腱\", \"宋\", \"尖\", \"坊\", \"費\", \"春\", \"歳\", \"く\", \"旗\", \"り\", \"苑\", \"聾\", \"観\", \"殊\", \"(\", \"娯\", \"ぱ\", \"契\", \"条\", \"奪\", \"菜\", \"溶\", \"ふ\", \"ヘ\", \"冨\", \"~\", \"毒\", \"冊\", \"涼\", \"灘\", \"顎\", \"綜\", \"果\", \"俺\", \"厭\", \"前\", \"闖\", \"疇\", \"�\", \"干\", \"斧\", \"砕\", \"B\", \"寺\", \"糞\", \"暗\", \"的\", \"△\", \"昆\", \"祈\", \"⇔\", \"避\", \"眼\", \"俳\", \"俯\", \"β\", \"敵\", \"得\", \"喋\", \"節\", \"掘\", \"ッ\", \"墜\", \"簡\", \"っ\", \"彿\", \"加\", \"分\", \"袋\", \"象\", \"陥\", \"岳\", \"視\", \"両\", \"屓\", \"芳\", \"囚\", \"傲\", \"準\", \"丘\", \"コ\", \"郡\", \"舗\", \"淫\", \"暁\", \"ボ\", \"ミ\", \"惣\", \"叭\", \"浄\", \"滋\", \"譜\", \"一\", \"吹\", \"致\", \"煩\", \"掻\", \"購\", \"桜\", \"◇\", \"時\", \"疫\", \"メ\", \"摂\", \"九\", \"嫡\", \"流\", \"賑\", \"驚\", \"肥\", \"傑\", \"誘\", \"應\", \"俸\", \"係\", \"せ\", \"聖\", \"頻\", \"娠\", \"Ⅶ\", \"荘\", \"聞\", \"?\", \"郵\", \"咳\", \"奇\", \"嶋\", \"ゲ\", \"勲\", \"献\", \"媛\", \"▽\", \"醸\", \"像\", \"巻\", \"喫\", \"瞳\", \"踊\", \"冗\", \"▷\", \"堤\", \"飲\", \"威\", \"∀\", \"堂\", \"捧\", \"片\", \"釜\", \"ガ\", \"撮\", \"b\", \"間\", \"極\", \"棚\", \"華\", \"濃\", \"鬼\", \"ヨ\", \"貨\", \"宣\", \"探\", \"劣\", \"桑\", \"遼\", \"噌\", \"環\", \"仁\", \"\", \"/\", \"綻\", \"芸\", \"ス\", \"実\", \"測\", \"在\", \"掴\", \"晶\", \"未\", \"因\", \"昔\", \"梱\", \"9\", \"‥\", \"瓢\", \"肩\", \"岸\", \"湿\", \"継\", \"拝\", \"啓\", \"須\", \"峰\", \"過\", \"ゞ\", \"匿\", \"将\", \"し\", \"糧\", \"微\", \"攻\", \"如\", \"巾\", \"↓\", \"「\", \"冬\", \"コ\", \"梳\", \"﨑\", \"逃\", \"派\", \"凄\", \"擦\", \"閑\", \"布\", \"俗\", \"ゴ\", \"柔\", \"湧\", \"単\", \"絶\", \"黙\", \"腎\", \"茶\", \"M\", \"d\", \"凶\", \"警\", \"能\", \"_\", \"更\", \"姑\", \"森\", \"怠\", \"川\", \"擬\", \"媚\", \"義\", \"非\", \"駅\", \"供\", \"霧\", \"南\", \"癌\", \"ャ\", \"座\", \"居\", \"篤\", \"推\", \"駐\", \"志\", \"宜\", \"穫\", \"阻\", \"畜\", \"H\", \"弱\", \"儲\", \"罪\", \"豆\", \"誹\", \"物\", \"蛮\", \"寒\", \"約\", \"秩\", \"純\", \"き\", \"曰\", \"讐\", \"ク\", \"鱈\", \"貧\", \"仙\", \"源\", \"飛\", \"宏\", \"寛\", \"底\", \"墳\", \"鈍\", \"沖\", \"さ\", \"誠\", \"僧\", \"銘\", \"悠\", \"潮\", \"島\", \"ε\", \"尺\", \"職\", \"烹\", \"会\", \"衆\", \"薙\", \"迎\", \"A\", \"界\", \"随\", \"酬\", \"搭\", \"買\", \"巧\", \"ラ\", \"蔑\", \"偉\", \"琳\", \"挙\", \"腸\", \"メ\", \"素\", \"麻\", \"平\", \"遍\", \"男\", \"$\", \"髪\", \" \", \"政\", \"縄\", \"か\", \"雷\", \"句\", \"攘\", \"杯\", \"枕\", \"図\", \"4\", \"凝\", \"尋\", \"栓\", \"釘\", \"逮\", \"右\", \"忽\", \"副\", \"券\", \"脱\", \"深\", \"権\", \"I\", \"粘\", \"元\", \"沈\", \"任\", \"壌\", \"馳\", \"ョ\", \"ヵ\", \"督\", \"燥\", \"侍\", \"餓\", \"リ\", \"簿\", \"葉\", \"罰\", \"症\", \"耶\", \"寧\", \"整\", \"江\", \"舐\", \"垢\", \"津\", \"台\", \"焙\", \"貢\", \"璧\", \"牙\", \"生\", \"諾\", \"指\", \"癒\", \"読\", \"欝\", \"案\", \"謄\", \"l\", \"識\", \"捲\", \"慶\", \"竜\", \"革\", \"肢\", \"ロ\", \"¥\", \"易\", \"辱\", \"析\", \"😊\", \"描\", \"担\", \"脈\", \"構\", \"▼\", \"七\", \"霞\", \"犯\", \"鴻\", \"辛\", \"T\", \"顧\", \"坐\", \"殴\", \"晒\", \"稿\", \"訣\", \"燭\", \"憩\", \"肝\", \"究\", \"偽\", \"鵜\", \"遜\", \"招\", \"容\", \"態\", \"訪\", \"」\", \"理\", \"!\", \"超\", \"ヘ\", \"塩\", \"稀\", \"t\", \"願\", \"\", \"耕\", \"複\", \"向\", \"毎\", \"外\", \"遅\", \"堆\", \"利\", \"欺\", \"嘩\", \"認\", \"命\", \"項\", \"允\", \"ヾ\", \"司\", \"或\", \"籍\", \"蓋\", \"管\", \"話\", \"雀\", \"姫\", \"状\", \"庇\", \"績\", \"❤\", \"帯\", \"益\", \"爆\", \"む\", \"泡\", \"夢\", \"唇\", \"迷\", \"泥\", \"剥\", \"伝\", \"誰\", \"綱\", \"桂\", \"患\", \"夏\", \"智\", \"晴\", \"頬\", \"汚\", \"学\", \"揶\", \"起\", \"番\", \"洒\", \"竹\", \"欽\", \"明\", \"累\", \"破\", \"ァ\", \"讃\", \"瀬\", \"纏\", \"町\", \"彌\", \"六\", \"為\", \"千\", \"茨\", \"J\", \"凌\", \"転\", \"淵\", \"便\", \"隊\", \"餌\", \"ぴ\", \"樹\", \"楼\", \"始\", \"エ\", \"路\", \"幹\", \"枢\", \"軽\", \"医\", \"と\", \"雅\", \"評\", \"現\", \"Д\", \"|\", \"辞\", \"奴\", \"散\", \"妄\", \"換\", \"売\", \"饉\", \"呟\", \"小\", \"沸\", \"返\", \"残\", \"培\", \"賠\", \"具\", \"丼\", \"覧\", \"慎\", \"袖\", \"階\", \"検\", \"フ\", \"輸\", \"Q\", \"峠\", \"億\", \"6\", \"証\", \"膏\", \"搬\", \"…\", \"函\", \"閣\", \"肘\", \"廃\", \"欲\", \"棄\", \"論\", \"求\"]",
"lossless": false
},
"google/switch-c-2048 @ cc100/ko": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1524839,
"_n_tokens": 334457,
"_n_chars": 655190,
"_n_oov_chars": 433242,
"oov_ratio": 0.6612463560188647,
"_oov_charset": "[\"교\", \"帝\", \"백\", \"낚\", \"뵙\", \"와\", \"程\", \"金\", \"프\", \"융\", \"쎄\", \"펀\", \"묻\", \"❏\", \"벼\", \"合\", \"차\", \"之\", \"욜\", \"엇\", \"이\", \"그\", \"튼\", \"林\", \"쏭\", \"딴\", \"튠\", \"솥\", \"某\", \"접\", \"냄\", \"힘\", \"草\", \"눌\", \"⑤\", \"敎\", \"藝\", \"祉\", \"의\", \"된\", \"숫\", \"깅\", \"꿍\", \"朱\", \"녀\", \"數\", \"택\", \"意\", \"슴\", \"퀄\", \"族\", \"숟\", \"事\", \"法\", \"궤\", \"시\", \"첩\", \"웍\", \"과\", \"붐\", \"心\", \"켜\", \"◐\", \"朝\", \"ㅓ\", \"✈\", \"星\", \"友\", \"뤄\", \"☞\", \"납\", \"렌\", \"엔\", \"볶\", \"삣\", \"北\", \"和\", \"캐\", \"콘\", \"쫀\", \"쿰\", \"괌\", \"흘\", \"료\", \"눴\", \"💦\", \"틱\", \"낳\", \"©\", \"녜\", \"헌\", \"識\", \"숨\", \"房\", \"샷\", \"컬\", \"특\", \"▒\", \"띠\", \"짜\", \"밍\", \"🍕\", \"열\", \"授\", \"섹\", \"룩\", \"共\", \"걔\", \"겉\", \"연\", \"家\", \"<\", \"몽\", \"뜯\", \"⚀\", \"ㅕ\", \"돕\", \"난\", \"→\", \"끝\", \"멋\", \"홀\", \"集\", \"첨\", \"웃\", \"章\", \"〉\", \"可\", \"💕\", \"氷\", \"弊\", \"페\", \"돗\", \"잠\", \"쭉\", \"道\", \"계\", \"빡\", \"맺\", \"법\", \"훼\", \"읍\", \"댄\", \"🍰\", \"우\", \"섰\", \"암\", \"메\", \"蒙\", \"풋\", \"딛\", \"㎍\", \"茅\", \"래\", \"갭\", \"첸\", \"빨\", \"미\", \"찬\", \"♥\", \"五\", \"핀\", \"맹\", \"😂\", \"堯\", \"덴\", \"쌉\", \"쓸\", \"史\", \"◑\", \"쓕\", \"쭙\", \"댐\", \"휙\", \"럴\", \"💣\", \"달\", \"껴\", \"米\", \"왓\", \"꿕\", \"歲\", \"헨\", \"·\", \"👍\", \"옵\", \"팡\", \"詠\", \"합\", \"싼\", \"述\", \"올\", \"手\", \"폐\", \"死\", \"띤\", \"닙\", \"假\", \"긁\", \"흩\", \"락\", \"향\", \"뽑\", \"얄\", \"횡\", \"버\", \"램\", \"★\", \"춘\", \"팹\", \"때\", \"벨\", \"텔\", \"음\", \"듣\", \"ㅣ\", \"陽\", \"웬\", \"겐\", \"댈\", \"놀\", \"일\", \"妻\", \"🚿\", \"앗\", \"촘\", \"¹\", \"네\", \"뿜\", \"ㅋ\", \"員\", \"테\", \"ㅎ\", \"貸\", \"춰\", \"볍\", \"立\", \"콩\", \"리\", \"⑹\", \"說\", \"同\", \"탓\", \"徳\", \"춧\", \"悧\", \"콤\", \"박\", \"ⅱ\", \"믹\", \"將\", \"날\", \"입\", \"못\", \"났\", \"年\", \"혈\", \"킨\", \"😗\", \"쳇\", \"툼\", \"맵\", \"게\", \"티\", \"망\", \"쵸\", \"플\", \"큽\", \"킬\", \"옛\", \"正\", \"🙋\", \"튿\", \"끔\", \"適\", \"信\", \"면\", \"⑶\", \"∼\", \"딘\", \"옐\", \"낍\", \"곡\", \"짐\", \"댔\", \"Ⅳ\", \"캠\", \"찔\", \"빅\", \"매\", \"립\", \"專\", \"略\", \"촌\", \"팽\", \"석\", \"쿄\", \"公\", \"굳\", \"辰\", \"갉\", \"쌈\", \"劍\", \"킁\", \"넉\", \"잔\", \"더\", \"▲\", \"城\", \"깡\", \"장\", \"탭\", \"히\", \"구\", \"群\", \"럽\", \"롬\", \"緞\", \"겔\", \"東\", \"뛰\", \"틋\", \"즉\", \"캔\", \"先\", \"無\", \"샹\", \"\", \"🍔\", \"語\", \"㉠\", \"존\", \"생\", \"은\", \"훨\", \"て\", \"깨\", \"빌\", \"로\", \"템\", \"밀\", \"ʟ\", \"핵\", \"」\", \"낭\", \"닫\", \"챔\", \"족\", \"힐\", \"樂\", \"子\", \"愛\", \"擒\", \"웁\", \"끗\", \"쓴\", \"썸\", \"\", \"뜨\", \"뿐\", \"흄\", \"개\", \"꿀\", \"힉\", \"團\", \"쁜\", \"三\", \"윙\", \"셋\", \"鮮\", \"엄\", \"잭\", \"梁\", \"💅\", \"야\", \"혼\", \"맙\", \"겸\", \"첫\", \"년\", \"굿\", \"녕\", \"홍\", \"펄\", \"²\", \"갖\", \"폿\", \"➏\", \"폈\", \"特\", \"😣\", \"갯\", \"율\", \"꺼\", \"짱\", \"둡\", \"♪\", \"극\", \"평\", \"⇒\", \"궐\", \"깜\", \"둑\", \"끓\", \"캘\", \"갑\", \"랫\", \"趺\", \"팟\", \"〮\", \"라\", \"검\", \"공\", \"발\", \"통\", \"홉\", \"튬\", \"옆\", \"다\", \"ㅒ\", \"됨\", \"◀\", \"뺀\", \"쌍\", \"系\", \"탱\", \"種\", \"넵\", \"흑\", \"食\", \"렁\", \"롤\", \"꼭\", \"꿨\", \"디\", \"口\", \"實\", \"맡\", \"・\", \"烏\", \"씬\", \"ㅛ\", \"覆\", \"◆\", \"쭈\", \"安\", \"찜\", \"칠\", \"뚫\", \"꼴\", \"꿇\", \"⑵\", \"昭\", \"됐\", \"앙\", \"퍼\", \"내\", \"ㅏ\", \"활\", \"😭\", \"블\", \"씌\", \"돠\", \"밋\", \"弟\", \"봄\", \"뜰\", \"긋\", \"중\", \"術\", \"濟\", \"묵\", \"컷\", \"펩\", \"多\", \"汰\", \"턴\", \"뻤\", \"싱\", \"짠\", \"ㅠ\", \"빈\", \"맘\", \"흥\", \"洋\", \"途\", \"≫\", \"앵\", \"用\", \"채\", \"찍\", \"選\", \"럼\", \"뭐\", \"징\", \"存\", \"마\", \"혔\", \"널\", \"載\", \"릉\", \"걷\", \"톡\", \"渴\", \"⬇\", \"뭔\", \"面\", \"톰\", \"엣\", \"섞\", \"알\", \"🍞\", \"光\", \"삶\", \"농\", \"쏟\", \"빼\", \"므\", \" \", \"社\", \"亭\", \"쥬\", \"💡\", \"듐\", \"잉\", \"흰\", \"폼\", \"魔\", \"용\", \"륜\", \"쪄\", \"唐\", \"덤\", \"즈\", \"돌\", \"英\", \"덩\", \"왼\", \"文\", \"먹\", \"%\", \"♣\", \"蜀\", \"태\", \"뼈\", \"곶\", \"총\", \"짚\", \"곰\", \"㎞\", \"답\", \"福\", \"멕\", \"넛\", \"웠\", \"해\", \"결\", \"꾸\", \"曆\", \"角\", \"폰\", \"놓\", \"많\", \"직\", \"썩\", \"실\", \"닝\", \"좌\", \"㎥\", \"신\", \"›\", \"水\", \"씨\", \"없\", \"컵\", \":\", \"뺏\", \"뤘\", \"짢\", \"🥁\", \"칭\", \"똘\", \"Ⅷ\", \"뫼\", \"갤\", \"ㅢ\", \"常\", \"룰\", \"즘\", \"익\", \"씀\", \"主\", \"닐\", \"⑸\", \"멘\", \"엑\", \"념\", \"쪼\", \"俠\", \"壞\", \"夜\", \"動\", \"돔\", \"飾\", \"엌\", \"皮\", \"헉\", \"너\", \"玉\", \"殺\", \"왔\", \"ㅔ\", \"ㅑ\", \"싫\", \"뛸\", \"렬\", \"설\", \"交\", \"렀\", \"렘\", \"강\", \"륨\", \"툰\", \"수\", \"캉\", \"仲\", \"퍽\", \"쩐\", \"완\", \"잤\", \"Ⅸ\", \"衡\", \"\", \"👨\", \"콰\", \"맬\", \"휠\", \"엘\", \"갔\", \"증\", \"ㅆ\", \"修\", \"호\", \"판\", \"늘\", \"닦\", \"취\", \"꽁\", \"꼽\", \"劫\", \"딱\", \"\", \"터\", \"떠\", \"관\", \"臺\", \"끼\", \"롱\", \"죠\", \"└\", \"낙\", \"줏\", \"枯\", \"옌\", \"샴\", \"思\", \"봅\", \"世\", \"🍟\", \"담\", \"트\", \"욱\", \"늬\", \"꿰\", \"衛\", \"보\", \"民\", \"읊\", \"옷\", \"깊\", \"병\", \"착\", \"넨\", \"🚨\", \"겟\", \"뱃\", \"◦\", \"깃\", \"💌\", \"笠\", \"쿨\", \"뜬\", \"고\", \"췌\", \"童\", \"빗\", \"〔\", \"무\", \"배\", \"何\", \"瀧\", \"브\", \"밧\", \"】\", \"길\", \"⊙\", \"껑\", \"땀\", \"거\", \"밝\", \"ㅗ\", \"掌\", \"結\", \"렉\", \"ᴏ\", \"노\", \"골\", \"폭\", \"낮\", \"굉\", \"규\", \"튜\", \"價\", \"悖\", \"속\", \"정\", \"및\", \"룹\", \"겪\", \"럿\", \"퀘\", \"썼\", \"굶\", \"겠\", \"사\", \"썬\", \"잎\", \"항\", \"쬐\", \"綃\", \"諒\", \"빕\", \"숍\", \"體\", \"르\", \"*\", \"갈\", \"〈\", \"》\", \"榮\", \"弛\", \"츈\", \"환\", \"밸\", \"Ⅴ\", \"永\", \"샐\", \"같\", \"方\", \"닷\", \"넬\", \"펜\", \"촬\", \"➍\", \"탐\", \"\", \"벅\", \"︎\", \"역\", \"は\", \"침\", \"반\", \"資\", \"쿡\", \"철\", \"申\", \"쥔\", \"留\", \"써\", \"겹\", \"하\", \"긴\", \"킷\", \"떡\", \"氣\", \"오\", \"姜\", \"臥\", \"저\", \"닭\", \"홑\", \"방\", \"反\", \"協\", \"높\", \"~\", \"紋\", \"깥\", \"울\", \"슐\", \"初\", \"룸\", \"냈\", \"ㅜ\", \"꺽\", \"삐\", \"홈\", \"롭\", \"國\", \"릅\", \"雄\", \"跏\", \"🦄\", \"삭\", \"巳\", \"☀\", \"탁\", \"▶\", \"틔\", \"륵\", \"끙\", \"복\", \"🤔\", \"컨\", \"字\", \"촉\", \"譯\", \"멜\", \"쐬\", \"잃\", \"有\", \"험\", \"累\", \"뤼\", \"밴\", \"팬\", \"흐\", \"주\", \"①\", \"픕\", \"會\", \"레\", \"힌\", \"넹\", \"텨\", \"웨\", \"웅\", \"잖\", \"삘\", \"낌\", \"乳\", \"ㅝ\", \"맥\", \"력\", \"拘\", \"㉿\", \"돈\", \"며\", \"소\", \"딜\", \"준\", \"理\", \"동\", \"쏙\", \"吳\", \"능\", \"엿\", \"큰\", \"펼\", \"릿\", \"령\", \"言\", \"出\", \"뜩\", \"렷\", \"拮\", \"데\", \"ㅖ\", \"헝\", \"확\", \"🌳\", \"렐\", \"不\", \"🦅\", \"宮\", \"졸\", \"큐\", \"집\", \"땡\", \"뷔\", \"필\", \"行\", \"벗\", \"킴\", \"혜\", \"릴\", \"엎\", \"냠\", \"챗\", \"륭\", \"ㅚ\", \"飮\", \"톨\", \"古\", \"견\", \"엽\", \"퀸\", \"짝\", \"녘\", \"뚝\", \"뭥\", \"^\", \"응\", \"‧\", \"百\", \"세\", \"뉜\", \"임\", \"胡\", \"農\", \"탈\", \"낯\", \"쉘\", \"ᴍ\", \"雪\", \"아\", \"휩\", \"훗\", \"情\", \"츠\", \"긍\", \"나\", \"졌\", \"탰\", \"심\", \"끌\", \"왜\", \"뮌\", \"ㅈ\", \"째\", \"門\", \"科\", \"체\", \"독\", \"작\", \"@\", \"딪\", \"♡\", \"낫\", \"斗\", \"홋\", \"랐\", \"랍\", \"탠\", \"■\", \"얇\", \"깽\", \"젓\", \"벙\", \"윗\", \"넌\", \"乙\", \"꽂\", \"빚\", \"팅\", \"분\", \"힜\", \"盟\", \"랴\", \"쇼\", \"詔\", \"찢\", \"ㄹ\", \"淨\", \"壽\", \"썰\", \"德\", \"덮\", \"좇\", \"밭\", \"◼\", \"邑\", \"黃\", \"쉰\", \"닮\", \"谷\", \"쎈\", \"겼\", \"젖\", \"젤\", \"켈\", \"參\", \"섣\", \"콥\", \"텅\", \"―\", \"魚\", \"볼\", \"슝\", \"쐐\", \"닉\", \"례\", \"죽\", \"次\", \"목\", \"神\", \"山\", \"뱅\", \"回\", \"퀵\", \"巡\", \"얻\", \"몫\", \"쏜\", \"薄\", \"앨\", \"둥\", \"빴\", \"👋\", \"잘\", \"♤\", \"솜\", \"軍\", \"흡\", \"놈\", \"퀴\", \"京\", \"工\", \"뼘\", \"민\", \"닿\", \"봐\", \"里\", \"텀\", \"셈\", \"감\", \"ㅊ\", \"읽\", \"련\", \"께\", \"才\", \"女\", \"院\", \"경\", \"묘\", \"냉\", \"兄\", \"추\", \"햄\", \"🗺\", \"際\", \"을\", \"책\", \"럭\", \"숲\", \"⋅\", \"槪\", \"s\", \"紀\", \"눔\", \"짓\", \"떄\", \"知\", \"比\", \"陰\", \"왁\", \"힙\", \"故\", \"뽀\", \"원\", \"뻔\", \"↔\", \"樺\", \"펠\", \"빠\", \"😱\", \"金\", \"※\", \"💰\", \"뮤\", \"샌\", \"될\", \"벵\", \"書\", \"守\", \"∙\", \"얀\", \"●\", \"찰\", \"탄\", \"✔\", \"따\", \"앉\", \"龍\", \"격\", \"}\", \"典\", \"쿤\", \"治\", \"곁\", \"워\", \"층\", \"퍙\", \"勢\", \"蟄\", \"끊\", \"發\", \"팰\", \"꽉\", \"궈\", \"헐\", \"에\", \"픔\", \"火\", \"←\", \"곧\", \"액\", \"표\", \"냐\", \"렴\", \"➊\", \"④\", \"꽝\", \"➎\", \"맛\", \"ⅲ\", \"滅\", \"韓\", \"점\", \"相\", \"🤗\", \"쩔\", \"ᴡ\", \"뵐\", \"👏\", \"삼\", \"포\", \"형\", \"북\", \"地\", \"摩\", \"값\", \"짬\", \"뻐\", \"呪\", \"〕\", \"流\", \"뺑\", \"뮐\", \"움\", \"己\", \"삿\", \"귤\", \"당\", \"즙\", \"늦\", \"乃\", \"쏘\", \"닥\", \"美\", \"Ⅱ\", \"投\", \"奉\", \"\\\\\", \"뺐\", \"튀\", \"김\", \"멍\", \"꼈\", \"띈\", \"漢\", \"든\", \"ᴀ\", \"풀\", \"랄\", \"딥\", \"○\", \"빵\", \"題\", \"씽\", \"웹\", \"い\", \"目\", \"善\", \"훅\", \"肉\", \"끄\", \"넷\", \"ω\", \"벚\", \"펑\", \"댓\", \"璿\", \"싶\", \"얕\", \"곤\", \"쉽\", \"악\", \"훈\", \"武\", \"윌\", \"예\", \"걱\", \"진\", \"멤\", \"측\", \"戊\", \"썹\", \"늙\", \"타\", \"◈\", \"렜\", \"』\", \"칼\", \"넣\", \"좀\", \"類\", \"빳\", \"굴\", \"똑\", \"피\", \"헬\", \"넥\", \"榜\", \"陳\", \"쏠\", \"토\", \"픽\", \"좆\", \"十\", \"『\", \"日\", \"②\", \"頭\", \"🔹\", \"哀\", \"ㅇ\", \"똥\", \"獻\", \"랜\", \"쉴\", \"첼\", \"툴\", \"펙\", \"란\", \"둠\", \"±\", \"한\", \"놔\", \"부\", \"헛\", \"祐\", \"밑\", \"샀\", \"샵\", \"す\", \"⑧\", \"렛\", \"□\", \"高\", \"훔\", \"第\", \"갛\", \"쩌\", \"ㄴ\", \"經\", \"유\", \"숭\", \"⑥\", \"땅\", \"μ\", \"맞\", \"大\", \"델\", \"컴\", \"캡\", \"卽\", \"편\", \"텝\", \"봉\", \"土\", \"代\", \"케\", \"봬\", \"鎭\", \"셸\", \"별\", \"햇\", \"洞\", \"굵\", \"好\", \"{\", \"끈\", \"훑\", \"℃\", \"싸\", \"벌\", \"껍\", \"젝\", \"빤\", \"💥\", \"떨\", \"땐\", \"급\", \"月\", \"윈\", \"◾\", \"낸\", \"욕\", \"놨\", \"깝\", \"함\", \"對\", \"육\", \"탬\", \"팜\", \"틈\", \"률\", \"齋\", \"♀\", \"ᴄ\", \"틀\", \"글\", \"풍\", \"늑\", \"를\", \"름\", \"쫗\", \"려\", \"淘\", \"뎀\", \"굽\", \"機\", \"괜\", \"ã\", \"님\", \"客\", \"師\", \"臀\", \"α\", \"꽤\", \"Ⅹ\", \"략\", \"툭\", \"뜻\", \"🍭\", \"껏\", \"적\", \"뉴\", \"ㅁ\", \"敬\", \"良\", \"🏻\", \"변\", \"뗀\", \"쨍\", \"⑦\", \"톱\", \"天\", \"ㅐ\", \"孝\", \"춥\", \"峙\", \"털\", \"液\", \"짙\", \"쿼\", \"퓨\", \"팝\", \"빙\", \"랬\", \"핑\", \"억\", \"윤\", \"팥\", \"앞\", \"被\", \"금\", \"課\", \"㏊\", \"들\", \"몇\", \"균\", \"으\", \"애\", \"ㅍ\", \"짊\", \"렵\", \"멸\", \"혁\", \"잦\", \"쾨\", \"쪽\", \"곽\", \"宗\", \"객\", \"덕\", \"邦\", \"×\", \"믐\", \"았\", \"귈\", \"ⓒ\", \"듭\", \"베\", \"荻\", \"식\", \"野\", \"허\", \"산\", \"듬\", \"텍\", \"ʏ\", \"뜸\", \"괴\", \"만\", \"춤\", \"衣\", \"옴\", \"헤\", \"엉\", \"ㅟ\", \"떴\", \"퇴\", \"🤕\", \"딧\", \"女\", \"텁\", \"商\", \"두\", \"떳\", \"온\", \"줄\", \"싯\", \"갚\", \"「\", \"냅\", \"눅\", \"재\", \"팠\", \"잣\", \"출\", \"抗\", \"所\", \"챙\", \"지\", \"솨\", \"흙\", \"줌\", \"웰\", \"휴\", \"돋\", \"樂\", \"괄\", \"【\", \"解\", \"廟\", \"얘\", \"흉\", \"왠\", \"엠\", \"꾼\", \"犬\", \"런\", \"눈\", \"습\", \"훌\", \"번\", \"얏\", \"창\", \"깔\", \"붕\", \"望\", \"紙\", \"킵\", \"짤\", \"챌\", \"離\", \"권\", \"貿\", \"색\", \"찾\", \"션\", \"ⅳ\", \"혀\", \"病\", \"☆\", \"卒\", \"서\", \"뭉\", \"약\", \"곱\", \"폴\", \"眞\", \"序\", \"깐\", \"맴\", \"잰\", \"➌\", \"뛴\", \"Ⅲ\", \"덜\", \"륙\", \"학\", \"밟\", \"렸\", \"中\", \"性\", \"천\", \"짧\", \"蚩\", \"앎\", \"킌\", \"原\", \"했\", \"🏷\", \"츄\", \"초\", \"뎅\", \"궜\", \"논\", \"⁴\", \"푼\", \"퀀\", \"▣\", \"🌵\", \"후\", \"ᴛ\", \"랩\", \"鐘\", \"♧\", \"문\", \"君\", \"🙌\", \"러\", \"ɪ\", \"넘\", \"엡\", \"룡\", \"셰\", \"뽐\", \"셨\", \"잇\", \"否\", \"ㅙ\", \"뀐\", \"캇\", \"뻑\", \"婚\", \"↑\", \"간\", \"下\", \"화\", \"靈\", \"뉘\", \"남\", \"技\", \"코\", \"뒀\", \"쒀\", \"秋\", \"至\", \"상\", \"즌\", \"魯\", \"人\", \"《\", \"化\", \"ㅘ\", \"自\", \"닳\", \"銀\", \"王\", \"척\", \"낱\", \"랑\", \"射\", \"部\", \"떼\", \"얼\", \"海\", \"청\", \"者\", \"씩\", \"앱\", \"琪\", \"승\", \"였\", \"갱\", \"싣\", \"충\", \"陸\", \"닌\", \"샤\", \"八\", \"혐\", \"듯\", \"삽\", \"컸\", \"팁\", \"屠\", \"팍\", \"녔\", \"쾌\", \"§\", \"얽\", \"걀\", \"둘\", \"단\", \"學\", \"팎\", \"康\", \"슷\", \"後\", \"改\", \"쩍\", \"窮\", \"➋\", \"염\", \"ᴇ\", \"쇄\", \"릇\", \"贖\", \"퉁\", \"대\", \"靑\", \"롸\", \"璣\", \"벤\", \"언\", \"🤭\", \"標\", \"카\", \"獨\", \"혹\", \"甲\", \"치\", \"핍\", \"칸\", \"잴\", \"ⅰ\", \"꾀\", \"業\", \"⑨\", \"制\", \"直\", \"둬\", \"여\", \"손\", \"長\", \"◎\", \"인\", \"픈\", \"앤\", \"內\", \"ㅅ\", \"횟\", \"禮\", \"쁠\", \"앓\", \"謝\", \"었\", \"옹\", \"또\", \"탑\", \"봇\", \"包\", \"v\", \"雲\", \"쳐\", \"毛\", \"업\", \"穀\", \"묶\", \"캄\", \"㉰\", \"맑\", \"퓰\", \"上\", \"국\", \"쌀\", \"샬\", \"≤\", \"뚜\", \"御\", \"섦\", \"觸\", \"軒\", \"튄\", \"협\", \"것\", \"드\", \"잼\", \"늄\", \"순\", \"然\", \"料\", \"벽\", \"③\", \"기\", \"↕\", \"。\", \"자\", \"色\", \"白\", \"쌩\", \"`\", \"명\", \"폄\", \"쯤\", \"룬\", \"근\", \"뭘\", \"즐\", \"람\", \"新\", \"등\", \"월\", \"뮬\", \"막\", \"붓\", \"밖\", \"全\", \"そ\", \"쫒\", \"밌\", \"건\", \"콕\", \"皇\", \"릎\", \"랙\", \"뀌\", \"宋\", \"슛\", \"섯\", \"걸\", \"春\", \"불\", \"품\", \"찌\", \"죄\", \"쁨\", \"덟\", \"귀\", \"ń\", \"毒\", \"꼬\", \"\", \"론\", \"얍\", \"뿌\", \"믄\", \"�\", \"藥\", \"ㆍ\", \"찼\", \"조\", \"․\", \"쩡\", \"關\", \"참\", \"섭\", \"的\", \"△\", \"🙆\", \"꺄\", \"까\", \"잊\", \"커\", \"뱉\", \"듈\", \"앰\", \"숏\", \"칙\", \"군\", \"닛\", \"뇨\", \"節\", \"땠\", \"分\", \"칵\", \"雙\", \"옮\", \"핏\", \"운\", \"젠\", \"꿔\", \"푸\", \"안\", \"띕\", \"봤\", \"∮\", \"펌\", \"숯\", \"쁘\", \"되\", \"一\", \"둔\", \"록\", \"쑤\", \"덥\", \"욥\", \"믿\", \"살\", \"致\", \"콜\", \"딤\", \"◇\", \"겁\", \"時\", \"九\", \"驚\", \"應\", \"係\", \"聖\", \"숱\", \"㎡\", \"Ⅶ\", \"빛\", \"켤\", \"?\", \"솔\", \"렇\", \"회\", \"뿍\", \"궁\", \"림\", \"像\", \"텐\", \"▷\", \"스\", \"턱\", \"堂\", \"있\", \"팔\", \"ㄱ\", \"줘\", \"🌿\", \"間\", \"루\", \"촛\", \"떤\", \"처\", \"몰\", \"져\", \"極\", \"뒤\", \"💸\", \"뇌\", \"득\", \"투\", \"㈜\", \"賣\", \"쇠\", \"華\", \"클\", \"🍎\", \"위\", \"녁\", \"칫\", \"붉\", \"됬\", \"꽃\", \"녹\", \"️\", \"\", \"仁\", \"씹\", \"질\", \"끽\", \"밤\", \"큼\", \"누\", \"燦\", \"가\", \"‥\", \"셀\", \"峰\", \"키\", \"갇\", \"し\", \"↓\", \"「\", \"冬\", \"걍\", \"不\", \"⑴\", \"멈\", \"布\", \"俗\", \"핸\", \"뿔\", \"흔\", \"행\", \"새\", \"尤\", \"효\", \"광\", \"롯\", \"좋\", \"뮈\", \"警\", \"能\", \"亨\", \"샘\", \"챨\", \"각\", \"갓\", \"川\", \"랭\", \"옥\", \"엮\", \"펴\", \"南\", \"居\", \"駐\", \"志\", \"최\", \"쨌\", \"몬\", \"찮\", \"戌\", \"龍\", \"슬\", \"쟁\", \"戮\", \"븐\", \"흗\", \"톤\", \"양\", \"曰\", \"핫\", \"셔\", \"寛\", \"쉼\", \"듀\", \"링\", \"🏫\", \"옳\", \"뜹\", \"숙\", \"셜\", \"켰\", \"쥰\", \"눠\", \"떻\", \"Ⅰ\", \"십\", \"🤟\", \"界\", \"팀\", \"흠\", \"셌\", \"느\", \"싹\", \"량\", \"ⓔ\", \"비\", \"눕\", \"젊\", \"平\", \"男\", \"뀔\", \" \", \"政\", \"않\", \"拜\", \"짖\", \"뾱\", \"쫓\", \"쿠\", \"얹\", \"섬\", \"벳\", \"솟\", \"立\", \"껀\", \"副\", \"밉\", \"脱\", \"캣\", \"겨\", \"뭇\", \"던\", \"슨\", \"쌓\", \"송\", \"쟈\", \"낄\", \"냥\", \"썅\", \"슈\", \"罰\", \"≪\", \"범\", \"절\", \"낀\", \"볕\", \"韜\", \"맨\", \"江\", \"댁\", \"른\", \"물\", \"Ⅵ\", \"틸\", \"津\", \"몸\", \"쾅\", \"틴\", \"린\", \"生\", \"쓰\", \"킹\", \"뷰\", \"峴\", \"딩\", \"씻\", \"켄\", \"축\", \"띄\", \"니\", \"革\", \"파\", \"밥\", \"멀\", \"폍\", \"易\", \"析\", \"뒷\", \"쳤\", \"😊\", \"받\", \"휘\", \"▼\", \"七\", \"넓\", \"쉬\", \"먼\", \"變\", \"坐\", \"붙\", \"쟤\", \"燭\", \"술\", \"팩\", \"훠\", \"몹\", \"」\", \"말\", \"성\", \"쿵\", \"理\", \"희\", \"크\", \"耕\", \"제\", \"向\", \"패\", \"할\", \"현\", \"전\", \"外\", \"선\", \"利\", \"㉣\", \"命\", \"셉\", \"췄\", \"왘\", \"籍\", \"ㅡ\", \"쑥\", \"管\", \"❍\", \"릭\", \"켓\", \"요\", \"❤\", \"영\", \"쫄\", \"본\", \"됩\", \"어\", \"탕\", \"촨\", \"왕\", \"🙇\", \"\", \"친\", \"맷\", \"쯔\", \"濁\", \"竹\", \"明\", \"꿈\", \"줬\", \"뱀\", \"류\", \"잡\", \"ㄷ\", \"칩\", \"켐\", \"빔\", \"六\", \"바\", \"쫑\", \"황\", \"곳\", \"머\", \"樹\", \"는\", \"줍\", \"핥\", \"始\", \"낼\", \"ㅞ\", \"侯\", \"딸\", \"압\", \"죤\", \"現\", \"덧\", \"|\", \"모\", \"換\", \"웖\", \"짭\", \"낡\", \"좁\", \"푹\", \"켠\", \"센\", \"획\", \"도\", \"쥐\", \"뻗\", \"誡\", \"외\", \"종\", \"☎\", \"…\", \"꺾\", \"돼\", \"깁\", \"킥\", \"뢰\", \"論\", \"求\"]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ar": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2813283,
"_n_tokens": 615514,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/de": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1814876,
"_n_tokens": 499766,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/fa": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2054052,
"_n_tokens": 387448,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ja": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1774770,
"_n_tokens": 414715,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ko": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1524839,
"_n_tokens": 412595,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/chinese-alpaca-lora-7b @ cc100/ar": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 2813283,
"_n_tokens": 1411469,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/de": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1814876,
"_n_tokens": 513706,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/fa": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 2054052,
"_n_tokens": 1140740,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/ja": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1774770,
"_n_tokens": 604112,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/ko": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1524839,
"_n_tokens": 903453,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/ar": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/de": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1814876,
"_n_tokens": 527318,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/fa": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 2054052,
"_n_tokens": 1145078,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/ja": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1774770,
"_n_tokens": 614367,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-2-7b @ cc100/ko": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1524839,
"_n_tokens": 953427,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/ar": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 2813283,
"_n_tokens": 1411469,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/de": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1814876,
"_n_tokens": 513706,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/fa": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 2054052,
"_n_tokens": 1140740,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/ja": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1774770,
"_n_tokens": 604112,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/chinese-llama-lora-7b @ cc100/ko": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1524839,
"_n_tokens": 903453,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hfl/llama-3-chinese-8b @ cc100/ar": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 2813283,
"_n_tokens": 614186,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/de": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1814876,
"_n_tokens": 499766,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/fa": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 2054052,
"_n_tokens": 384591,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/ja": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1774770,
"_n_tokens": 414715,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hfl/llama-3-chinese-8b @ cc100/ko": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1524839,
"_n_tokens": 412433,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"hpcai-tech/grok-1 @ cc100/ar": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 2813283,
"_n_tokens": 1392088,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/de": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1814876,
"_n_tokens": 505220,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/fa": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 2054052,
"_n_tokens": 1073281,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/ja": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1774770,
"_n_tokens": 497590,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"hpcai-tech/grok-1 @ cc100/ko": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1524839,
"_n_tokens": 1152005,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/ar": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/de": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/fa": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/ja": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"huggyllama/llama-7b @ cc100/ko": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm-chat-7b @ cc100/ar": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2813283,
"_n_tokens": 522046,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/de": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1814876,
"_n_tokens": 570489,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/fa": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2054052,
"_n_tokens": 630945,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/ja": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1774770,
"_n_tokens": 438212,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-chat-7b @ cc100/ko": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1524839,
"_n_tokens": 829609,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/ar": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2813283,
"_n_tokens": 522046,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/de": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1814876,
"_n_tokens": 570489,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/fa": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2054052,
"_n_tokens": 630945,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/ja": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1774770,
"_n_tokens": 438212,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm-xcomposer-7b @ cc100/ko": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1524839,
"_n_tokens": 829609,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"internlm/internlm2-chat-7b @ cc100/ar": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2813283,
"_n_tokens": 1625378,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/de": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1814876,
"_n_tokens": 573917,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/fa": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2054052,
"_n_tokens": 1185032,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/ja": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1774770,
"_n_tokens": 585803,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-chat-7b @ cc100/ko": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1524839,
"_n_tokens": 998524,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/ar": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2813283,
"_n_tokens": 1625378,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/de": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1814876,
"_n_tokens": 573917,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/fa": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2054052,
"_n_tokens": 1185032,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/ja": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1774770,
"_n_tokens": 585803,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"internlm/internlm2-math-7b @ cc100/ko": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1524839,
"_n_tokens": 998524,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/ar": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 2813283,
"_n_tokens": 822267,
"_n_chars": 1560987,
"_n_oov_chars": 1248838,
"oov_ratio": 0.8000310060237529,
"_oov_charset": "[\"α\", \"ﷺ\", \"ﻻ\", \"😊\", \"٦\", \"۲\", \"ع\", \"ί\", \"ذ\", \"ﻹ\", \"~\", \"
\", \"۷\", \"▪\", \"٩\", \"‹\", \"ي\", \"۸\", \"د\", \"٣\", \"ى\", \"ة\", \"ن\", \"ب\", \"پ\", \"ض\", \"٥\", \"⤴\", \"ح\", \"ی\", \"غ\", \"¡\", \"۰\", \"ط\", \"ء\", \"،\", \"٪\", \"ۚ\", \"😀\", \"چ\", \"ك\", \"♥\", \"κ\", \"ۗ\", \"½\", \"ٹ\", \"ظ\", \"\", \"🙂\", \"ک\", \"χ\", \"آ\", \"ّ\", \"ـ\", \"ٌ\", \"×\", \"←\", \"إ\", \"ٰ\", \"َ\", \"ئ\", \"ْ\", \"›\", \"٠\", \"τ\", \"↩\", \"﴾\", \"ج\", \"ۖ\", \"μ\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"▫\", \"ُ\", \"ِ\", \"٧\", \"؟\", \"Х\", \"ٱ\", \"\", \"η\", \"″\", \"ث\", \"ρ\", \"©\", \"ή\", \"ﻷ\", \"ل\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"ز\", \"ۤ\", \"ص\", \"ؤ\", \"\", \"م\", \"\", \"ر\", \"ا\", \"س\", \"ق\", \"﴿\", \"ه\", \"…\", \"�\", \"ف\", \"؛\", \"█\", \"ھ\", \"و\", \"\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/de": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1814876,
"_n_tokens": 726989,
"_n_chars": 1784021,
"_n_oov_chars": 1930,
"oov_ratio": 0.0010818258305255375,
"_oov_charset": "[\"α\", \"\", \"‚\", \"→\", \"\", \"Ã\", \"▼\", \" \", \"ί\", \"Á\", \"̈\", \"~\", \"™\", \"¼\", \"\", \"‹\", \"å\", \"ς\", \"¶\", \"œ\", \"♡\", \"ú\", \"≠\", \"ā\", \"ớ\", \"¤\", \"😀\", \"♥\", \"🙁\", \"😂\", \"ε\", \"ï\", \"😃\", \"½\", \"🙂\", \"❤\", \"ư\", \"´\", \"😉\", \"Ø\", \"↑\", \"·\", \"›\", \"😈\", \"τ\", \"↩\", \"ć\", \"‐\", \"😢\", \"¬\", \"★\", \"−\", \"š\", \"\", \"İ\", \"ø\", \"¹\", \"ė\", \"Ÿ\", \"‽\", \"Ä\", \"ρ\", \"©\", \"➔\", \"😦\", \"ι\", \"\", \"☺\", \"č\", \"\", \"§\", \"ń\", \"😆\", \"♦\", \"¿\", \"…\", \"�\", \"Ö\", \"²\", \"🙄\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/fa": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 2054052,
"_n_tokens": 702443,
"_n_chars": 1145876,
"_n_oov_chars": 898585,
"oov_ratio": 0.7841904359634027,
"_oov_charset": "[\"۲\", \"ع\", \"ذ\", \"۷\", \"ژ\", \"٩\", \"ٔ\", \"ي\", \"۱\", \"د\", \"۸\", \"٣\", \"ى\", \"ة\", \"ۀ\", \"ن\", \"◄\", \"ب\", \"پ\", \"●\", \"ض\", \"٥\", \"ב\", \"ح\", \"ی\", \"غ\", \"۰\", \"ء\", \"ط\", \"✿\", \"،\", \"٪\", \"چ\", \"ك\", \"۔\", \"♥\", \"ט\", \"ڪ\", \"ے\", \"ظ\", \"\", \"❤\", \"ک\", \"آ\", \"ّ\", \"ـ\", \"×\", \"ٌ\", \"ﮧ\", \"۴\", \"إ\", \"ּ\", \"َ\", \"ئ\", \"·\", \"ْ\", \"›\", \"٠\", \"٫\", \"\", \"ج\", \"أ\", \"٢\", \"ش\", \"ٍ\", \"ۆ\", \"ُ\", \"★\", \"ٴ\", \"ِ\", \"٧\", \"؟\", \"\", \"ث\", \"۵\", \"▐\", \"©\", \"ل\", \"️\", \"\", \"٨\", \"٤\", \"١\", \"ت\", \"خ\", \"ً\", \"۶\", \"ز\", \"۳\", \"ص\", \"۹\", \"ؤ\", \"\", \"م\", \"ر\", \"ا\", \"س\", \"ق\", \"ه\", \"…\", \"�\", \"ف\", \"؛\", \"ھ\", \"گ\", \"و\", \"\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/ja": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1774770,
"_n_tokens": 43915,
"_n_chars": 603065,
"_n_oov_chars": 585664,
"oov_ratio": 0.9711457305597241,
"_oov_charset": "[\"窃\", \"模\", \"径\", \"傍\", \"゙\", \"―\", \"置\", \"忙\", \"ぉ\", \"r\", \"尿\", \"愉\", \"徴\", \"裸\", \"遵\", \"妨\", \"蔑\", \"詳\", \"捕\", \"猛\", \"揺\", \"晶\", \"汎\", \"墓\", \"唸\", \"鍋\", \"鹿\", \"不\", \"妥\", \"斑\", \"晒\", \"非\", \"童\", \"粋\", \"腐\", \"歳\", \"ス\", \"迦\", \"▽\", \"ロ\", \"泌\", \"麓\", \"見\", \"舗\", \"眺\", \"濃\", \"へ\", \"尊\", \"悩\", \"淵\", \"ず\", \"郷\", \"訓\", \"前\", \"皿\", \"馬\", \"境\", \"逸\", \"区\", \"練\", \"季\", \"牛\", \"捺\", \"嗜\", \"砦\", \"陥\", \"球\", \"稿\", \"顎\", \"洗\", \"欽\", \"捧\", \"的\", \"Ⅹ\", \"贈\", \"役\", \"婦\", \"激\", \"背\", \"空\", \"殻\", \"套\", \"円\", \"∀\", \"陛\", \"贋\", \"更\", \"譜\", \"津\", \"荻\", \"牲\", \"﨑\", \"獄\", \"六\", \"笠\", \"プ\", \"個\", \"操\", \"臆\", \"土\", \"幼\", \"4\", \"J\", \"庭\", \"蝶\", \"本\", \"版\", \"秋\", \"恐\", \"借\", \"乾\", \"盛\", \"範\", \"倭\", \"塞\", \"憧\", \"障\", \"易\", \"茫\", \"束\", \"梯\", \"裁\", \"錬\", \"修\", \"栽\", \"呑\", \"疾\", \"了\", \"祠\", \"票\", \"羞\", \"ヾ\", \"妊\", \"趨\", \"屓\", \"讐\", \"丈\", \"祖\", \"服\", \"預\", \"便\", \"堪\", \"爆\", \"績\", \"毅\", \"興\", \"恨\", \"猟\", \"聖\", \"魅\", \"傾\", \"糸\", \"符\", \"節\", \"嘗\", \"官\", \"垂\", \"○\", \"痴\", \"苗\", \"恋\", \"仁\", \"頷\", \"ょ\", \"暫\", \"股\", \"五\", \"寿\", \"容\", \"努\", \"移\", \"徊\", \"肺\", \"企\", \"思\", \"摯\", \"届\", \"[\", \"提\", \"滓\", \"叶\", \"煽\", \"劣\", \"流\", \"後\", \"臥\", \"L\", \"令\", \"梶\", \"白\", \"怒\", \"催\", \"嫡\", \"ハ\", \"辣\", \"脅\", \"存\", \"韮\", \"兄\", \"沢\", \"殿\", \"撤\", \"専\", \"昨\", \"衡\", \"撲\", \"伸\", \"氷\", \"咽\", \"韓\", \";\", \"世\", \"匿\", \"洒\", \"交\", \"薩\", \"盆\", \"尚\", \"讃\", \"罵\", \"っ\", \"腔\", \"察\", \"変\", \"材\", \"名\", \"?\", \"逡\", \"肌\", \"就\", \"君\", \"懇\", \"古\", \"守\", \"担\", \"算\", \"棲\", \"篇\", \"汁\", \"画\", \"亮\", \"綬\", \"轄\", \"猿\", \"応\", \"確\", \"布\", \"泥\", \"販\", \"穫\", \"住\", \"妻\", \"形\", \"鼓\", \"麦\", \"潰\", \"日\", \"従\", \"代\", \"昧\", \"捜\", \"ぅ\", \"末\", \"膿\", \"視\", \"怪\", \"遼\", \"失\", \"棒\", \"\", \"咳\", \"酔\", \"緻\", \"桑\", \"訟\", \"垠\", \"期\", \"憎\", \"デ\", \"児\", \"枢\", \"掘\", \"瞳\", \"千\", \"祭\", \"盟\", \"呟\", \"宜\", \"譚\", \"狼\", \"帝\", \"抑\", \"諦\", \"件\", \"浮\", \"監\", \"芳\", \"漢\", \"が\", \"召\", \"拭\", \"民\", \"卓\", \"響\", \"ロ\", \"経\", \"丁\", \"テ\", \"秘\", \"弱\", \"》\", \"嘆\", \"貼\", \"絵\", \"誹\", \"X\", \"素\", \"詰\", \"蓋\", \"瑞\", \"塊\", \"録\", \"備\", \"滅\", \"狩\", \"7\", \"幻\", \"耳\", \"餓\", \"杞\", \"紐\", \"甘\", \"臓\", \"致\", \"曝\", \"郵\", \"頻\", \"喚\", \"焦\", \"請\", \"脆\", \"隙\", \"復\", \"拝\", \"幣\", \"虚\", \"公\", \"漂\", \"花\", \"甥\", \"射\", \"嘲\", \"②\", \"探\", \"陰\", \"翻\", \"叭\", \"ぇ\", \"分\", \"辱\", \"幌\", \"k\", \"倍\", \"徨\", \"港\", \"貸\", \"^\", \"二\", \"恵\", \"班\", \"浩\", \"帯\", \"自\", \"傑\", \"鳴\", \"孝\", \"ル\", \"酬\", \"揄\", \"恭\", \"登\", \"甚\", \"順\", \"械\", \"痛\", \"肪\", \"貯\", \"法\", \"星\", \"尋\", \"∇\", \"話\", \"虜\", \"ゆ\", \"説\", \"雅\", \"告\", \"希\", \"◆\", \"✧\", \"峨\", \"9\", \"亀\", \"厨\", \"ナ\", \"塾\", \"辿\", \"彙\", \"~\", \"賀\", \"慰\", \"滴\", \"友\", \"月\", \"錠\", \"軋\", \"鋲\", \")\", \"伝\", \"難\", \"汗\", \"圏\", \"続\", \"督\", \"喜\", \"向\", \"惨\", \"覆\", \"慌\", \"累\", \"点\", \"秒\", \"嵌\", \"ゾ\", \"\\b\", \"暖\", \"憂\", \"燭\", \"豊\", \"フ\", \"劉\", \"ク\", \"井\", \"ほ\", \"疲\", \"雲\", \"閃\", \"腎\", \"到\", \"↓\", \"さ\", \"梨\", \"旨\", \"信\", \"秤\", \"倫\", \"篤\", \"譲\", \"喰\", \"m\", \"片\", \"由\", \"o\", \"唇\", \"鎖\", \"酒\", \"永\", \"阪\", \"敷\", \"K\", \"ま\", \"弄\", \"逮\", \"よ\", \"S\", \"蔽\", \"常\", \"割\", \"逼\", \"量\", \"吾\", \"独\", \"簗\", \"肘\", \"治\", \"久\", \"胸\", \"廊\", \"侮\", \"恩\", \"華\", \"欺\", \"て\", \"将\", \"雑\", \"ち\", \"十\", \"我\", \"殴\", \"封\", \"偉\", \"E\", \"脂\", \"祇\", \"△\", \"吟\", \"箋\", \"減\", \"忘\", \"盗\", \"昇\", \"例\", \"拾\", \"主\", \"ミ\", \"醐\", \"憩\", \"河\", \"車\", \"紋\", \"婚\", \"ェ\", \"序\", \"F\", \"争\", \"ヨ\", \"薪\", \"ぐ\", \"兆\", \"警\", \"欠\", \"峠\", \"少\", \"雀\", \"挫\", \"党\", \"殺\", \"脈\", \"験\", \"俸\", \"参\", \"受\", \"債\", \"芝\", \"江\", \"談\", \"青\", \"噂\", \"替\", \"訴\", \"併\", \"杖\", \"品\", \"。\", \"焼\", \"岬\", \"ギ\", \"逆\", \"勿\", \"銘\", \"虐\", \"納\", \"維\", \"l\", \"メ\", \"涼\", \"転\", \"剣\", \"運\", \"救\", \"寮\", \"宣\", \"コ\", \"功\", \"褒\", \"カ\", \"越\", \"顕\", \"剰\", \"鍛\", \"匡\", \"愕\", \"時\", \"漬\", \"繊\", \"ぱ\", \"遥\", \"わ\", \"泣\", \"暑\", \"衰\", \"壌\", \"睦\", \"霞\", \"斉\", \"♡\", \"缶\", \"仕\", \"文\", \"程\", \"鎌\", \"狭\", \"漱\", \"Y\", \"ピ\", \"互\", \"療\", \"エ\", \"ュ\", \"凪\", \"む\", \"何\", \"袋\", \"挿\", \"網\", \"航\", \"嘘\", \"枚\", \"\\", \"濯\", \"」\", \"暴\", \"刑\", \"賞\", \"忍\", \"拓\", \"蝋\", \"国\", \"閣\", \"臨\", \"筒\", \"炎\", \"鎮\", \"遙\", \"建\", \"珍\", \"訊\", \"啜\", \"補\", \"犠\", \"噴\", \"均\", \"辞\", \"言\", \"拉\", \"動\", \"恥\", \"物\", \"奏\", \"梓\", \"⌒\", \"纏\", \"巧\", \"國\", \"使\", \"融\", \"唐\", \"注\", \"斗\", \"図\", \"ど\", \"等\", \"輔\", \"舌\", \"悲\", \"開\", \"豪\", \"購\", \" ̄\", \"活\", \"魚\", \"御\", \"輿\", \"優\", \"逐\", \"べ\", \"麺\", \"家\", \"垢\", \"遜\", \"貶\", \"ぴ\", \"宋\", \"詮\", \"唆\", \"祝\", \"髭\", \"吠\", \"灼\", \"縛\", \"๑\", \"窪\", \"か\", \"ォ\", \"底\", \"竜\", \"簿\", \"倉\", \",\", \"木\", \"矢\", \"儀\", \"混\", \"截\", \"身\", \"−\", \"之\", \"苑\", \"婆\", \"膏\", \"張\", \"披\", \"環\", \"低\", \"織\", \"柏\", \"⇔\", \"院\", \"成\", \"較\", \"殲\", \"園\", \"駆\", \"や\", \"拒\", \"頬\", \"距\", \"啓\", \"約\", \"阿\", \"ダ\", \"奴\", \"恒\", \"堵\", \"斡\", \"石\", \"駐\", \"躊\", \"″\", \"迭\", \"極\", \"諏\", \"性\", \"藁\", \"縄\", \"影\", \"菊\", \"冊\", \"寡\", \"磯\", \"須\", \"じ\", \"ム\", \"陸\", \"椒\", \"買\", \"真\", \"風\", \"付\", \"庶\", \"間\", \"示\", \"宗\", \"升\", \"磋\", \"杯\", \"起\", \"《\", \"厄\", \"灘\", \"兎\", \"著\", \"偏\", \"崩\", \"恣\", \"鵜\", \"ブ\", \"慣\", \"蛍\", \"①\", \"多\", \"息\", \"屈\", \"�\", \"終\", \"訃\", \"雰\", \"④\", \"姫\", \"俄\", \"ぎ\", \"腰\", \"畳\", \"覚\", \"層\", \"也\", \"舞\", \"で\", \"ε\", \"油\", \"ゎ\", \"罰\", \"義\", \"圃\", \"坊\", \"冥\", \"匙\", \"飼\", \"-\", \"隅\", \"穀\", \"炒\", \"羽\", \"務\", \"輝\", \"売\", \"彿\", \"辺\", \"寄\", \"訣\", \"ω\", \"料\", \"厚\", \"疑\", \"砕\", \"価\", \"淳\", \"尾\", \"釈\", \"弁\", \"稀\", \"欲\", \"枕\", \"指\", \"律\", \"貞\", \"各\", \"新\", \"ィ\", \"雷\", \"坪\", \"菜\", \"徘\", \"送\", \"脚\", \"坂\", \"鳥\", \"ゼ\", \"舘\", \"廉\", \"彦\", \"諸\", \"再\", \"索\", \"=\", \"冷\", \"\", \"綻\", \"奮\", \"館\", \"連\", \"〜\", \"磨\", \"収\", \"営\", \"レ\", \"元\", \"ぽ\", \"男\", \"夏\", \"資\", \"鋭\", \"蒔\", \"チ\", \"柔\", \"レ\", \"囲\", \"茨\", \"課\", \"礎\", \"又\", \"闘\", \"氏\", \"③\", \"覇\", \"殆\", \"市\", \"岸\", \"週\", \"賠\", \"袖\", \"尖\", \"を\", \"巣\", \"賃\", \"鱈\", \"押\", \"廃\", \"眉\", \"板\", \"i\", \"弓\", \"ノ\", \"騒\", \"氾\", \"埃\", \"様\", \"同\", \"妖\", \"酵\", \"巻\", \"面\", \"良\", \"斂\", \"城\", \"乏\", \"…\", \"配\", \"峰\", \"謄\", \"年\", \"谷\", \"式\", \"読\", \"狂\", \"y\", \"痢\", \"撒\", \"意\", \"妄\", \"血\", \"総\", \"⑩\", \"貝\", \"廻\", \"曰\", \"〆\", \"き\", \"ラ\", \"髪\", \"唄\", \"哀\", \"猶\", \"類\", \"帽\", \"浪\", \"汚\", \"倒\", \"渦\", \"唾\", \"旺\", \"幾\", \"線\", \"彫\", \"喉\", \"審\", \"←\", \"必\", \"政\", \"所\", \"鶴\", \"欣\", \"痒\", \"謂\", \"半\", \"め\", \"う\", \"宝\", \"微\", \"瓶\", \"t\", \"す\", \"ね\", \"潟\", \"依\", \"渕\", \"敵\", \"曲\", \"洞\", \"釜\", \"端\", \"授\", \"講\", \"祈\", \"⻑\", \"痩\", \"眩\", \"斜\", \"称\", \"与\", \"源\", \"瞑\", \"舟\", \"楚\", \"軒\", \"』\", \"諾\", \"僕\", \"慄\", \"村\", \"病\", \"囚\", \"□\", \"尺\", \"梱\", \"萎\", \"丹\", \"毒\", \"化\", \"ィ\", \"還\", \"践\", \"蒸\", \"機\", \"菌\", \"当\", \"香\", \"呆\", \"顧\", \"駒\", \"貫\", \"卒\", \"演\", \"戦\", \"づ\", \"暗\", \"扱\", \"漏\", \"軍\", \"密\", \"削\", \"学\", \"筈\", \"承\", \"マ\", \"粗\", \"険\", \"下\", \"閑\", \"毎\", \"属\", \"拳\", \"亜\", \"工\", \"陽\", \"座\", \"鏡\", \"術\", \"女\", \"ネ\", \"喫\", \"体\", \"た\", \"凌\", \"平\", \"具\", \"双\", \"万\", \"膨\", \"罪\", \"焙\", \"癖\", \"槌\", \"清\", \"O\", \"擁\", \"美\", \"事\", \"客\", \"楼\", \"窒\", \"\", \"樹\", \"供\", \"邪\", \"悔\", \"寸\", \"百\", \"直\", \"力\", \"紅\", \"洪\", \"ワ\", \"奉\", \"犯\", \"尽\", \"熱\", \"跨\", \"懐\", \"邸\", \"尻\", \"導\", \"口\", \"壬\", \"穴\", \"捩\", \"く\", \"澤\", \"f\", \"労\", \"豚\", \"典\", \"岳\", \"悟\", \"莫\", \"康\", \"獲\", \"継\", \"炉\", \"組\", \"醍\", \"随\", \"太\", \"勤\", \"謎\", \"晴\", \"腑\", \"然\", \"折\", \"情\", \"違\", \"浜\", \"閲\", \"摩\", \"固\", \"準\", \"け\", \"銀\", \"俳\", \"伯\", \"試\", \"獣\", \"増\", \"勇\", \"超\", \"誇\", \"照\", \"己\", \"泡\", \"台\", \"翔\", \"漫\", \"午\", \"制\", \"骨\", \"淫\", \"度\", \"辰\", \"‼\", \"墟\", \"出\", \"能\", \"札\", \"り\", \"ポ\", \"州\", \"透\", \"招\", \"玉\", \"瘍\", \"択\", \"膜\", \"三\", \"解\", \"垣\", \"塔\", \"貌\", \"植\", \"些\", \"̈\", \"玄\", \"電\", \"議\", \"揉\", \"【\", \"姜\", \"進\", \"完\", \"✨\", \"隊\", \"腱\", \"項\", \"征\", \"媛\", \"魔\", \"蛮\", \"沸\", \"遇\", \"剃\", \"H\", \"校\", \"艸\", \"竹\", \"拶\", \"評\", \"抜\", \"括\", \"史\", \"緩\", \"案\", \"掲\", \"妃\", \"嗚\", \"知\", \"墜\", \"権\", \"R\", \"勝\", \"烹\", \"酷\", \"糾\", \"全\", \"器\", \"虹\", \"引\", \"広\", \"嵐\", \"階\", \"岐\", \"珠\", \"延\", \"🌙\", \"為\", \"街\", \"懲\", \"九\", \"ペ\", \"昭\", \"伐\", \"s\", \"共\", \"貢\", \"者\", \"侍\", \"黒\", \"床\", \"踊\", \"援\", \"ボ\", \"過\", \"ニ\", \"馳\", \"針\", \"謡\", \"刻\", \"戚\", \"返\", \"声\", \"親\", \"狐\", \"嶋\", \"打\", \"M\", \"・\", \"洋\", \"■\", \"寝\", \"・\", \"定\", \"羊\", \"究\", \"彷\", \"正\", \"粒\", \"綾\", \"頒\", \"謀\", \"「\", \"「\", \"推\", \"払\", \"D\", \"求\", \"災\", \"旧\", \"利\", \"俊\", \"巨\", \"父\", \"好\", \"番\", \"擦\", \"攻\", \"俯\", \"号\", \"藤\", \"は\", \"如\", \"格\", \"妬\", \"因\", \"攘\", \"Q\", \"歌\", \"集\", \"栗\", \"怠\", \"醸\", \"】\", \"ッ\", \"ョ\", \"萼\", \"水\", \"弾\", \"帳\", \"粘\", \"実\", \"麗\", \"い\", \"員\", \"房\", \"و\", \"問\", \"黙\", \"ヤ\", \"契\", \"討\", \"碌\", \"摂\", \"博\", \"〈\", \"匹\", \"賢\", \"挙\", \"迅\", \"杼\", \"和\", \"衷\", \"省\", \"刊\", \"診\", \"光\", \"副\", \"池\", \"費\", \"裏\", \"輸\", \"迫\", \"聾\", \"留\", \"概\", \"勉\", \"😊\", \"℃\", \"臭\", \"麹\", \"😌\", \"途\", \"排\", \"郎\", \"記\", \"芸\", \"坐\", \"心\", \"腕\", \"造\", \"爪\", \"宮\", \"矛\", \"願\", \"核\", \"革\", \"*\", \"師\", \"複\", \"佇\", \"ノ\", \"道\", \"循\", \"枯\", \"横\", \"梳\", \"絶\", \"肝\", \"函\", \"撫\", \"霧\", \"跡\", \"塵\", \"允\", \"智\", \"躍\", \"管\", \"観\", \"筆\", \"掻\", \"寂\", \"吹\", \"稲\", \"屋\", \"疇\", \"対\", \"載\", \"咲\", \"逃\", \"該\", \"根\", \"海\", \"望\", \"怨\", \"碓\", \"語\", \"仙\", \"領\", \"短\", \"▼\", \"大\", \"得\", \"挨\", \"擢\", \"堂\", \"杏\", \"→\", \"襲\", \"僭\", \"壇\", \"理\", \"捗\", \"昼\", \"音\", \"浸\", \"崎\", \"研\", \"斎\", \"題\", \"姦\", \"在\", \"戒\", \"囁\", \"印\", \"◡\", \"護\", \"暁\", \"熊\", \"仏\", \"賑\", \"店\", \"蔓\", \"鞘\", \"彡\", \"葵\", \"礼\", \"◎\", \"患\", \"蓮\", \"\\u001b\", \"蒙\", \"綱\", \"謝\", \"宛\", \"才\", \"ふ\", \"適\", \"睡\", \"%\", \"換\", \"燃\", \"来\", \"色\", \"抽\", \"映\", \"|\", \"珂\", \"残\", \"棄\", \"び\", \"机\", \"壁\", \"凄\", \"濡\", \"速\", \"バ\", \"停\", \"最\", \"陳\", \"胞\", \"丘\", \"榴\", \"積\", \"叩\", \"蛋\", \"脱\", \"子\", \"鼻\", \"立\", \"隼\", \"悪\", \"ゞ\", \".\", \"壮\", \"溜\", \"般\", \"枠\", \"軌\", \"I\", \"ガ\", \"舎\", \"被\", \"答\", \"米\", \"$\", \"揮\", \"促\", \"吐\", \"拡\", \"昂\", \"惹\", \"戯\", \"央\", \"通\", \"1\", \"許\", \"凱\", \"喋\", \"庫\", \"値\", \"癒\", \"突\", \"喪\", \"『\", \"天\", \"徳\", \"托\", \"龍\", \"蓄\", \"控\", \"故\", \"ヒ\", \"野\", \"忠\", \"嬢\", \"奇\", \"拘\", \"奔\", \"そ\", \"亡\", \"列\", \"庄\", \"💦\", \"手\", \"隆\", \"娠\", \"捨\", \"渡\", \"頑\", \"志\", \"健\", \"無\", \"孫\", \"ド\", \"振\", \"諺\", \"感\", \"想\", \"膚\", \"伊\", \"母\", \"関\", \"待\", \"且\", \"拷\", \"込\", \"縦\", \"地\", \"晩\", \"武\", \"柄\", \"赴\", \"溶\", \"斧\", \"+\", \"行\", \"靴\", \"魏\", \"袴\", \"窟\", \"糞\", \"圧\", \"頓\", \"奥\", \"絨\", \"崔\", \"沼\", \"梅\", \"ぜ\", \"駿\", \"硝\", \"箇\", \"近\", \"駅\", \"伺\", \"盤\", \"艶\", \"〇\", \"勧\", \"励\", \"益\", \"云\", \"析\", \"脇\", \"渇\", \"像\", \"漠\", \"税\", \"暢\", \"純\", \"損\", \"灌\", \"げ\", \"ヲ\", \"籠\", \"潤\", \"夫\", \"託\", \"橋\", \"攫\", \"並\", \"席\", \"欧\", \"畜\", \"ソ\", \"6\", \"饉\", \"僧\", \"箭\", \"晋\", \"曜\", \"闇\", \"捲\", \"☆\", \"態\", \"帰\", \"証\", \"標\", \"袈\", \"毛\", \"紛\", \"]\", \"掌\", \"喩\", \"乞\", \"涯\", \"モ\", \"ヘ\", \"止\", \"訪\", \"未\", \"添\", \"規\", \"財\", \"脳\", \"賊\", \"ツ\", \"荷\", \"痕\", \"狙\", \"紙\", \"乗\", \"燥\", \"念\", \"腺\", \"慮\", \"汲\", \"匂\", \"群\", \"夜\", \"塗\", \"渋\", \"肉\", \"泰\", \"g\", \"普\", \"瓦\", \"⑪\", \"貿\", \"奨\", \"第\", \"福\", \"夷\", \"庇\", \"挟\", \"做\", \"作\", \"夢\", \"額\", \"パ\", \"善\", \"凡\", \"執\", \"把\", \"商\", \"誠\", \"湧\", \"春\", \"_\", \"界\", \"盾\", \"敗\", \"侵\", \"遽\", \"😭\", \"支\", \"胚\", \"耕\", \"ろ\", \"絞\", \"林\", \"浄\", \"耗\", \"❤\", \"落\", \"堀\", \"覧\", \"躇\", \"稼\", \"C\", \"比\", \"暇\", \"蠍\", \"昆\", \"搬\", \"句\", \"疫\", \"。\", \"威\", \"餃\", \"h\", \":\", \"蜂\", \"場\", \"編\", \"猫\", \"寛\", \"Д\", \"抹\", \"煎\", \"隕\", \"朴\", \"礁\", \"踪\", \"老\", \"笑\", \"郡\", \"堺\", \"詠\", \"踏\", \"堆\", \"銃\", \"調\", \"人\", \"烈\", \"蹴\", \"勲\", \"A\", \"縫\", \"ア\", \"凛\", \"3\", \"烙\", \"歴\", \"四\", \"現\", \"冒\", \"詈\", \"慎\", \"施\", \"俗\", \"秀\", \"握\", \"明\", \"(\", \"ヴ\", \"瞬\", \"嫁\", \"琵\", \"抗\", \"足\", \"種\", \"灯\", \"シ\", \"徹\", \"科\", \"沈\", \"兵\", \"堡\", \"小\", \"ヨ\", \"誉\", \"快\", \"腸\", \"拗\", \"ひ\", \"構\", \"苦\", \"溢\", \"佐\", \"株\", \"是\", \"胃\", \"遂\", \"賭\", \"包\", \"級\", \"即\", \"吉\", \"温\", \"醜\", \"県\", \"誕\", \"<\", \"棚\", \"有\", \"゚\", \"戴\", \"億\", \"於\", \"V\", \"の\", \"統\", \"揃\", \"漁\", \"⑧\", \"若\", \"¥\", \"貴\", \"薦\", \"異\", \"泊\", \"捉\", \"伽\", \"紀\", \"稜\", \"タ\", \"祐\", \"祀\", \"至\", \"鯖\", \"ビ\", \"〕\", \"条\", \"棟\", \"精\", \"協\", \"´\", \"欝\", \"顔\", \"隣\", \"北\", \"犬\", \"贅\", \"樺\", \"散\", \"〔\", \"擬\", \"滋\", \"闖\", \"叱\", \"相\", \"ト\", \"訳\", \"盲\", \"桟\", \"n\", \"液\", \"お\", \"部\", \"、\", \"症\", \"養\", \"私\", \"締\", \"刀\", \"申\", \"薄\", \"農\", \"‐\", \"飲\", \"魂\", \"嶽\", \"岡\", \"遣\", \"懸\", \"蔵\", \"葬\", \"遡\", \"鉱\", \"休\", \"豆\", \"桁\", \"趣\", \"鍵\", \"穂\", \"ヘ\", \"メ\", \"あ\", \"丸\", \"〉\", \"揚\", \"羨\", \"涙\", \"播\", \"餅\", \"段\", \"甲\", \"枝\", \"ン\", \"浅\", \"弊\", \"ヶ\", \"B\", \"惣\", \"噛\", \"鮮\", \"批\", \"露\", \"遺\", \"首\", \"川\", \"ぶ\", \"繁\", \"簡\", \"呂\", \"採\", \"表\", \"外\", \"傲\", \"邦\", \"※\", \"丿\", \"飯\", \"眠\", \"路\", \"貪\", \"怯\", \"彼\", \"彩\", \"皮\", \"飽\", \"恰\", \"も\", \"秩\", \"論\", \"俺\", \"ァ\", \"東\", \"宅\", \"旗\", \"、\", \"徐\", \"扉\", \"這\", \"癌\", \"醤\", \"陵\", \"刃\", \"会\", \"給\", \"雨\", \"d\", \"冨\", \"退\", \"誘\", \"̀\", \"職\", \"士\", \"穢\", \"蛇\", \"差\", \"乃\", \"汰\", \"歓\", \"裾\", \"享\", \"絡\", \"澄\", \"宏\", \"去\", \"旦\", \"ヌ\", \"凝\", \"!\", \"効\", \"侶\", \"衣\", \"鉄\", \"迷\", \"雄\", \"肥\", \"仮\", \"沖\", \"南\", \"斬\", \"両\", \"艦\", \"町\", \"@\", \"破\", \"愛\", \"彌\", \"惚\", \"胆\", \"媚\", \"募\", \"殊\", \"景\", \"仰\", \"巷\", \"栃\", \"T\", \"填\", \"書\", \"↑\", \"★\", \"投\", \"冬\", \"署\", \"腹\", \"吸\", \"湿\", \"掬\", \"寺\", \"沿\", \"菓\", \"暦\", \"衆\", \"鞄\", \"Ⅶ\", \"れ\", \"策\", \"幡\", \"仲\", \"る\", \"湖\", \"纒\", \"槍\", \"痺\", \"李\", \"セ\", \"困\", \"履\", \"煙\", \"椿\", \"赤\", \"掃\", \"団\", \"オ\", \"▷\", \"舐\", \"富\", \"ぃ\", \"錯\", \"慶\", \"♫\", \"憲\", \"敏\", \"フ\", \"昔\", \"テ\", \"詩\", \"ぬ\", \"旬\", \"満\", \"拙\", \"紹\", \"梁\", \"餌\", \"頃\", \"膝\", \"亭\", \"雇\", \"́\", \"嫌\", \"聴\", \"昏\", \"笛\", \"急\", \"壊\", \"⇒\", \"他\", \"驚\", \"幽\", \"帆\", \"阜\", \"状\", \"賛\", \"凶\", \"衛\", \"姉\", \"惧\", \"誓\", \"ジ\", \"Z\", \"鬼\", \"ヽ\", \"遍\", \"軟\", \"衝\", \"以\", \"墾\", \"祉\", \"摘\", \"処\", \"派\", \"◯\", \"銭\", \"埋\", \"寇\", \"ゃ\", \"及\", \"荘\", \"鉛\", \"撰\", \"波\", \"偶\", \"繍\", \"肩\", \"訝\", \"飢\", \"嘩\", \"嵯\", \"禁\", \"炭\", \"謬\", \"繋\", \"桃\", \"媒\", \"潔\", \"謳\", \"傷\", \"拠\", \"慢\", \"撮\", \"寧\", \"栄\", \"述\", \"旋\", \"腫\", \"責\", \"誤\", \"往\", \"靄\", \"慨\", \"金\", \"謙\", \"合\", \"郭\", \"柱\", \"0\", \"設\", \"唯\", \"鐘\", \"桜\", \"充\", \"迎\", \"競\", \"稚\", \"償\", \"捏\", \"茶\", \"刺\", \"輪\", \"抵\", \"測\", \"闊\", \"細\", \"々\", \"鈍\", \"キ\", \"気\", \"歩\", \"側\", \"展\", \"紗\", \"刷\", \"伴\", \"略\", \"悶\", \"葉\", \"遠\", \"況\", \"強\", \"濫\", \"遊\", \"認\", \"助\", \"礫\", \"那\", \"虎\", \"浣\", \"ズ\", \"草\", \"果\", \"宙\", \"培\", \"阻\", \"捐\", \"英\", \"篠\", \"乙\", \"Ⅱ\", \"旅\", \"選\", \"㎞\", \"β\", \"却\", \"G\", \"幕\", \"胎\", \"婿\", \"可\", \"肯\", \"閉\", \"こ\", \"窓\", \"渉\", \"杉\", \"糧\", \"畑\", \"居\", \"介\", \"拍\", \"肢\", \"埼\", \"杜\", \"コ\", \"湾\", \"串\", \"湯\", \"薙\", \"硬\", \"嵩\", \"楽\", \"桂\", \"火\", \"局\", \"騙\", \"裕\", \"抱\", \"神\", \"衿\", \"改\", \"深\", \"¥\", \"泄\", \"牽\", \"妹\", \"命\", \"沙\", \"゙\", \"峙\", \"貨\", \"◇\", \"~\", \"8\", \"咎\", \"遅\", \"報\", \"初\", \"医\", \"ん\", \"或\", \"検\", \"断\", \"搭\", \"軸\", \"/\", \"ー\", \"係\", \"先\", \"祥\", \"耶\", \"船\", \"覗\", \"ャ\", \"始\", \"佳\", \"哲\", \"姓\", \"2\", \"ぁ\", \"愚\", \"降\", \"厭\", \"N\", \"描\", \"宇\", \"七\", \"跳\", \"瀬\", \"巾\", \"滲\", \"孤\", \"皆\", \"陶\", \"塩\", \"瞭\", \"窮\", \"着\", \"噌\", \"駕\", \"湘\", \"除\", \"緒\", \"騰\", \"厳\", \"尼\", \"築\", \"西\", \"逢\", \"煩\", \"頼\", \"涅\", \"詐\", \"馴\", \"躾\", \"考\", \"紡\", \"免\", \"ケ\", \"傘\", \"数\", \"質\", \"リ\", \"楊\", \"予\", \"梗\", \"域\", \"罠\", \"敬\", \"─\", \"墳\", \"蘇\", \"済\", \"縞\", \"な\", \"揶\", \"際\", \"鴻\", \"回\", \"a\", \"ゲ\", \"灰\", \"゚\", \"朝\", \"技\", \"繰\", \"保\", \"穏\", \"製\", \"澪\", \"悍\", \"ウ\", \"莽\", \"没\", \"用\", \"旭\", \"占\", \"ご\", \"筋\", \"早\", \"負\", \"潮\", \"疎\", \"酸\", \"輩\", \"楓\", \"働\", \"産\", \"曖\", \"×\", \"鉢\", \"附\", \"爾\", \"カ\", \"上\", \"グ\", \"門\", \"琉\", \"姑\", \"奪\", \"券\", \"只\", \"発\", \"ウ\", \"籍\", \"王\", \"取\", \"寓\", \"●\", \"ホ\", \"仔\", \"娘\", \"目\", \"死\", \"©\", \"軽\", \"冗\", \"装\", \"緯\", \"章\", \"教\", \"杓\", \"方\", \"率\", \"μ\", \"ハ\", \"♪\", \"欄\", \"謗\", \"淡\", \"候\", \"ユ\", \"育\", \"創\", \">\", \"貧\", \"喇\", \"暮\", \"次\", \"檀\", \"姥\", \"象\", \"サ\", \"浴\", \"寒\", \"中\", \"牧\", \"結\", \"岩\", \"ア\", \"長\", \"幹\", \"勘\", \"緑\", \"山\", \"熟\", \"翌\", \"&\", \"今\", \"貰\", \"U\", \"追\", \"基\", \"琳\", \"嚥\", \"雪\", \"堅\", \"琴\", \"位\", \"楠\", \"嫉\", \"隔\", \"安\", \"〟\", \"疹\", \"ザ\", \"︎\", \"放\", \"嗅\", \"綺\", \"泳\", \"鬱\", \"憤\", \"生\", \"高\", \"b\", \"族\", \"ゅ\", \"原\", \"持\", \"虫\", \"偽\", \"ぼ\", \"偵\", \"島\", \"妙\", \"丼\", \"e\", \"瓢\", \"崖\", \"喝\", \"姿\", \"俵\", \"習\", \"兼\", \"渓\", \"赦\", \"似\", \"忽\", \"娯\", \"惜\", \"釘\", \"ば\", \"危\", \"ヵ\", \"別\", \"轢\", \"茂\", \"ゝ\", \"震\", \"判\", \"槽\", \"害\", \"堰\", \"儲\", \"里\", \"噤\", \"都\", \"奢\", \"左\", \"齢\", \"み\", \"耐\", \"触\", \"聞\", \"絆\", \"叫\", \"漑\", \"w\", \"泉\", \"椅\", \"要\", \"曽\", \"綴\", \"右\", \"否\", \"ㅂ\", \"整\", \"苛\", \"匠\", \"5\", \"染\", \"と\", \"勢\", \"接\", \"任\", \"字\", \"曹\", \"粉\", \"反\", \"室\", \"据\", \"巡\", \"縮\", \"措\", \"乱\", \"看\", \"既\", \"弟\", \"浦\", \"糖\", \"誰\", \"単\", \"防\", \"但\", \"決\", \"麻\", \"隈\", \"‥\", \"卵\", \"写\", \"飴\", \"`\", \" \", \"槃\", \"瘻\", \"淹\", \"碍\", \"堤\", \"琶\", \"栓\", \"菅\", \"塚\", \"ゴ\", \"避\", \"鶏\", \"滝\", \"惑\", \"僅\", \"釣\", \"系\", \"潜\", \"献\", \"切\", \"入\", \"イ\", \"喧\", \"社\", \"宿\", \"型\", \"離\", \"縁\", \"え\", \"珪\", \"隠\", \"夕\", \"紫\", \"嬉\", \"剥\", \"羅\", \"含\", \"歪\", \"牙\", \"だ\", \"凍\", \"唱\", \"干\", \"贔\", \"ぞ\", \"裟\", \"滑\", \"角\", \"悠\", \"綜\", \"訂\", \"掛\", \"屹\", \"ぷ\", \"乳\", \"田\", \"余\", \"荒\", \"ー\", \"幅\", \"詫\", \"爽\", \"滞\", \"劇\", \"皇\", \"霊\", \"走\", \"伏\", \"掴\", \"飾\", \"ゥ\", \"應\", \"藻\", \"朗\", \"戻\", \"憑\", \"粧\", \"限\", \"〝\", \"司\", \"識\", \"詞\", \"徒\", \"叉\", \"携\", \"陣\", \"挑\", \"頂\", \"周\", \"砂\", \"卑\", \"つ\", \"食\", \"ゥ\", \"曇\", \"洩\", \"一\", \"歯\", \"府\", \"に\", \"臣\", \"業\", \"弥\", \"緊\", \"翼\", \"味\", \"彰\", \"京\", \"宴\", \"ざ\", \"せ\", \"静\", \"委\", \"需\", \"」\", \"内\", \"特\", \"呼\", \"箱\", \"撃\", \"慈\", \"査\", \"眼\", \"僚\", \"し\", \"憶\", \"P\", \"頭\", \"幸\", \"鈴\", \"怖\", \"架\", \"ら\", \"駄\", \"飛\", \"八\", \"リ\", \"ベ\", \"戸\", \"璧\", \"松\", \"薬\", \"殖\", \"消\", \"重\", \"剤\", \"W\", \"庁\", \"加\", \"誌\", \"斐\", \"裂\", \"鑑\", \"琢\", \"黄\", \"煮\", \"計\", \"則\", \"克\", \"辛\", \"😢\", \"達\", \"遭\", \"森\", \"奈\", \"某\", \"忌\"]",
"lossless": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/ko": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1524839,
"_n_tokens": 474953,
"_n_chars": 655190,
"_n_oov_chars": 432679,
"oov_ratio": 0.6603870632946168,
"_oov_charset": "[\"윈\", \"드\", \"―\", \"呪\", \"싣\", \"譯\", \"칵\", \"섯\", \"🥁\", \"·\", \"미\", \"을\", \"펌\", \"싶\", \"퀘\", \"뭇\", \"不\", \"묘\", \"폭\", \"룡\", \"훔\", \"童\", \"츈\", \"😗\", \"ㅙ\", \"Ⅲ\", \"잣\", \"른\", \"밀\", \"및\", \"근\", \"붉\", \"훑\", \"액\", \"껍\", \"參\", \"샴\", \"린\", \"업\", \"맙\", \"빵\", \"힐\", \"쫀\", \"푹\", \"꺽\", \"얻\", \"└\", \"的\", \"Ⅹ\", \"믐\", \"쁨\", \"궤\", \"남\", \"햇\", \"숲\", \"밋\", \"ㅁ\", \"유\", \"津\", \"늘\", \"荻\", \"뵙\", \"돼\", \"네\", \"六\", \"笠\", \"某\", \"은\", \"넨\", \"쥔\", \"듭\", \"土\", \"륜\", \"秋\", \"특\", \"룹\", \"댈\", \"ㅕ\", \"️\", \"힘\", \"易\", \"핏\", \"억\", \"겁\", \"딜\", \"榮\", \"🍞\", \"깥\", \"ᴄ\", \"修\", \"앨\", \"위\", \"푼\", \"툼\", \"콩\", \"왼\", \"뗀\", \"음\", \"결\", \"專\", \"聖\", \"節\", \"○\", \"낮\", \"ㄱ\", \"구\", \"仁\", \"⁴\", \"작\", \"五\", \"눔\", \"♣\", \"金\", \"禮\", \"◦\", \"팀\", \"넓\", \"☞\", \"쬐\", \"ㅇ\", \"思\", \"경\", \"득\", \"덥\", \"쩌\", \"㉰\", \"벚\", \"臥\", \"後\", \"쪄\", \"얍\", \"켓\", \"닫\", \"白\", \"송\", \"💸\", \"톤\", \"存\", \"혀\", \"兄\", \"卽\", \"폼\", \"듯\", \"茅\", \"衡\", \"팥\", \"氷\", \"멜\", \"포\", \"읽\", \"맵\", \"韓\", \"굉\", \"世\", \"껏\", \"괄\", \"交\", \"셀\", \"속\", \"잎\", \"촨\", \"다\", \"례\", \"킵\", \"듣\", \"펀\", \"⋅\", \"컴\", \"?\", \"친\", \"풀\", \"君\", \"ã\", \"古\", \"챗\", \"守\", \"짱\", \"목\", \"겟\", \"넣\", \"랬\", \"🤕\", \"란\", \"온\", \"튿\", \"ㅓ\", \"布\", \"쌍\", \"같\", \"妻\", \"본\", \"日\", \"Ⅰ\", \"벨\", \"代\", \"이\", \"승\", \"죤\", \"앰\", \"밧\", \"칫\", \"쓰\", \"먼\", \"뿔\", \"픈\", \"투\", \"련\", \"로\", \"즙\", \"객\", \"뻔\", \"잇\", \"놓\", \"콰\", \"盟\", \"캄\", \"륭\", \"팡\", \"帝\", \"맴\", \"긁\", \"싱\", \"좋\", \"👍\", \"북\", \"쉘\", \"틋\", \"漢\", \"갖\", \"증\", \"쌀\", \"民\", \"뒷\", \"캔\", \"펩\", \"뵐\", \"풋\", \"➎\", \"밍\", \"렘\", \"👋\", \"표\", \"럼\", \"쐐\", \"손\", \"》\", \"덴\", \"묻\", \"滅\", \"훠\", \"致\", \"꺼\", \"밌\", \"뛰\", \"마\", \"협\", \"公\", \"射\", \"맨\", \"잊\", \"휘\", \"격\", \"②\", \"陰\", \"➊\", \"눕\", \"낍\", \"侯\", \"벳\", \"ㅈ\", \"냄\", \"分\", \"펑\", \"햄\", \"♧\", \"갭\", \"멤\", \"貸\", \"디\", \"캣\", \"춘\", \"뜯\", \"孝\", \"自\", \"팟\", \"法\", \"星\", \"낱\", \"각\", \"◆\", \"뽐\", \"뭘\", \"깽\", \"뉘\", \"빕\", \"텔\", \"~\", \"용\", \"준\", \"빔\", \"友\", \"쾅\", \"ㅜ\", \"月\", \"에\", \"밝\", \"뜹\", \"며\", \"록\", \"눌\", \"왜\", \"ㅎ\", \"ㅍ\", \"념\", \"뭐\", \"그\", \"러\", \"텍\", \"옷\", \"向\", \"곳\", \"覆\", \"테\", \"엇\", \"믿\", \"룩\", \"뭔\", \"💰\", \"만\", \"燭\", \"즘\", \"끄\", \"섬\", \"염\", \"럭\", \"명\", \"왁\", \"엡\", \"섣\", \"雲\", \"↓\", \"슨\", \"랄\", \"ㅠ\", \"눅\", \"信\", \"즉\", \"빛\", \"치\", \"호\", \"찰\", \"별\", \"성\", \"핸\", \"齋\", \"씌\", \"식\", \"永\", \"촘\", \"♀\", \"떤\", \"딱\", \"완\", \"⑥\", \"常\", \"왕\", \"治\", \"샷\", \"꾸\", \"시\", \"섰\", \"설\", \"華\", \"て\", \"씨\", \"얇\", \"냐\", \"十\", \"뽀\", \"♥\", \"힉\", \"△\", \"슝\", \"듬\", \"主\", \"최\", \"±\", \"🦄\", \"향\", \"숫\", \"紋\", \"婚\", \"잴\", \"케\", \"序\", \"떄\", \"팎\", \"합\", \"몸\", \"ㅊ\", \"警\", \"옥\", \"애\", \"殺\", \"춤\", \"쾨\", \"찜\", \"江\", \"맞\", \"현\", \"수\", \"카\", \"땐\", \"。\", \"암\", \"갱\", \"꺄\", \"힌\", \"볕\", \"戌\", \"뜩\", \"낌\", \"짙\", \"삿\", \"짖\", \"💡\", \"베\", \"져\", \"뜬\", \"삘\", \"壽\", \"∮\", \"씹\", \"웨\", \"횡\", \"팅\", \"막\", \"時\", \"떳\", \"끊\", \"웁\", \"딛\", \"보\", \"챌\", \"롯\", \"♡\", \"릿\", \"눴\", \"文\", \"程\", \"난\", \"력\", \"곶\", \"何\", \"패\", \"많\", \"바\", \"센\", \"캉\", \"게\", \"춧\", \"창\", \"탰\", \"」\", \"병\", \"므\", \"없\", \"깜\", \"黃\", \"쏟\", \"쳇\", \"맡\", \"홉\", \"안\", \"당\", \"언\", \"겐\", \"찔\", \"궜\", \"좆\", \"言\", \"꽂\", \"動\", \"홈\", \"돌\", \"쉴\", \"둔\", \"광\", \"렐\", \"國\", \"緞\", \"몽\", \"죄\", \"唐\", \"斗\", \"습\", \"루\", \"좁\", \"상\", \"濟\", \"솜\", \"틈\", \"魚\", \"御\", \"워\", \"닐\", \"퀵\", \"댄\", \"낳\", \"밟\", \"家\", \"⑸\", \"쥰\", \"宋\", \"플\", \"튬\", \"뷰\", \"겸\", \"괜\", \"굿\", \"줬\", \"휙\", \"역\", \"≤\", \"∙\", \"끌\", \"吳\", \"텅\", \"채\", \"렴\", \"겨\", \"之\", \"곽\", \"파\", \"첫\", \"공\", \"겹\", \"야\", \"院\", \"藥\", \"對\", \"짚\", \"기\", \"뎀\", \"屠\", \"끼\", \"짠\", \"슬\", \"駐\", \"쏭\", \"깁\", \"極\", \"性\", \"또\", \"콕\", \"티\", \"魯\", \"꿨\", \"션\", \"첼\", \"싹\", \"🦅\", \"◼\", \"김\", \"뉜\", \"얕\", \"뒀\", \"間\", \"宗\", \"롱\", \"둬\", \"《\", \"휠\", \"ㅞ\", \"삽\", \"①\", \"多\", \"렸\", \"�\", \"\", \"④\", \"함\", \"✔\", \"썸\", \"곱\", \"께\", \"罰\", \"똥\", \"늦\", \"ᴀ\", \"비\", \"중\", \"류\", \"웰\", \"將\", \"융\", \"穀\", \"환\", \"췄\", \"해\", \"콘\", \"女\", \"새\", \"💌\", \"쥐\", \"뻑\", \"섞\", \"홋\", \"ω\", \"쎄\", \"料\", \"굶\", \"껑\", \"튜\", \"큰\", \"㎥\", \"잦\", \"폿\", \"멕\", \"샌\", \"듀\", \"척\", \"🗺\", \"新\", \"쿵\", \"받\", \"밤\", \"▶\", \"걍\", \"썹\", \"빼\", \"았\", \"백\", \"런\", \"敎\", \"품\", \"길\", \"름\", \"원\", \"男\", \"킨\", \"빤\", \"資\", \"까\", \"랩\", \"ᴛ\", \"⑴\", \"걷\", \"課\", \"섭\", \"릎\", \"짝\", \"꿰\", \"③\", \"⑨\", \"틱\", \"혐\", \"했\", \"는\", \"툴\", \"劍\", \"짭\", \"씩\", \"덮\", \"교\", \"문\", \"한\", \"딤\", \"끝\", \"취\", \"활\", \"琪\", \"큼\", \"탈\", \"빚\", \"옐\", \"同\", \"☀\", \"ㄷ\", \"림\", \"둡\", \"군\", \"능\", \"面\", \"롤\", \"빅\", \"불\", \"城\", \"…\", \"촬\", \"峰\", \"年\", \"戊\", \"전\", \"Ⅳ\", \"谷\", \"높\", \"셈\", \"意\", \"샹\", \"淨\", \"흉\", \"曰\", \"뜰\", \"딴\", \"💕\", \"앱\", \"觸\", \"흩\", \"퇴\", \"哀\", \"켐\", \"들\", \"냥\", \"꿍\", \"類\", \"➋\", \"족\", \"롬\", \"둥\", \"←\", \"끽\", \"政\", \"所\", \"고\", \"끙\", \"꼴\", \"갚\", \"ㅒ\", \"찮\", \"쇼\", \"항\", \"す\", \"ㅔ\", \"洞\", \"양\", \"授\", \"쎈\", \"燦\", \"무\", \"롸\", \"행\", \"말\", \"軒\", \"』\", \"□\", \"病\", \"堯\", \"ㅚ\", \"브\", \"둠\", \"때\", \"꿔\", \"毒\", \"뤄\", \"쿠\", \"化\", \"셋\", \"익\", \"릴\", \"깨\", \"機\", \"빴\", \"經\", \"꿈\", \"궁\", \"쫓\", \"卒\", \"槪\", \"대\", \"軍\", \"묶\", \"렬\", \"든\", \"낀\", \"셨\", \"下\", \"內\", \"工\", \"램\", \"🔹\", \"쩔\", \"陽\", \"레\", \"밸\", \"앎\", \"윌\", \"평\", \"術\", \"女\", \"뀔\", \"곧\", \"앤\", \"씀\", \"텐\", \"平\", \"좀\", \"셔\", \"쉼\", \"團\", \"략\", \"범\", \"횟\", \"美\", \"낭\", \"쟤\", \"옌\", \"납\", \"려\", \"퍙\", \"客\", \"事\", \"쁠\", \"악\", \"웖\", \"\", \"숭\", \"〮\", \"썰\", \"탭\", \"樹\", \"트\", \"졸\", \"띈\", \"긋\", \"릇\", \"百\", \"아\", \"랭\", \"됐\", \"예\", \"直\", \"갤\", \"찬\", \"초\", \"假\", \"奉\", \"켰\", \"민\", \"쨌\", \"홍\", \"않\", \"口\", \"갯\", \"갑\", \"켠\", \"典\", \"ㅑ\", \"悧\", \"🍕\", \"康\", \"리\", \"거\", \"렜\", \"뺐\", \"귈\", \"혼\", \"烏\", \"숱\", \"첨\", \"➍\", \"간\", \"巳\", \"然\", \"녜\", \"덩\", \"얘\", \"情\", \"허\", \"摩\", \"딪\", \"銀\", \"뮐\", \"캠\", \"詔\", \"꼭\", \"賣\", \"🤔\", \"똑\", \"🏫\", \"래\", \"己\", \"💥\", \"훗\", \"㉿\", \"곡\", \"킁\", \"돠\", \"👨\", \"뻗\", \"낡\", \"制\", \"탓\", \"關\", \"회\", \"辰\", \"됩\", \"能\", \"出\", \"댔\", \"젠\", \"열\", \"훌\", \"價\", \"혔\", \"섹\", \"펼\", \"玉\", \"三\", \"解\", \"핵\", \"숍\", \"법\", \"빌\", \"릅\", \"【\", \"姜\", \"임\", \"꾼\", \"탑\", \"휩\", \"데\", \"理\", \"된\", \"헨\", \"옹\", \"ㅖ\", \"앵\", \"짬\", \"魔\", \"쁜\", \"뿍\", \"쩐\", \"옛\", \"㉠\", \"竹\", \"쯤\", \"좌\", \"ㅟ\", \"史\", \"ㅆ\", \"땅\", \"❏\", \"知\", \"녕\", \"흑\", \"⬇\", \"어\", \"全\", \"씬\", \"관\", \"솥\", \"發\", \"닙\", \"돈\", \"팝\", \"累\", \"퓰\", \"봤\", \"홀\", \"냉\", \"九\", \"움\", \"좇\", \"욱\", \"쫑\", \"컷\", \"캘\", \"탐\", \"s\", \"昭\", \"共\", \"굽\", \"응\", \"앉\", \"者\", \"휴\", \"큽\", \"싫\", \"줘\", \"톨\", \"識\", \"님\", \"퀄\", \"라\", \"헝\", \"짧\", \"■\", \"洋\", \"참\", \"・\", \"흠\", \"ᴇ\", \"생\", \"뚜\", \"正\", \"컵\", \"꿕\", \"ᴍ\", \"맑\", \"「\", \"췌\", \"희\", \"「\", \"廟\", \"왘\", \"戮\", \"求\", \"닷\", \"利\", \"넉\", \"好\", \"渴\", \"감\", \"は\", \"²\", \"킥\", \"學\", \"눈\", \"댁\", \"힙\", \"꺾\", \"겠\", \"集\", \"🤗\", \"클\", \"】\", \"폄\", \"水\", \"쫒\", \"꽁\", \"첸\", \"い\", \"빠\", \"員\", \"房\", \"박\", \"뤘\", \"켜\", \"跏\", \"〈\", \"샬\", \"곁\", \"릉\", \"和\", \"동\", \"번\", \"光\", \"랍\", \"副\", \"측\", \"뮬\", \"띠\", \"留\", \"\", \"저\", \"빈\", \"뾱\", \"궈\", \"훼\", \"😊\", \"ⅲ\", \"얏\", \"퓨\", \"℃\", \"꿀\", \"途\", \"컨\", \"坐\", \"듐\", \"心\", \"배\", \"갈\", \"났\", \"몇\", \"宮\", \"뛴\", \"처\", \"폰\", \"革\", \"*\", \"렌\", \"\", \"師\", \"땡\", \"道\", \"잘\", \"턱\", \"픔\", \"枯\", \"꽉\", \"샤\", \"⑵\", \"🙆\", \"균\", \"實\", \"獻\", \"낄\", \"뱃\", \"즐\", \"닭\", \"管\", \"청\", \"숙\", \"悖\", \"붐\", \"연\", \"쁘\", \"載\", \"➌\", \"옆\", \"락\", \"邑\", \"海\", \"望\", \"켈\", \"낚\", \"語\", \"蜀\", \"크\", \"삭\", \"▼\", \"大\", \"죽\", \"堂\", \"→\", \"쓸\", \"제\", \"택\", \"理\", \"븐\", \"질\", \"팔\", \"확\", \"🏻\", \"요\", \"流\", \"직\", \"턴\", \"뺑\", \"깝\", \"題\", \"울\", \"핑\", \"앗\", \"곰\", \"껴\", \"적\", \"놨\", \"淘\", \"여\", \"◎\", \"엠\", \"蒙\", \"맷\", \"謝\", \"才\", \"歲\", \"퍼\", \"適\", \"%\", \"換\", \"色\", \"피\", \"ɪ\", \"커\", \"|\", \"땠\", \"끓\", \"꿇\", \"💅\", \"헉\", \"깐\", \"陳\", \"會\", \"웅\", \"◀\", \"拮\", \"헤\", \"땀\", \"앓\", \"맹\", \"脱\", \"子\", \"立\", \"띄\", \"닮\", \"춥\", \"ㅢ\", \"깊\", \"세\", \"일\", \"뿌\", \"됬\", \"璣\", \"룬\", \"실\", \"귀\", \"米\", \"被\", \"鎭\", \"툭\", \"면\", \"촉\", \"층\", \"ᴡ\", \"믄\", \"샀\", \"찼\", \"폐\", \"못\", \"낫\", \"쵸\", \"봬\", \"닳\", \"『\", \"天\", \"徳\", \"였\", \"龍\", \"멍\", \"헬\", \"故\", \"野\", \"팁\", \"퀸\", \"딩\", \"멈\", \"拘\", \"そ\", \"낸\", \"◐\", \"톰\", \"봄\", \"쌩\", \"더\", \"💦\", \"手\", \"몫\", \"윙\", \"志\", \"ᴏ\", \"無\", \"튼\", \"쭉\", \"넷\", \"獨\", \"뿜\", \"튀\", \"쭈\", \"Ⅵ\", \"맘\", \"벅\", \"읍\", \"맥\", \"탁\", \"地\", \"武\", \"行\", \"얽\", \"➏\", \"소\", \"떻\", \"두\", \"렉\", \"봇\", \"잤\", \"韜\", \"탕\", \"홑\", \"히\", \"정\", \"늑\", \"걱\", \"쿤\", \"를\", \"닦\", \"썅\", \"쿨\", \"페\", \"헛\", \"살\", \"녘\", \"헐\", \"즈\", \"삼\", \"느\", \"톱\", \"됨\", \"析\", \"릭\", \"괌\", \"像\", \"💣\", \"주\", \"뢰\", \"뇌\", \"블\", \"㏊\", \"검\", \"돔\", \"률\", \"달\", \"흥\", \"ㆍ\", \"칭\", \"멘\", \"🤟\", \"건\", \"ㅅ\", \"🌵\", \"칼\", \"황\", \"ⓔ\", \"긍\", \"끗\", \"☆\", \"버\", \"쏙\", \"쐬\", \"標\", \"앙\", \"毛\", \"댓\", \"흐\", \"掌\", \"끔\", \"樂\", \"ㅣ\", \"☎\", \"뀌\", \"쉽\", \"룸\", \"짢\", \"紙\", \"재\", \"웬\", \"德\", \"륨\", \"群\", \"럿\", \"夜\", \"肉\", \"蟄\", \"등\", \"샵\", \"貿\", \"팩\", \"ㅘ\", \"第\", \"福\", \"변\", \"넬\", \"탄\", \"발\", \"善\", \"🍟\", \"촌\", \"벤\", \"있\", \"썼\", \"商\", \"흘\", \"春\", \"랜\", \"諒\", \"줏\", \"딥\", \"界\", \"😭\", \"耕\", \"조\", \"잔\", \"볍\", \"林\", \"❤\", \"엔\", \"흰\", \"比\", \"👏\", \"뎅\", \":\", \"육\", \"혹\", \"흡\", \"뤼\", \"寛\", \"꽤\", \"쌈\", \"룰\", \"㎡\", \"숏\", \"셸\", \"캐\", \"춰\", \"쭙\", \"꽝\", \"녹\", \"詠\", \"쏜\", \"◾\", \"후\", \"삣\", \"몬\", \"▲\", \"人\", \"튄\", \"텝\", \"깅\", \"징\", \"널\", \"틴\", \"쑥\", \"혜\", \"것\", \"現\", \"옮\", \"킹\", \"싼\", \"俗\", \"§\", \"明\", \"권\", \"틀\", \"抗\", \"인\", \"슴\", \"種\", \"렛\", \"툰\", \"뼈\", \"科\", \"펜\", \"믹\", \"샐\", \"찍\", \"앞\", \"靑\", \"✈\", \"순\", \"🙇\", \"할\", \"뛸\", \"쉰\", \"챔\", \"렀\", \"젖\", \"雙\", \"딘\", \"깡\", \"킬\", \"榜\", \"尤\", \"벙\", \"으\", \"옴\", \"찾\", \"包\", \"월\", \"싸\", \"쪽\", \"픕\", \"有\", \"몹\", \"날\", \"키\", \"立\", \"엄\", \"엌\", \"⑧\", \"탱\", \"뮌\", \"계\", \"칸\", \"닥\", \"따\", \"렵\", \"삶\", \"紀\", \"챨\", \"祐\", \"至\", \"슈\", \"〕\", \"峴\", \"냠\", \"協\", \"욜\", \"뇨\", \"⑦\", \"밖\", \"北\", \"犬\", \"樺\", \"델\", \"〔\", \"흙\", \"떨\", \"뺏\", \"점\", \"의\", \"반\", \"相\", \"통\", \"윤\", \"變\", \"터\", \"液\", \"臺\", \"部\", \"녀\", \"㎍\", \"쌓\", \"약\", \"↕\", \"넵\", \"젊\", \"오\", \"申\", \"薄\", \"農\", \"줄\", \"필\", \"‧\", \"藝\", \"잉\", \"도\", \"총\", \"쩍\", \"陸\", \"가\", \"졌\", \"형\", \"욕\", \"뚝\", \"ⅰ\", \"꽃\", \"돕\", \"〉\", \"쥬\", \"과\", \"넹\", \"착\", \"▣\", \"년\", \"甲\", \"梁\", \"🙌\", \"탠\", \"윗\", \"\", \"弊\", \"鮮\", \"팹\", \"논\", \"르\", \"숯\", \"닿\", \"쉬\", \"川\", \"ń\", \"外\", \"훈\", \"邦\", \"※\", \"방\", \"잃\", \"접\", \"Ⅷ\", \"혁\", \"쌉\", \"캇\", \"태\", \"론\", \"皮\", \"벵\", \"맺\", \"朱\", \"갔\", \"럴\", \"論\", \"東\", \"값\", \"옵\", \"편\", \"뼘\", \"ㅐ\", \"진\", \"흔\", \"켄\", \"α\", \"겼\", \"乃\", \"汰\", \"효\", \"침\", \"쾌\", \"뮈\", \"쏘\", \"젝\", \"잰\", \"뮤\", \"🍔\", \"똘\", \"갛\", \"衣\", \"雄\", \"텨\", \"엿\", \"南\", \"쫗\", \"템\", \"@\", \"힜\", \"愛\", \"핫\", \"솔\", \"젓\", \"엘\", \"書\", \"떠\", \"★\", \"↑\", \"投\", \"절\", \"츄\", \"농\", \"冬\", \"딸\", \"옳\", \"팰\", \"볼\", \"너\", \"흄\", \"귤\", \"놔\", \"Ⅶ\", \"낯\", \"🌿\", \"仲\", \"던\", \"캡\", \"🤭\", \"부\", \"출\", \"얼\", \"럽\", \"픽\", \"팜\", \"칠\", \"딧\", \"웠\", \"멋\", \"▷\", \"켤\", \"넘\", \"⚀\", \"핀\", \"펄\", \"찌\", \"쳤\", \"ⓒ\", \"氣\", \"數\", \"뷔\", \"팠\", \"랴\", \"심\", \"亭\", \"올\", \"쨍\", \"쓕\", \"⇒\", \"솨\", \"종\", \"驚\", \"붓\", \"알\", \"핥\", \"ㅡ\", \"衛\", \"메\", \"극\", \"걔\", \"료\", \"飮\", \"壞\", \"祉\", \"먹\", \"돋\", \"타\", \"렷\", \"골\", \"짜\", \"쏠\", \"랑\", \"넥\", \"곤\", \"뭥\", \"떴\", \"독\", \"◑\", \"▒\", \"≫\", \"뜨\", \"선\", \"듈\", \"璿\", \"쟁\", \"蚩\", \"될\", \"樂\", \"굵\", \"닝\", \"띕\", \"述\", \"붕\", \"틔\", \"걀\", \"金\", \"誡\", \"엉\", \"瀧\", \"合\", \"曆\", \"🙋\", \"不\", \"鐘\", \"큐\", \"떼\", \"❍\", \"ㅗ\", \"철\", \"맬\", \"늙\", \"싯\", \"국\", \"렁\", \"略\", \"⑹\", \"밥\", \"망\", \"草\", \"석\", \"뉴\", \"眞\", \"율\", \"贖\", \"英\", \"둘\", \"나\", \"봉\", \"링\", \"乙\", \"산\", \"Ⅱ\", \"쳐\", \"趺\", \"쟈\", \"량\", \"텁\", \"選\", \"엽\", \"㎞\", \"규\", \"🚿\", \"사\", \"可\", \"깃\", \"밭\", \"靈\", \"居\", \"코\", \"弛\", \"쫄\", \"火\", \"차\", \"웹\", \"분\", \"뚫\", \"매\", \"쿄\", \"댐\", \"神\", \"개\", \"욥\", \"줌\", \"改\", \"닛\", \"🍎\", \"Ⅸ\", \"킌\", \"줍\", \"命\", \"◇\", \"峙\", \"🍰\", \"노\", \"와\", \"龍\", \"쓴\", \"렇\", \"初\", \"즌\", \"팬\", \"🚨\", \"셉\", \"돗\", \"係\", \"先\", \"술\", \"내\", \"🍭\", \"始\", \"v\", \"↔\", \"었\", \"죠\", \"짤\", \"끈\", \"얹\", \"장\", \"스\", \"롭\", \"七\", \"촛\", \"😂\", \"털\", \"풍\", \"칙\", \"◈\", \"쩡\", \"녔\", \"窮\", \"넌\", \"훨\", \"꼬\", \"답\", \"벽\", \"ⅱ\", \"멀\", \"쪼\", \"몰\", \"모\", \"놈\", \"폈\", \"㉣\", \"천\", \"갓\", \"섦\", \"물\", \"찢\", \"잠\", \"敬\", \"콜\", \"험\", \"령\", \"륙\", \"際\", \"셌\", \"回\", \"\", \"겉\", \"눠\", \"빙\", \"朝\", \"셜\", \"십\", \"技\", \"킷\", \"떡\", \"추\", \"츠\", \"用\", \"외\", \"푸\", \"⊙\", \"›\", \"×\", \"갉\", \"하\", \"덕\", \"폴\", \"띤\", \"누\", \"上\", \"門\", \"😣\", \"컬\", \"금\", \"낼\", \"籍\", \"王\", \"덧\", \"●\", \"괴\", \"밉\", \"뽑\", \"目\", \"死\", \"©\", \"헌\", \"뱀\", \"깔\", \"章\", \"색\", \"方\", \"μ\", \"짐\", \"♪\", \"잭\", \"걸\", \"쇠\", \"쿡\", \"次\", \"숨\", \"俠\", \"읊\", \"낙\", \"說\", \"슐\", \"亨\", \"綃\", \"中\", \"🌳\", \"結\", \"토\", \"長\", \"엣\", \"압\", \"첩\", \"꼽\", \"짊\", \"體\", \"山\", \"擒\", \"벌\", \"ʏ\", \"ㅏ\", \"닌\", \"뒤\", \"충\", \"펙\", \"雪\", \"뜻\", \"安\", \"︎\", \"퍽\", \"Ⅴ\", \"강\", \"쒀\", \"쿰\", \"生\", \"高\", \"늄\", \"族\", \"지\", \"봐\", \"솟\", \"原\", \"굴\", \"굳\", \"뻤\", \"⑤\", \"콤\", \"胡\", \"급\", \"뱉\", \"濁\", \"콥\", \"왠\", \"쇄\", \"≪\", \"봅\", \"단\", \"랐\", \"텀\", \"펠\", \"쯔\", \"화\", \"벼\", \"축\", \"良\", \"륵\", \"혈\", \"里\", \"째\", \"핍\", \"폍\", \"뻐\", \"∼\", \"\", \"뜸\", \"뫼\", \"벗\", \"겔\", \"뿐\", \"훅\", \"ⅳ\", \"꼈\", \"否\", \"람\", \"판\", \"견\", \"칩\", \"勢\", \"字\", \"😱\", \"反\", \"프\", \"퀀\", \"巡\", \"臀\", \"복\", \"겪\", \"잖\", \"운\", \"․\", \"궐\", \"집\", \"弟\", \"젤\", \"놀\", \"‥\", \"잡\", \" \", \"뺀\", \"존\", \"랙\", \"냈\", \"묵\", \"얀\", \"系\", \"빳\", \"숟\", \"흗\", \"슷\", \"니\", \"社\", \"웃\", \"립\", \"뀐\", \"離\", \"샘\", \"녁\", \"엑\", \"컸\", \"긴\", \"왔\", \"획\", \"밴\", \"㈜\", \"\", \"¹\", \"빗\", \"角\", \"붙\", \"튠\", \"뱅\", \"멸\", \"ㄹ\", \"劫\", \"덜\", \"⑶\", \"써\", \"삐\", \"乳\", \"잼\", \"덟\", \"뭉\", \"팍\", \"자\", \"탬\", \"♤\", \"皇\", \"ㅛ\", \"飾\", \"應\", \"닉\", \"체\", \"틸\", \"서\", \"슛\", \"킴\", \"우\", \"글\", \"되\", \"짓\", \"맛\", \"담\", \"웍\", \"셰\", \"꾀\", \"썬\", \"학\", \"씽\", \"食\", \"랫\", \"빡\", \"一\", \"냅\", \"ʟ\", \"業\", \"갇\", \"덤\", \"펴\", \"京\", \"둑\", \"」\", \"特\", \"엮\", \"입\", \"퀴\", \"팽\", \"챙\", \"し\", \"頭\", \"밑\", \"왓\", \"씻\", \"ㅋ\", \"拜\", \"넛\", \"퉁\", \"썩\", \"八\", \"쑤\", \"🏷\", \"책\", \"엎\", \"ㄴ\", \"늬\", \"신\", \"볶\", \"머\", \"껀\", \"ㅝ\", \"쿼\", \"영\", \"빨\", \"얄\", \"톡\"]",
"lossless": false
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/ar": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/de": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/fa": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/ja": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/ko": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"microsoft/phi-1 @ cc100/ar": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/de": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1814876,
"_n_tokens": 684665,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/fa": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/ja": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-1 @ cc100/ko": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1524839,
"_n_tokens": 1308988,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/ar": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/de": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1814876,
"_n_tokens": 684665,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/fa": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/ja": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"microsoft/phi-2 @ cc100/ko": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1524839,
"_n_tokens": 1308988,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"mistralai/Mistral-7B-v0.1 @ cc100/ar": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/de": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/fa": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/ja": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/ko": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/ar": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/de": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/fa": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/ja": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/ko": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai-community/gpt2 @ cc100/ar": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/de": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1814876,
"_n_tokens": 684669,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/fa": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/ja": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai-community/gpt2 @ cc100/ko": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1524839,
"_n_tokens": 1309029,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"openai/code-davinci-002 @ cc100/ar": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/de": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1814876,
"_n_tokens": 684666,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/fa": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/ja": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/code-davinci-002 @ cc100/ko": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1524839,
"_n_tokens": 1308993,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/ar": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2813283,
"_n_tokens": 1105640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/de": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1814876,
"_n_tokens": 500870,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/fa": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2054052,
"_n_tokens": 818067,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/ja": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1774770,
"_n_tokens": 630348,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-3.5-turbo @ cc100/ko": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1524839,
"_n_tokens": 652277,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/ar": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2813283,
"_n_tokens": 1105640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/de": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1814876,
"_n_tokens": 500870,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/fa": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2054052,
"_n_tokens": 818067,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/ja": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1774770,
"_n_tokens": 630348,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4 @ cc100/ko": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1524839,
"_n_tokens": 652277,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/ar": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 2813283,
"_n_tokens": 514909,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/de": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1814876,
"_n_tokens": 412599,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/fa": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 2054052,
"_n_tokens": 379156,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/ja": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1774770,
"_n_tokens": 452794,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/gpt-4o @ cc100/ko": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1524839,
"_n_tokens": 405624,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/ar": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/de": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1814876,
"_n_tokens": 684666,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/fa": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/ja": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"openai/text-davinci-003 @ cc100/ko": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1524839,
"_n_tokens": 1308993,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"paust/pko-t5-large @ cc100/ar": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 2813283,
"_n_tokens": 2805586,
"_n_chars": 1560987,
"_n_oov_chars": 202,
"oov_ratio": 0.00012940530574565964,
"_oov_charset": "[\"ﷺ\", \"…\", \"ﻷ\", \"½\", \"ﻻ\", \"ﻹ\", \"″\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/de": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1814876,
"_n_tokens": 1244350,
"_n_chars": 1784021,
"_n_oov_chars": 457,
"oov_ratio": 0.0002561629039120055,
"_oov_charset": "[\"…\", \"¹\", \"½\", \" \", \"™\", \"¼\", \"´\", \"²\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/fa": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 2054052,
"_n_tokens": 2051040,
"_n_chars": 1145876,
"_n_oov_chars": 605,
"oov_ratio": 0.0005279803399320694,
"_oov_charset": "[\"…\", \"ﮧ\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/ja": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1774770,
"_n_tokens": 1756950,
"_n_chars": 603065,
"_n_oov_chars": 6917,
"oov_ratio": 0.011469742067604653,
"_oov_charset": "[\"コ\", \"゙\", \"k\", \"i\", \"s\", \"テ\", \"ノ\", \"^\", \"r\", \"l\", \"‥\", \"`\", \" \", \"ヘ\", \"″\", \"メ\", \"+\", \";\", \"…\", \"ハ\", \"~\", \"y\", \"カ\", \"8\", \"A\", \"f\", \"ロ\", \">\", \"M\", \"3\", \"B\", \"9\", \"・\", \"?\", \"⑩\", \"Z\", \"「\", \")\", \"/\", \"(\", \"D\", \"ア\", \"①\", \"Y\", \"ヨ\", \"2\", \"Ⅹ\", \"%\", \"&\", \"U\", \"④\", \"N\", \"Q\", \"|\", \"t\", \"ー\", \"\\", \"フ\", \"6\", \"」\", \"d\", \"b\", \"ゥ\", \"4\", \"J\", \"-\", \"‼\", \"m\", \"]\", \"o\", \".\", \"!\", \"e\", \"<\", \"ィ\", \"K\", \"V\", \"0\", \"I\", \"@\", \"S\", \"⑧\", \"リ\", \"T\", \"¥\", \"$\", \"℃\", \"g\", \" ̄\", \"⑪\", \"X\", \"a\", \"=\", \"H\", \"1\", \"E\", \"P\", \"゚\", \"7\", \"´\", \"Ⅶ\", \"レ\", \"w\", \"*\", \"_\", \"ウ\", \"R\", \",\", \"ㅂ\", \"F\", \"5\", \"[\", \"n\", \"Ⅱ\", \"W\", \"③\", \"O\", \"、\", \"㎞\", \"L\", \"G\", \"C\", \"②\", \"。\", \"h\", \":\"]",
"lossless": false
},
"paust/pko-t5-large @ cc100/ko": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1524839,
"_n_tokens": 461643,
"_n_chars": 655190,
"_n_oov_chars": 1311,
"oov_ratio": 0.0020009462903890474,
"_oov_charset": "[\"靈\", \"ⓒ\", \"․\", \"s\", \"陸\", \"㎡\", \"‥\", \"ⅰ\", \"ㄷ\", \"Ⅵ\", \" \", \"識\", \"…\", \"Ⅸ\", \"Ⅳ\", \"ㅙ\", \"梁\", \"Ⅲ\", \"龍\", \"ㅡ\", \"流\", \"?\", \"ㅑ\", \"ㅜ\", \"「\", \"ㅎ\", \"ㅓ\", \"ㅞ\", \"ㅍ\", \"Ⅷ\", \"㈜\", \"v\", \"¹\", \"①\", \"㏊\", \"Ⅹ\", \"%\", \"²\", \"Ⅰ\", \"ㄹ\", \"ㅏ\", \"④\", \"ㅒ\", \"⑶\", \"|\", \"ㅁ\", \"ㆍ\", \"ㅔ\", \"」\", \"ㅐ\", \"ㅅ\", \"Ⅴ\", \"ⓔ\", \"ㅛ\", \"ㅠ\", \"樂\", \"ⅱ\", \"⑤\", \"㉣\", \"ㅚ\", \"女\", \"ㅕ\", \"樂\", \"ㅣ\", \"ㅢ\", \"不\", \"立\", \"@\", \"㎥\", \"⑥\", \"⑧\", \"ⅲ\", \"℃\", \"理\", \"ㅖ\", \"良\", \"ㅗ\", \"⑸\", \"ㅘ\", \"㉠\", \"ㄱ\", \"⑹\", \"⑦\", \"⁴\", \"Ⅶ\", \"ㅋ\", \"ㅟ\", \"*\", \"金\", \"ㅆ\", \"⑴\", \"ⅳ\", \"ㅇ\", \"Ⅱ\", \"③\", \"㉰\", \"ㅊ\", \"⑨\", \"⑵\", \"ㄴ\", \"㎞\", \"㎍\", \"累\", \"②\", \"ㅝ\", \":\", \"ㅈ\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/ar": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 2813283,
"_n_tokens": 1327285,
"_n_chars": 1560987,
"_n_oov_chars": 1201,
"oov_ratio": 0.0007693850108937486,
"_oov_charset": "[\"ۚ\", \"ﻷ\", \"½\", \"٦\", \"۸\", \"٪\", \"ۗ\", \"١\", \"﴾\", \"↩\", \"▫\", \"▪\", \"😀\", \"ۤ\", \"٨\", \"٧\", \"\", \"
\", \"ﻻ\", \"ٰ\", \"ﻹ\", \"″\", \"٣\", \"۲\", \"🙂\", \"٩\", \"ﷺ\", \"…\", \"٤\", \"٠\", \"٥\", \"۷\", \"\", \"😊\", \"٢\", \"ٌ\", \"؛\", \"\", \"﴿\", \"ۖ\", \"⤴\", \"۰\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/de": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 1814876,
"_n_tokens": 969590,
"_n_chars": 1784021,
"_n_oov_chars": 717,
"oov_ratio": 0.00040190109869782923,
"_oov_charset": "[\"½\", \" \", \"↩\", \"\", \"™\", \"😀\", \"´\", \"\", \"😦\", \"‽\", \"\", \"¹\", \"➔\", \"😈\", \"\", \"😆\", \"😉\", \"²\", \"🙂\", \"…\", \"Ÿ\", \"🙁\", \"😂\", \"\", \"\", \"☺\", \"😢\", \"\", \"😃\", \"🙄\", \"¼\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/fa": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 2054052,
"_n_tokens": 986503,
"_n_chars": 1145876,
"_n_oov_chars": 4682,
"oov_ratio": 0.004085956944730494,
"_oov_charset": "[\"\", \"۸\", \"٪\", \"ﮧ\", \"١\", \"۳\", \"٫\", \" \", \"٨\", \"٧\", \"۴\", \"\", \"ٴ\", \"۹\", \"ڪ\", \"٣\", \"۲\", \"\", \"۵\", \"٩\", \"…\", \"۶\", \"▐\", \"ٔ\", \"✿\", \"۔\", \"◄\", \"٤\", \"٠\", \"٥\", \"۷\", \"٢\", \"ٌ\", \"؛\", \"\", \"۰\", \"ۀ\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/ja": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 1774770,
"_n_tokens": 300366,
"_n_chars": 603065,
"_n_oov_chars": 6952,
"oov_ratio": 0.01152777892930281,
"_oov_charset": "[\"コ\", \"゙\", \"k\", \"i\", \"s\", \"テ\", \"ノ\", \"^\", \" \", \"r\", \"l\", \"‥\", \"`\", \" \", \"ヘ\", \"″\", \"メ\", \"+\", \";\", \"…\", \"ハ\", \"~\", \"y\", \"カ\", \"8\", \"A\", \"f\", \"✧\", \"ロ\", \">\", \"M\", \"3\", \"B\", \"9\", \"・\", \"?\", \"⑩\", \"Z\", \"◡\", \"「\", \")\", \"/\", \"(\", \"D\", \"\\u001b\", \"丿\", \"ア\", \"①\", \"Y\", \"ヨ\", \"2\", \"Ⅹ\", \"%\", \"&\", \"U\", \"④\", \"N\", \"\\b\", \"Q\", \"|\", \"t\", \"ー\", \"\\", \"フ\", \"6\", \"\", \"」\", \"⻑\", \"d\", \"b\", \"ゥ\", \"4\", \"J\", \"-\", \"‼\", \"m\", \"]\", \"o\", \".\", \"!\", \"e\", \"<\", \"ィ\", \"K\", \"⌒\", \"V\", \"0\", \"I\", \"@\", \"S\", \"ヾ\", \"⑧\", \"リ\", \"😊\", \"T\", \"¥\", \"$\", \"℃\", \"✨\", \"g\", \" ̄\", \"😌\", \"⑪\", \"噤\", \"X\", \"a\", \"=\", \"H\", \"1\", \"E\", \"\", \"P\", \"゚\", \"7\", \"´\", \"๑\", \"Ⅶ\", \"レ\", \"w\", \"*\", \"_\", \"ウ\", \"R\", \"😭\", \",\", \"ㅂ\", \"F\", \"5\", \"[\", \"n\", \"Ⅱ\", \"W\", \"③\", \"O\", \"、\", \"㎞\", \"L\", \"G\", \"C\", \"▷\", \"😢\", \"②\", \"。\", \"💦\", \"\", \"h\", \"🌙\", \":\", \"♫\"]",
"lossless": false
},
"rinna/bilingual-gpt-neox-4b @ cc100/ko": {
"tokenizer": "bilingual-gpt-neox-4b",
"organization": "ABEJA",
"vocab_size": 65536,
"_n_bytes": 1524839,
"_n_tokens": 641274,
"_n_chars": 655190,
"_n_oov_chars": 39698,
"oov_ratio": 0.06059005784581572,
"_oov_charset": "[\"윈\", \"싣\", \"칵\", \"섯\", \"🥁\", \"펌\", \"싶\", \"퀘\", \"뭇\", \"묘\", \"폭\", \"훔\", \"츈\", \"😗\", \"ㅙ\", \"Ⅲ\", \"잣\", \"붉\", \"훑\", \"액\", \"껍\", \"샴\", \"맙\", \"빵\", \"힐\", \"쫀\", \"푹\", \"꺽\", \"얻\", \"Ⅹ\", \"믐\", \"쁨\", \"궤\", \"햇\", \"숲\", \"밋\", \"ㅁ\", \"뵙\", \"돼\", \"쥔\", \"넨\", \"듭\", \"륜\", \"룹\", \"댈\", \"ㅕ\", \"힘\", \"핏\", \"겁\", \"딜\", \"🍞\", \"깥\", \"ᴄ\", \"앨\", \"푼\", \"툼\", \"콩\", \"왼\", \"뗀\", \"낮\", \"ㄱ\", \"⁴\", \"눔\", \"金\", \"◦\", \"\", \"넓\", \"☞\", \"쬐\", \"ㅇ\", \"득\", \"덥\", \"쩌\", \"㉰\", \"벚\", \"쪄\", \"얍\", \"켓\", \"닫\", \"💸\", \"톤\", \"혀\", \"卽\", \"폼\", \"듯\", \"팥\", \"멜\", \"읽\", \"맵\", \"굉\", \"껏\", \"괄\", \"셀\", \"잎\", \"촨\", \"례\", \"킵\", \"듣\", \"펀\", \"?\", \"풀\", \"챗\", \"짱\", \"겟\", \"넣\", \"랬\", \"🤕\", \"튿\", \"ㅓ\", \"쌍\", \"같\", \"Ⅰ\", \"벨\", \"죤\", \"앰\", \"밧\", \"칫\", \"쓰\", \"뿔\", \"픈\", \"즙\", \"객\", \"뻔\", \"잇\", \"놓\", \"콰\", \"캄\", \"륭\", \"팡\", \"맴\", \"긁\", \"싱\", \"👍\", \"쉘\", \"틋\", \"갖\", \"쌀\", \"뒷\", \"캔\", \"펩\", \"뵐\", \"풋\", \"➎\", \"밍\", \"렘\", \"👋\", \"럼\", \"쐐\", \"덴\", \"묻\", \"훠\", \"꺼\", \"밌\", \"뛰\", \"잊\", \"휘\", \"②\", \"➊\", \"눕\", \"낍\", \"벳\", \"ㅈ\", \"냄\", \"햄\", \"펑\", \"♧\", \"멤\", \"갭\", \"캣\", \"뜯\", \"팟\", \"낱\", \"뽐\", \"뭘\", \"깽\", \"뉘\", \"빕\", \"텔\", \"빔\", \"쾅\", \"ㅜ\", \"밝\", \"뜹\", \"며\", \"눌\", \"왜\", \"ㅍ\", \"ㅎ\", \"념\", \"뭐\", \"텍\", \"옷\", \"곳\", \"엇\", \"믿\", \"룩\", \"뭔\", \"💰\", \"즘\", \"끄\", \"섬\", \"염\", \"럭\", \"왁\", \"엡\", \"섣\", \"슨\", \"랄\", \"ㅠ\", \"눅\", \"즉\", \"찰\", \"핸\", \"씌\", \"촘\", \"떤\", \"딱\", \"⑥\", \"샷\", \"꾸\", \"섰\", \"얇\", \"냐\", \"뽀\", \"힉\", \"슝\", \"듬\", \"🦄\", \"숫\", \"잴\", \"떄\", \"팎\", \"몸\", \"ㅊ\", \"춤\", \"쾨\", \"찜\", \"맞\", \"땐\", \"갱\", \"꺄\", \"힌\", \"볕\", \"뜩\", \"낌\", \"짙\", \"삿\", \"짖\", \"💡\", \"져\", \"뜬\", \"삘\", \"∮\", \"씹\", \"웨\", \"횡\", \"팅\", \"떳\", \"끊\", \"웁\", \"딛\", \"챌\", \"롯\", \"릿\", \"눴\", \"곶\", \"많\", \"센\", \"캉\", \"춧\", \"탰\", \"」\", \"므\", \"깜\", \"쏟\", \"쳇\", \"맡\", \"홉\", \"겐\", \"찔\", \"궜\", \"좆\", \"꽂\", \"홈\", \"쉴\", \"둔\", \"렐\", \"몽\", \"죄\", \"좁\", \"솜\", \"틈\", \"닐\", \"퀵\", \"댄\", \"낳\", \"밟\", \"⑸\", \"쥰\", \"튬\", \"뷰\", \"겸\", \"괜\", \"굿\", \"줬\", \"휙\", \"∙\", \"끌\", \"텅\", \"렴\", \"곽\", \"겹\", \"짚\", \"뎀\", \"끼\", \"짠\", \"쏭\", \"깁\", \"또\", \"콕\", \"꿨\", \"싹\", \"첼\", \"🦅\", \"뉜\", \"얕\", \"뒀\", \"롱\", \"둬\", \"휠\", \"ㅞ\", \"삽\", \"①\", \"렸\", \"\", \"④\", \"✔\", \"썸\", \"곱\", \"께\", \"똥\", \"늦\", \"ᴀ\", \"웰\", \"융\", \"췄\", \"콘\", \"女\", \"💌\", \"쥐\", \"뻑\", \"섞\", \"홋\", \"쎄\", \"굶\", \"껑\", \"튜\", \"큰\", \"㎥\", \"잦\", \"폿\", \"멕\", \"샌\", \"듀\", \"척\", \"🗺\", \"쿵\", \"받\", \"걍\", \"썹\", \"빼\", \"았\", \"런\", \"품\", \"킨\", \"빤\", \"랩\", \"ᴛ\", \"⑴\", \"걷\", \"릎\", \"짝\", \"꿰\", \"③\", \"⑨\", \"틱\", \"혐\", \"했\", \"툴\", \"짭\", \"씩\", \"덮\", \"딤\", \"끝\", \"취\", \"큼\", \"탈\", \"빚\", \"옐\", \"☀\", \"ㄷ\", \"둡\", \"롤\", \"빅\", \"…\", \"촬\", \"Ⅳ\", \"높\", \"셈\", \"샹\", \"흉\", \"뜰\", \"딴\", \"💕\", \"앱\", \"觸\", \"흩\", \"퇴\", \"켐\", \"꿍\", \"냥\", \"➋\", \"롬\", \"둥\", \"끽\", \"끙\", \"꼴\", \"갚\", \"ㅒ\", \"찮\", \"쇼\", \"ㅔ\", \"쎈\", \"롸\", \"ㅚ\", \"둠\", \"꿔\", \"뤄\", \"쿠\", \"셋\", \"릴\", \"깨\", \"빴\", \"쫓\", \"槪\", \"묶\", \"렬\", \"낀\", \"셨\", \"🔹\", \"램\", \"쩔\", \"앎\", \"밸\", \"윌\", \"뀔\", \"곧\", \"앤\", \"씀\", \"텐\", \"좀\", \"셔\", \"쉼\", \"략\", \"횟\", \"낭\", \"쟤\", \"옌\", \"납\", \"퍙\", \"쁠\", \"웖\", \"\", \"숭\", \"〮\", \"썰\", \"탭\", \"졸\", \"띈\", \"긋\", \"릇\", \"랭\", \"됐\", \"갤\", \"켰\", \"쨌\", \"갯\", \"켠\", \"ㅑ\", \"🍕\", \"렜\", \"뺐\", \"귈\", \"숱\", \"첨\", \"➍\", \"녜\", \"덩\", \"얘\", \"딪\", \"뮐\", \"캠\", \"꼭\", \"🤔\", \"똑\", \"🏫\", \"💥\", \"훗\", \"㉿\", \"킁\", \"돠\", \"👨\", \"뻗\", \"낡\", \"탓\", \"됩\", \"댔\", \"젠\", \"훌\", \"혔\", \"섹\", \"펼\", \"핵\", \"숍\", \"빌\", \"릅\", \"꾼\", \"탑\", \"휩\", \"理\", \"헨\", \"옹\", \"ㅖ\", \"앵\", \"짬\", \"쁜\", \"뿍\", \"쩐\", \"옛\", \"㉠\", \"쯤\", \"좌\", \"ㅟ\", \"ㅆ\", \"땅\", \"❏\", \"녕\", \"흑\", \"⬇\", \"씬\", \"솥\", \"닙\", \"돈\", \"팝\", \"累\", \"퓰\", \"봤\", \"홀\", \"냉\", \"움\", \"좇\", \"쫑\", \"컷\", \"캘\", \"탐\", \"s\", \"굽\", \"응\", \"앉\", \"휴\", \"큽\", \"싫\", \"줘\", \"톨\", \"識\", \"퀄\", \"헝\", \"짧\", \"흠\", \"ᴇ\", \"뚜\", \"꿕\", \"ᴍ\", \"맑\", \"「\", \"췌\", \"왘\", \"닷\", \"넉\", \"渴\", \"²\", \"킥\", \"댁\", \"힙\", \"꺾\", \"겠\", \"🤗\", \"폄\", \"쫒\", \"꽁\", \"첸\", \"뤘\", \"켜\", \"샬\", \"곁\", \"릉\", \"랍\", \"측\", \"뮬\", \"띠\", \"\", \"뾱\", \"궈\", \"훼\", \"😊\", \"ⅲ\", \"얏\", \"퓨\", \"℃\", \"꿀\", \"컨\", \"듐\", \"났\", \"몇\", \"뛴\", \"폰\", \"*\", \"렌\", \"땡\", \"잘\", \"턱\", \"픔\", \"꽉\", \"샤\", \"⑵\", \"🙆\", \"균\", \"낄\", \"뱃\", \"즐\", \"닭\", \"悖\", \"붐\", \"쁘\", \"➌\", \"옆\", \"낚\", \"켈\", \"삭\", \"쓸\", \"븐\", \"팔\", \"🏻\", \"流\", \"턴\", \"뺑\", \"깝\", \"핑\", \"앗\", \"곰\", \"껴\", \"놨\", \"엠\", \"맷\", \"%\", \"|\", \"땠\", \"끓\", \"꿇\", \"💅\", \"헉\", \"깐\", \"◀\", \"헤\", \"땀\", \"앓\", \"맹\", \"띄\", \"닮\", \"춥\", \"ㅢ\", \"뿌\", \"됬\", \"璣\", \"룬\", \"툭\", \"촉\", \"층\", \"ᴡ\", \"믄\", \"샀\", \"찼\", \"폐\", \"못\", \"낫\", \"쵸\", \"봬\", \"닳\", \"였\", \"멍\", \"헬\", \"팁\", \"퀸\", \"딩\", \"멈\", \"낸\", \"◐\", \"톰\", \"봄\", \"쌩\", \"💦\", \"몫\", \"윙\", \"ᴏ\", \"튼\", \"쭉\", \"넷\", \"뿜\", \"튀\", \"쭈\", \"Ⅵ\", \"맘\", \"벅\", \"읍\", \"맥\", \"탁\", \"얽\", \"➏\", \"떻\", \"렉\", \"봇\", \"잤\", \"탕\", \"홑\", \"늑\", \"걱\", \"쿤\", \"닦\", \"썅\", \"쿨\", \"헛\", \"녘\", \"헐\", \"느\", \"톱\", \"됨\", \"릭\", \"괌\", \"💣\", \"뢰\", \"뇌\", \"㏊\", \"돔\", \"률\", \"ㆍ\", \"칭\", \"멘\", \"🤟\", \"ㅅ\", \"🌵\", \"칼\", \"ⓔ\", \"긍\", \"끗\", \"쏙\", \"쐬\", \"댓\", \"흐\", \"끔\", \"樂\", \"ㅣ\", \"☎\", \"뀌\", \"쉽\", \"룸\", \"짢\", \"웬\", \"륨\", \"럿\", \"샵\", \"팩\", \"ㅘ\", \"넬\", \"🍟\", \"촌\", \"썼\", \"흘\", \"랜\", \"줏\", \"딥\", \"😭\", \"잔\", \"볍\", \"흰\", \"👏\", \"뎅\", \":\", \"혹\", \"흡\", \"뤼\", \"꽤\", \"쌈\", \"룰\", \"㎡\", \"숏\", \"셸\", \"캐\", \"춰\", \"쭙\", \"꽝\", \"녹\", \"쏜\", \"◾\", \"삣\", \"몬\", \"튄\", \"텝\", \"깅\", \"징\", \"틴\", \"쑥\", \"옮\", \"킹\", \"싼\", \"틀\", \"슴\", \"렛\", \"툰\", \"뼈\", \"펜\", \"믹\", \"샐\", \"찍\", \"앞\", \"✈\", \"🙇\", \"뛸\", \"쉰\", \"챔\", \"렀\", \"젖\", \"딘\", \"깡\", \"킬\", \"벙\", \"옴\", \"찾\", \"싸\", \"쪽\", \"픕\", \"몹\", \"立\", \"엌\", \"⑧\", \"탱\", \"뮌\", \"칸\", \"닥\", \"따\", \"렵\", \"삶\", \"챨\", \"슈\", \"냠\", \"욜\", \"뇨\", \"⑦\", \"밖\", \"델\", \"흙\", \"떨\", \"뺏\", \"㎍\", \"쌓\", \"↕\", \"넵\", \"젊\", \"줄\", \"잉\", \"쩍\", \"陸\", \"졌\", \"욕\", \"뚝\", \"ⅰ\", \"돕\", \"쥬\", \"넹\", \"착\", \"▣\", \"梁\", \"🙌\", \"탠\", \"윗\", \"\", \"팹\", \"논\", \"숯\", \"닿\", \"쉬\", \"잃\", \"접\", \"Ⅷ\", \"쌉\", \"캇\", \"론\", \"벵\", \"맺\", \"갔\", \"럴\", \"값\", \"옵\", \"뼘\", \"ㅐ\", \"흔\", \"켄\", \"겼\", \"쾌\", \"뮈\", \"쏘\", \"젝\", \"잰\", \"🍔\", \"똘\", \"갛\", \"텨\", \"엿\", \"쫗\", \"템\", \"@\", \"힜\", \"핫\", \"젓\", \"떠\", \"츄\", \"농\", \"딸\", \"옳\", \"팰\", \"볼\", \"흄\", \"귤\", \"놔\", \"Ⅶ\", \"낯\", \"🌿\", \"던\", \"캡\", \"🤭\", \"얼\", \"럽\", \"픽\", \"팜\", \"칠\", \"딧\", \"웠\", \"멋\", \"▷\", \"켤\", \"넘\", \"⚀\", \"핀\", \"펄\", \"찌\", \"쳤\", \"ⓒ\", \"뷔\", \"팠\", \"랴\", \"쨍\", \"쓕\", \"솨\", \"붓\", \"핥\", \"ㅡ\", \"걔\", \"飮\", \"壞\", \"먹\", \"돋\", \"렷\", \"짜\", \"쏠\", \"넥\", \"곤\", \"뭥\", \"떴\", \"◑\", \"▒\", \"뜨\", \"듈\", \"될\", \"樂\", \"굵\", \"닝\", \"띕\", \"붕\", \"틔\", \"걀\", \"엉\", \"曆\", \"🙋\", \"不\", \"큐\", \"떼\", \"❍\", \"ㅗ\", \"맬\", \"늙\", \"싯\", \"렁\", \"⑹\", \"율\", \"둘\", \"링\", \"Ⅱ\", \"쟈\", \"쳐\", \"텁\", \"엽\", \"㎞\", \"🚿\", \"깃\", \"밭\", \"靈\", \"쫄\", \"웹\", \"뚫\", \"쿄\", \"댐\", \"욥\", \"줌\", \"닛\", \"🍎\", \"Ⅸ\", \"킌\", \"줍\", \"🍰\", \"龍\", \"쓴\", \"렇\", \"즌\", \"팬\", \"🚨\", \"셉\", \"돗\", \"🍭\", \"v\", \"죠\", \"짤\", \"끈\", \"얹\", \"롭\", \"촛\", \"😂\", \"털\", \"칙\", \"◈\", \"쩡\", \"녔\", \"넌\", \"훨\", \"꼬\", \"답\", \"벽\", \"ⅱ\", \"멀\", \"쪼\", \"몰\", \"놈\", \"폈\", \"㉣\", \"갓\", \"섦\", \"찢\", \"잠\", \"콜\", \"험\", \"륙\", \"셌\", \"\", \"겉\", \"눠\", \"빙\", \"셜\", \"십\", \"킷\", \"떡\", \"푸\", \"⊙\", \"갉\", \"폴\", \"띤\", \"😣\", \"컬\", \"낼\", \"덧\", \"괴\", \"밉\", \"뽑\", \"뱀\", \"깔\", \"짐\", \"잭\", \"쇠\", \"쿡\", \"숨\", \"읊\", \"낙\", \"슐\", \"綃\", \"🌳\", \"엣\", \"압\", \"첩\", \"꼽\", \"짊\", \"ㅏ\", \"닌\", \"뒤\", \"펙\", \"뜻\", \"퍽\", \"Ⅴ\", \"쒀\", \"쿰\", \"늄\", \"솟\", \"봐\", \"굴\", \"굳\", \"뻤\", \"⑤\", \"콤\", \"뱉\", \"콥\", \"왠\", \"쇄\", \"봅\", \"랐\", \"텀\", \"펠\", \"쯔\", \"벼\", \"良\", \"륵\", \"혈\", \"째\", \"핍\", \"폍\", \"뻐\", \"\", \"뜸\", \"뫼\", \"벗\", \"겔\", \"뿐\", \"훅\", \"ⅳ\", \"꼈\", \"견\", \"칩\", \"😱\", \"퀀\", \"겪\", \"잖\", \"․\", \"궐\", \"젤\", \"놀\", \"‥\", \"잡\", \" \", \"뺀\", \"존\", \"랙\", \"냈\", \"묵\", \"얀\", \"빳\", \"숟\", \"흗\", \"슷\", \"웃\", \"뀐\", \"샘\", \"녁\", \"엑\", \"컸\", \"긴\", \"왔\", \"획\", \"밴\", \"㈜\", \"\", \"¹\", \"빗\", \"튠\", \"붙\", \"뱅\", \"멸\", \"ㄹ\", \"덜\", \"⑶\", \"써\", \"삐\", \"잼\", \"덟\", \"뭉\", \"팍\", \"탬\", \"♤\", \"ㅛ\", \"닉\", \"틸\", \"슛\", \"킴\", \"짓\", \"맛\", \"웍\", \"셰\", \"꾀\", \"썬\", \"씽\", \"랫\", \"빡\", \"ʟ\", \"냅\", \"갇\", \"덤\", \"펴\", \"둑\", \"엮\", \"퀴\", \"팽\", \"챙\", \"밑\", \"왓\", \"씻\", \"ㅋ\", \"넛\", \"퉁\", \"썩\", \"쑤\", \"🏷\", \"책\", \"엎\", \"ㄴ\", \"늬\", \"볶\", \"껀\", \"ㅝ\", \"쿼\", \"빨\", \"얄\", \"톡\"]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/ar": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 2813283,
"_n_tokens": 1421847,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/de": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1814876,
"_n_tokens": 619822,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/fa": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 2054052,
"_n_tokens": 1145051,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/ja": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1774770,
"_n_tokens": 581380,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"thu-coai/CharacterGLM-6B @ cc100/ko": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1524839,
"_n_tokens": 652160,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/ar": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2813283,
"_n_tokens": 1597443,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/de": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1814876,
"_n_tokens": 497054,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/fa": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2054052,
"_n_tokens": 1246580,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/ja": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1774770,
"_n_tokens": 842458,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-180b @ cc100/ko": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1524839,
"_n_tokens": 1330568,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/ar": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2813283,
"_n_tokens": 1597443,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/de": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1814876,
"_n_tokens": 497054,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/fa": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2054052,
"_n_tokens": 1246580,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/ja": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1774770,
"_n_tokens": 842458,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tiiuae/falcon-7b @ cc100/ko": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1524839,
"_n_tokens": 1330568,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/ar": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 313168,
"_n_chars": 1560987,
"_n_oov_chars": 1029633,
"oov_ratio": 0.6596038275783206,
"_oov_charset": "[\"ۚ\", \"‹\", \"ή\", \"٦\", \"﴾\", \"↩\", \" \", \"😀\", \"ُ\", \"٨\", \"ί\", \"ز\", \"پ\", \"خ\", \"
\", \"ة\", \"ﻹ\", \"″\", \"إ\", \"•\", \"χ\", \"Х\", \"\", \"©\", \"٩\", \"ِ\", \"«\", \"…\", \"م\", \"^\", \"ى\", \"ت\", \"٤\", \"٥\", \"\", \"؛\", \"َ\", \"¡\", \"ً\", \"τ\", \"ه\", \"۰\", \"،\", \"ρ\", \"ث\", \"ۗ\", \"â\", \"ٍ\", \"ی\", \"\", \"←\", \"κ\", \"�\", \"٣\", \"۲\", \"🙂\", \"غ\", \"®\", \"ٹ\", \"ق\", \"ك\", \"ٌ\", \"ـ\", \"ج\", \"س\", \"ؤ\", \"½\", \"۸\", \"٪\", \"و\", \"ل\", \"د\", \"▪\", \"ۤ\", \"٧\", \"چ\", \"ر\", \"آ\", \"ئ\", \"ء\", \"ﷺ\", \"ک\", \"η\", \"ع\", \"٠\", \"█\", \"۷\", \"ذ\", \"😊\", \"٢\", \"‘\", \"ف\", \"ْ\", \"﴿\", \"ٱ\", \"ۖ\", \"⤴\", \"؟\", \"أ\", \"ص\", \"ﻷ\", \"١\", \"♥\", \"▫\", \"ي\", \"ھ\", \"\", \"ن\", \"ض\", \"\", \"ﻻ\", \"ٰ\", \"ش\", \"ّ\", \"»\", \"ب\", \"ط\", \"›\", \"ح\", \"\", \"ظ\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/de": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 851962,
"_n_chars": 1784021,
"_n_oov_chars": 3915,
"oov_ratio": 0.002194480894563461,
"_oov_charset": "[\"ï\", \"‹\", \"↩\", \"😀\", \"ί\", \"İ\", \"•\", \"©\", \"😆\", \"«\", \"▼\", \"…\", \"^\", \"Ã\", \"τ\", \"ń\", \"`\", \"ρ\", \"§\", \"‚\", \"â\", \"ς\", \"♡\", \"\", \"¹\", \"¿\", \"Ü\", \"Ä\", \"�\", \"😉\", \"🙂\", \"♦\", \"²\", \"😂\", \"û\", \"¤\", \"\", \"☺\", \"£\", \"😃\", \"œ\", \"„\", \"½\", \"≠\", \" \", \"\", \"😦\", \"‽\", \"Á\", \"➔\", \"😈\", \"ä\", \"̈\", \"Ÿ\", \"🙁\", \"\", \"ö\", \"ư\", \"¬\", \"‘\", \"ß\", \"€\", \"á\", \"↑\", \"ė\", \"Ö\", \"Ø\", \"¼\", \"ι\", \"¶\", \"à\", \"♥\", \"ớ\", \"™\", \"´\", \"\", \"å\", \"\", \"»\", \"›\", \"❤\", \"ü\", \"😢\", \"\", \"🙄\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/fa": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 268077,
"_n_chars": 1145876,
"_n_oov_chars": 815066,
"oov_ratio": 0.7113038409042515,
"_oov_charset": "[\"ט\", \" \", \"ُ\", \"٨\", \"ز\", \"پ\", \"خ\", \"ٴ\", \"۹\", \"ة\", \"إ\", \"•\", \"\", \"©\", \"ِ\", \"٩\", \"«\", \"…\", \"۶\", \"م\", \"▐\", \"✿\", \"ى\", \"ت\", \"◄\", \"٤\", \"٥\", \"؛\", \"َ\", \"ً\", \"ه\", \"۰\", \"،\", \"ث\", \"ۆ\", \"ٍ\", \"ی\", \"\", \"ڪ\", \"�\", \"٣\", \"۲\", \"غ\", \"۱\", \"۔\", \"ق\", \"گ\", \"ك\", \"ٌ\", \"ـ\", \"ج\", \"ּ\", \"س\", \"ؤ\", \"۸\", \"٪\", \"ﮧ\", \"و\", \"۳\", \"٫\", \"ل\", \"د\", \"٧\", \"️\", \"چ\", \"ر\", \"آ\", \"ئ\", \"ء\", \"ک\", \"ٔ\", \"ع\", \"ژ\", \"٠\", \"۷\", \"ذ\", \"ے\", \"٢\", \"‘\", \"ف\", \"ْ\", \"؟\", \"أ\", \"ۀ\", \"ص\", \"\", \"١\", \"♥\", \"ي\", \"ھ\", \"۴\", \"\", \"ن\", \"ض\", \"\", \"ش\", \"\", \"»\", \"ّ\", \"۵\", \"ب\", \"ط\", \"›\", \"❤\", \"ح\", \"ב\", \"\", \"ظ\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/ja": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 384900,
"_n_chars": 603065,
"_n_oov_chars": 7871,
"oov_ratio": 0.013051661097891604,
"_oov_charset": "[\"゙\", \"テ\", \"ぉ\", \"r\", \"愉\", \"拙\", \"″\", \"́\", \"碓\", \"唸\", \"⇒\", \"▼\", \"^\", \"僭\", \"▽\", \"ロ\", \"囁\", \"磋\", \"Z\", \"◡\", \"ヽ\", \"`\", \"彡\", \"捺\", \"◎\", \"恣\", \"\\u001b\", \"◯\", \"①\", \"�\", \"Ⅹ\", \"%\", \"④\", \"俄\", \"|\", \"∀\", \"訝\", \"ゎ\", \"臆\", \"4\", \"J\", \"匙\", \"-\", \"茫\", \"ゞ\", \".\", \"靄\", \"ω\", \"0\", \"I\", \"羞\", \"ヾ\", \"趨\", \"屓\", \"$\", \"徘\", \"闊\", \"嘗\", \"=\", \"痴\", \"1\", \"\", \"頷\", \"悶\", \"レ\", \"浣\", \"徊\", \"捐\", \"托\", \"摯\", \"[\", \"Ⅱ\", \"③\", \"滓\", \"㎞\", \"L\", \"G\", \"💦\", \"韮\", \"鱈\", \"諺\", \"コ\", \"i\", \"ノ\", \"埃\", \"•\", \"衿\", \"¥\", \"+\", \";\", \"斂\", \"…\", \"謄\", \"゙\", \"◇\", \"~\", \"y\", \"8\", \"?\", \"逡\", \"⑩\", \"〆\", \"/\", \"唾\", \"←\", \"2\", \"痒\", \"攫\", \"N\", \"ぅ\", \"膿\", \"巾\", \"滲\", \"t\", \"6\", \"\", \"咳\", \"⻑\", \"箭\", \"眩\", \"垠\", \"捲\", \"慄\", \"呟\", \"□\", \"]\", \"涅\", \"馴\", \"ィ\", \"躾\", \"呆\", \"拭\", \"リ\", \"─\", \"g\", \"筈\", \"⑪\", \"誹\", \"X\", \"a\", \"゚\", \"7\", \"杞\", \"_\", \"澪\", \"悍\", \"ウ\", \"😭\", \"莽\", \"焙\", \"❤\", \"O\", \"覧\", \"C\", \"蠍\", \"②\", \"。\", \"餃\", \"\", \"h\", \":\", \"叭\", \"姑\", \"Д\", \"k\", \"徨\", \"^\", \"©\", \"ハ\", \"杓\", \"∇\", \"謗\", \"捩\", \"A\", \"◆\", \"✧\", \"f\", \">\", \"3\", \"9\", \"喇\", \"烙\", \"姥\", \"詈\", \"鋲\", \")\", \"(\", \"ア\", \"腑\", \"ヨ\", \"&\", \"®\", \"U\", \"嵌\", \"\\b\", \"嚥\", \"フ\", \"〟\", \"︎\", \"↓\", \"b\", \"淫\", \"‼\", \"m\", \"o\", \"e\", \"瓢\", \"<\", \"゚\", \"K\", \"V\", \"忽\", \"些\", \"̈\", \"弄\", \"S\", \"逼\", \"⑧\", \"ゝ\", \"簗\", \"¥\", \"✨\", \"噤\", \"奢\", \"H\", \"E\", \"艸\", \"´\", \"欝\", \"w\", \"嗚\", \"闖\", \"R\", \"烹\", \"ㅂ\", \"F\", \"n\", \"5\", \"、\", \"🌙\", \"験\", \"s\", \"l\", \"‥\", \"飴\", \"`\", \" \", \"槃\", \"ヘ\", \"瘻\", \"淹\", \"メ\", \"碍\", \"羨\", \"«\", \"カ\", \"惑\", \"M\", \"B\", \"・\", \"愕\", \"「\", \"傲\", \"D\", \"♡\", \"丿\", \"贔\", \"貪\", \"Y\", \"恰\", \"凪\", \"屹\", \"Q\", \"ー\", \"\\", \"」\", \"d\", \"̀\", \"ゥ\", \"و\", \"啜\", \"!\", \"碌\", \"〝\", \"杼\", \"⌒\", \"@\", \"彌\", \"聾\", \"媚\", \"巷\", \"😊\", \"T\", \"℃\", \" ̄\", \"↑\", \"😌\", \"掬\", \"遜\", \"貶\", \"唆\", \"吠\", \"P\", \"灼\", \"鞄\", \"๑\", \"Ⅶ\", \"*\", \"佇\", \"»\", \"纒\", \",\", \"梳\", \"截\", \"W\", \"琢\", \"膏\", \"▷\", \"😢\", \"⇔\", \"舐\", \"♫\"]",
"lossless": false
},
"tohoku-nlp/bert-base-japanese @ cc100/ko": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 207392,
"_n_chars": 655190,
"_n_oov_chars": 466411,
"oov_ratio": 0.7118713655580824,
"_oov_charset": "[\"윈\", \"드\", \"싣\", \"譯\", \"칵\", \"섯\", \"🥁\", \"미\", \"을\", \"펌\", \"싶\", \"퀘\", \"뭇\", \"묘\", \"폭\", \"룡\", \"^\", \"훔\", \"츈\", \"😗\", \"ㅙ\", \"Ⅲ\", \"잣\", \"른\", \"밀\", \"및\", \"근\", \"붉\", \"훑\", \"액\", \"껍\", \"參\", \"샴\", \"린\", \"업\", \"맙\", \"빵\", \"힐\", \"쫀\", \"푹\", \"꺽\", \"얻\", \"└\", \"Ⅹ\", \"믐\", \"쁨\", \"궤\", \"남\", \"햇\", \"숲\", \"밋\", \"ㅁ\", \"유\", \"늘\", \"뵙\", \"돼\", \"네\", \"쥔\", \"은\", \"넨\", \"듭\", \"륜\", \"특\", \"룹\", \"댈\", \"ㅕ\", \"️\", \"힘\", \"핏\", \"억\", \"겁\", \"딜\", \"榮\", \"🍞\", \"깥\", \"ᴄ\", \"앨\", \"위\", \"푼\", \"툼\", \"콩\", \"왼\", \"뗀\", \"음\", \"결\", \"專\", \"낮\", \"ㄱ\", \"구\", \"⁴\", \"작\", \"눔\", \"♣\", \"金\", \"禮\", \"◦\", \"팀\", \"\", \"넓\", \"☞\", \"쬐\", \"ㅇ\", \"경\", \"득\", \"덥\", \"쩌\", \"㉰\", \"벚\", \"쪄\", \"얍\", \"켓\", \"닫\", \"송\", \"💸\", \"톤\", \"혀\", \"卽\", \"폼\", \"듯\", \"팥\", \"멜\", \"포\", \"읽\", \"맵\", \"굉\", \"껏\", \"괄\", \"셀\", \"속\", \"잎\", \"촨\", \"다\", \"례\", \"킵\", \"듣\", \"펀\", \"⋅\", \"컴\", \"?\", \"친\", \"풀\", \"ã\", \"챗\", \"짱\", \"목\", \"겟\", \"넣\", \"랬\", \"🤕\", \"란\", \"온\", \"튿\", \"ㅓ\", \"쌍\", \"같\", \"본\", \"Ⅰ\", \"벨\", \"이\", \"승\", \"죤\", \"앰\", \"밧\", \"칫\", \"쓰\", \"먼\", \"뿔\", \"픈\", \"투\", \"련\", \"로\", \"즙\", \"객\", \"뻔\", \"잇\", \"놓\", \"콰\", \"캄\", \"륭\", \"팡\", \"맴\", \"긁\", \"싱\", \"좋\", \"👍\", \"북\", \"쉘\", \"틋\", \"갖\", \"증\", \"쌀\", \"뒷\", \"캔\", \"펩\", \"뵐\", \"풋\", \"➎\", \"밍\", \"렘\", \"👋\", \"표\", \"럼\", \"쐐\", \"손\", \"덴\", \"묻\", \"훠\", \"꺼\", \"밌\", \"뛰\", \"마\", \"협\", \"맨\", \"잊\", \"휘\", \"격\", \"②\", \"➊\", \"눕\", \"낍\", \"벳\", \"ㅈ\", \"냄\", \"햄\", \"펑\", \"♧\", \"갭\", \"멤\", \"디\", \"캣\", \"춘\", \"뜯\", \"팟\", \"낱\", \"각\", \"◆\", \"뽐\", \"뭘\", \"깽\", \"뉘\", \"빕\", \"텔\", \"용\", \"준\", \"빔\", \"쾅\", \"ㅜ\", \"에\", \"밝\", \"뜹\", \"며\", \"록\", \"눌\", \"왜\", \"ㅎ\", \"ㅍ\", \"념\", \"뭐\", \"그\", \"러\", \"텍\", \"옷\", \"곳\", \"테\", \"엇\", \"믿\", \"룩\", \"뭔\", \"💰\", \"만\", \"燭\", \"즘\", \"끄\", \"섬\", \"염\", \"럭\", \"명\", \"왁\", \"엡\", \"섣\", \"↓\", \"슨\", \"랄\", \"ㅠ\", \"눅\", \"즉\", \"빛\", \"치\", \"호\", \"찰\", \"별\", \"성\", \"핸\", \"씌\", \"식\", \"촘\", \"♀\", \"떤\", \"딱\", \"완\", \"⑥\", \"왕\", \"샷\", \"꾸\", \"시\", \"섰\", \"설\", \"씨\", \"얇\", \"냐\", \"뽀\", \"♥\", \"힉\", \"슝\", \"듬\", \"최\", \"🦄\", \"향\", \"숫\", \"잴\", \"케\", \"떄\", \"팎\", \"합\", \"몸\", \"ㅊ\", \"옥\", \"애\", \"춤\", \"쾨\", \"찜\", \"맞\", \"현\", \"수\", \"카\", \"땐\", \"암\", \"갱\", \"꺄\", \"힌\", \"볕\", \"戌\", \"뜩\", \"낌\", \"짙\", \"삿\", \"짖\", \"💡\", \"베\", \"져\", \"뜬\", \"삘\", \"∮\", \"씹\", \"웨\", \"횡\", \"팅\", \"막\", \"떳\", \"끊\", \"웁\", \"딛\", \"보\", \"챌\", \"롯\", \"♡\", \"릿\", \"눴\", \"난\", \"력\", \"곶\", \"패\", \"많\", \"바\", \"센\", \"캉\", \"게\", \"춧\", \"창\", \"탰\", \"」\", \"병\", \"므\", \"없\", \"깜\", \"黃\", \"쏟\", \"쳇\", \"맡\", \"홉\", \"안\", \"당\", \"언\", \"겐\", \"찔\", \"궜\", \"좆\", \"꽂\", \"홈\", \"돌\", \"쉴\", \"둔\", \"광\", \"렐\", \"緞\", \"몽\", \"죄\", \"습\", \"루\", \"좁\", \"상\", \"濟\", \"솜\", \"틈\", \"€\", \"워\", \"닐\", \"퀵\", \"댄\", \"낳\", \"밟\", \"⑸\", \"쥰\", \"플\", \"튬\", \"뷰\", \"겸\", \"괜\", \"굿\", \"줬\", \"휙\", \"역\", \"»\", \"≤\", \"∙\", \"끌\", \"吳\", \"텅\", \"채\", \"렴\", \"겨\", \"곽\", \"파\", \"첫\", \"공\", \"겹\", \"야\", \"藥\", \"對\", \"짚\", \"기\", \"뎀\", \"屠\", \"끼\", \"짠\", \"슬\", \"쏭\", \"깁\", \"또\", \"콕\", \"티\", \"꿨\", \"션\", \"첼\", \"싹\", \"🦅\", \"◼\", \"김\", \"뉜\", \"얕\", \"뒀\", \"롱\", \"둬\", \"휠\", \"ㅞ\", \"삽\", \"①\", \"렸\", \"�\", \"\", \"④\", \"함\", \"✔\", \"썸\", \"곱\", \"께\", \"똥\", \"늦\", \"ᴀ\", \"비\", \"중\", \"류\", \"웰\", \"將\", \"융\", \"환\", \"췄\", \"해\", \"콘\", \"女\", \"새\", \"💌\", \"쥐\", \"뻑\", \"섞\", \"홋\", \"ω\", \"쎄\", \"굶\", \"껑\", \"튜\", \"큰\", \"㎥\", \"잦\", \"폿\", \"멕\", \"샌\", \"듀\", \"척\", \"🗺\", \"쿵\", \"받\", \"밤\", \"▶\", \"걍\", \"썹\", \"빼\", \"았\", \"백\", \"런\", \"敎\", \"품\", \"길\", \"름\", \"원\", \"킨\", \"빤\", \"까\", \"랩\", \"ᴛ\", \"⑴\", \"걷\", \"섭\", \"릎\", \"짝\", \"꿰\", \"③\", \"⑨\", \"틱\", \"혐\", \"했\", \"는\", \"툴\", \"劍\", \"짭\", \"씩\", \"덮\", \"교\", \"문\", \"한\", \"딤\", \"끝\", \"취\", \"활\", \"琪\", \"큼\", \"탈\", \"빚\", \"옐\", \"☀\", \"ㄷ\", \"림\", \"둡\", \"군\", \"능\", \"롤\", \"빅\", \"불\", \"…\", \"촬\", \"전\", \"Ⅳ\", \"높\", \"셈\", \"샹\", \"淨\", \"흉\", \"뜰\", \"딴\", \"💕\", \"앱\", \"觸\", \"흩\", \"퇴\", \"켐\", \"들\", \"냥\", \"꿍\", \"➋\", \"족\", \"롬\", \"둥\", \"←\", \"끽\", \"고\", \"끙\", \"꼴\", \"갚\", \"ㅒ\", \"찮\", \"쇼\", \"항\", \"ㅔ\", \"양\", \"쎈\", \"燦\", \"무\", \"롸\", \"행\", \"말\", \"□\", \"ㅚ\", \"브\", \"둠\", \"때\", \"꿔\", \"뤄\", \"쿠\", \"셋\", \"익\", \"릴\", \"깨\", \"빴\", \"經\", \"꿈\", \"궁\", \"쫓\", \"槪\", \"대\", \"묶\", \"렬\", \"든\", \"낀\", \"셨\", \"內\", \"🔹\", \"램\", \"쩔\", \"레\", \"밸\", \"앎\", \"윌\", \"평\", \"뀔\", \"곧\", \"앤\", \"씀\", \"텐\", \"좀\", \"셔\", \"쉼\", \"략\", \"범\", \"횟\", \"낭\", \"쟤\", \"옌\", \"납\", \"려\", \"퍙\", \"쁠\", \"악\", \"웖\", \"\", \"숭\", \"〮\", \"썰\", \"탭\", \"트\", \"졸\", \"띈\", \"긋\", \"릇\", \"아\", \"랭\", \"됐\", \"예\", \"갤\", \"찬\", \"초\", \"假\", \"켰\", \"민\", \"쨌\", \"홍\", \"않\", \"갯\", \"갑\", \"켠\", \"ㅑ\", \"悧\", \"🍕\", \"리\", \"거\", \"렜\", \"뺐\", \"귈\", \"혼\", \"숱\", \"첨\", \"➍\", \"간\", \"녜\", \"덩\", \"얘\", \"허\", \"딪\", \"뮐\", \"캠\", \"꼭\", \"賣\", \"🤔\", \"똑\", \"🏫\", \"래\", \"💥\", \"훗\", \"㉿\", \"곡\", \"킁\", \"돠\", \"👨\", \"뻗\", \"낡\", \"탓\", \"關\", \"회\", \"됩\", \"댔\", \"젠\", \"열\", \"훌\", \"價\", \"혔\", \"섹\", \"펼\", \"핵\", \"숍\", \"법\", \"빌\", \"릅\", \"임\", \"꾼\", \"탑\", \"휩\", \"데\", \"理\", \"된\", \"헨\", \"옹\", \"ㅖ\", \"앵\", \"짬\", \"쁜\", \"뿍\", \"쩐\", \"옛\", \"㉠\", \"쯤\", \"좌\", \"ㅟ\", \"ㅆ\", \"땅\", \"❏\", \"녕\", \"흑\", \"⬇\", \"어\", \"씬\", \"관\", \"솥\", \"發\", \"닙\", \"돈\", \"팝\", \"累\", \"퓰\", \"봤\", \"홀\", \"냉\", \"움\", \"좇\", \"욱\", \"쫑\", \"컷\", \"캘\", \"탐\", \"s\", \"굽\", \"응\", \"앉\", \"휴\", \"큽\", \"싫\", \"줘\", \"톨\", \"識\", \"님\", \"퀄\", \"라\", \"헝\", \"짧\", \"참\", \"흠\", \"ᴇ\", \"생\", \"뚜\", \"컵\", \"꿕\", \"ᴍ\", \"맑\", \"「\", \"췌\", \"희\", \"왘\", \"戮\", \"닷\", \"넉\", \"渴\", \"감\", \"²\", \"킥\", \"눈\", \"댁\", \"힙\", \"꺾\", \"겠\", \"🤗\", \"클\", \"폄\", \"쫒\", \"꽁\", \"첸\", \"빠\", \"박\", \"뤘\", \"켜\", \"跏\", \"샬\", \"곁\", \"릉\", \"동\", \"번\", \"랍\", \"측\", \"뮬\", \"띠\", \"\", \"저\", \"빈\", \"뾱\", \"궈\", \"훼\", \"😊\", \"ⅲ\", \"얏\", \"퓨\", \"℃\", \"꿀\", \"컨\", \"듐\", \"배\", \"갈\", \"났\", \"몇\", \"뛴\", \"처\", \"폰\", \"*\", \"렌\", \"\", \"땡\", \"잘\", \"턱\", \"픔\", \"꽉\", \"샤\", \"⑵\", \"🙆\", \"균\", \"獻\", \"낄\", \"뱃\", \"즐\", \"닭\", \"청\", \"숙\", \"悖\", \"붐\", \"연\", \"쁘\", \"➌\", \"옆\", \"락\", \"낚\", \"켈\", \"크\", \"삭\", \"▼\", \"죽\", \"쓸\", \"제\", \"택\", \"븐\", \"질\", \"팔\", \"확\", \"🏻\", \"요\", \"流\", \"직\", \"턴\", \"뺑\", \"깝\", \"울\", \"핑\", \"`\", \"앗\", \"곰\", \"껴\", \"적\", \"놨\", \"여\", \"◎\", \"엠\", \"맷\", \"歲\", \"퍼\", \"%\", \"피\", \"ɪ\", \"커\", \"|\", \"땠\", \"끓\", \"꿇\", \"💅\", \"헉\", \"깐\", \"웅\", \"◀\", \"헤\", \"땀\", \"앓\", \"맹\", \"띄\", \"닮\", \"춥\", \"ㅢ\", \"깊\", \"세\", \"일\", \"뿌\", \"됬\", \"璣\", \"룬\", \"실\", \"귀\", \"鎭\", \"툭\", \"면\", \"촉\", \"층\", \"ᴡ\", \"믄\", \"샀\", \"찼\", \"폐\", \"못\", \"낫\", \"쵸\", \"봬\", \"닳\", \"였\", \"멍\", \"헬\", \"팁\", \"퀸\", \"딩\", \"멈\", \"낸\", \"◐\", \"톰\", \"봄\", \"쌩\", \"더\", \"💦\", \"몫\", \"윙\", \"ᴏ\", \"튼\", \"쭉\", \"넷\", \"獨\", \"뿜\", \"튀\", \"쭈\", \"Ⅵ\", \"맘\", \"벅\", \"읍\", \"맥\", \"•\", \"탁\", \"얽\", \"➏\", \"소\", \"떻\", \"두\", \"렉\", \"봇\", \"잤\", \"韜\", \"탕\", \"홑\", \"히\", \"정\", \"늑\", \"걱\", \"쿤\", \"를\", \"닦\", \"썅\", \"쿨\", \"페\", \"헛\", \"살\", \"녘\", \"헐\", \"즈\", \"삼\", \"느\", \"톱\", \"됨\", \"릭\", \"괌\", \"💣\", \"주\", \"뢰\", \"뇌\", \"블\", \"㏊\", \"검\", \"돔\", \"률\", \"달\", \"흥\", \"ㆍ\", \"칭\", \"멘\", \"🤟\", \"건\", \"ㅅ\", \"🌵\", \"칼\", \"황\", \"ⓔ\", \"긍\", \"끗\", \"버\", \"쏙\", \"쐬\", \"앙\", \"댓\", \"흐\", \"끔\", \"樂\", \"ㅣ\", \"☎\", \"뀌\", \"쉽\", \"룸\", \"짢\", \"재\", \"웬\", \"德\", \"륨\", \"럿\", \"蟄\", \"등\", \"샵\", \"팩\", \"ㅘ\", \"변\", \"넬\", \"탄\", \"발\", \"🍟\", \"촌\", \"벤\", \"있\", \"썼\", \"흘\", \"랜\", \"諒\", \"줏\", \"딥\", \"😭\", \"조\", \"잔\", \"볍\", \"❤\", \"엔\", \"흰\", \"👏\", \"뎅\", \":\", \"육\", \"혹\", \"흡\", \"뤼\", \"꽤\", \"쌈\", \"룰\", \"㎡\", \"숏\", \"셸\", \"캐\", \"춰\", \"쭙\", \"꽝\", \"녹\", \"쏜\", \"◾\", \"후\", \"삣\", \"몬\", \"튄\", \"텝\", \"깅\", \"징\", \"널\", \"틴\", \"쑥\", \"혜\", \"것\", \"옮\", \"킹\", \"싼\", \"§\", \"권\", \"틀\", \"인\", \"슴\", \"렛\", \"툰\", \"뼈\", \"펜\", \"믹\", \"샐\", \"찍\", \"앞\", \"靑\", \"✈\", \"순\", \"🙇\", \"할\", \"®\", \"뛸\", \"쉰\", \"챔\", \"렀\", \"젖\", \"雙\", \"딘\", \"깡\", \"킬\", \"榜\", \"尤\", \"벙\", \"으\", \"옴\", \"찾\", \"월\", \"싸\", \"쪽\", \"픕\", \"몹\", \"날\", \"키\", \"立\", \"엄\", \"엌\", \"⑧\", \"탱\", \"뮌\", \"계\", \"칸\", \"닥\", \"따\", \"렵\", \"삶\", \"챨\", \"슈\", \"峴\", \"냠\", \"욜\", \"뇨\", \"⑦\", \"밖\", \"델\", \"흙\", \"떨\", \"뺏\", \"점\", \"의\", \"반\", \"통\", \"윤\", \"變\", \"터\", \"臺\", \"녀\", \"㎍\", \"쌓\", \"약\", \"↕\", \"넵\", \"젊\", \"오\", \"줄\", \"필\", \"‧\", \"잉\", \"도\", \"총\", \"쩍\", \"陸\", \"가\", \"졌\", \"형\", \"욕\", \"뚝\", \"ⅰ\", \"꽃\", \"돕\", \"쥬\", \"과\", \"넹\", \"착\", \"▣\", \"년\", \"梁\", \"🙌\", \"탠\", \"윗\", \"\", \"팹\", \"논\", \"르\", \"숯\", \"닿\", \"쉬\", \"ń\", \"훈\", \"방\", \"잃\", \"접\", \"Ⅷ\", \"혁\", \"쌉\", \"캇\", \"태\", \"론\", \"벵\", \"맺\", \"갔\", \"럴\", \"값\", \"옵\", \"편\", \"뼘\", \"ㅐ\", \"진\", \"흔\", \"켄\", \"겼\", \"효\", \"침\", \"쾌\", \"뮈\", \"쏘\", \"젝\", \"잰\", \"뮤\", \"🍔\", \"똘\", \"갛\", \"텨\", \"엿\", \"쫗\", \"템\", \"@\", \"힜\", \"핫\", \"솔\", \"젓\", \"엘\", \"‘\", \"떠\", \"↑\", \"절\", \"츄\", \"농\", \"딸\", \"옳\", \"팰\", \"볼\", \"너\", \"흄\", \"귤\", \"놔\", \"Ⅶ\", \"낯\", \"🌿\", \"던\", \"캡\", \"🤭\", \"부\", \"출\", \"얼\", \"럽\", \"픽\", \"팜\", \"칠\", \"딧\", \"웠\", \"멋\", \"▷\", \"켤\", \"넘\", \"⚀\", \"핀\", \"펄\", \"찌\", \"쳤\", \"ⓒ\", \"氣\", \"數\", \"뷔\", \"팠\", \"랴\", \"심\", \"올\", \"쨍\", \"쓕\", \"⇒\", \"솨\", \"종\", \"붓\", \"알\", \"핥\", \"ㅡ\", \"메\", \"극\", \"걔\", \"료\", \"飮\", \"壞\", \"먹\", \"돋\", \"타\", \"렷\", \"골\", \"짜\", \"쏠\", \"랑\", \"넥\", \"곤\", \"뭥\", \"떴\", \"독\", \"◑\", \"▒\", \"≫\", \"뜨\", \"선\", \"듈\", \"璿\", \"쟁\", \"蚩\", \"될\", \"樂\", \"굵\", \"닝\", \"띕\", \"붕\", \"틔\", \"걀\", \"誡\", \"엉\", \"曆\", \"🙋\", \"不\", \"큐\", \"떼\", \"❍\", \"ㅗ\", \"철\", \"맬\", \"늙\", \"싯\", \"국\", \"렁\", \"⑹\", \"밥\", \"망\", \"석\", \"뉴\", \"율\", \"贖\", \"둘\", \"나\", \"봉\", \"링\", \"산\", \"Ⅱ\", \"쳐\", \"趺\", \"쟈\", \"량\", \"텁\", \"엽\", \"㎞\", \"규\", \"🚿\", \"사\", \"깃\", \"밭\", \"靈\", \"코\", \"弛\", \"쫄\", \"차\", \"웹\", \"분\", \"뚫\", \"매\", \"쿄\", \"댐\", \"개\", \"욥\", \"줌\", \"닛\", \"🍎\", \"Ⅸ\", \"킌\", \"줍\", \"◇\", \"峙\", \"🍰\", \"노\", \"와\", \"龍\", \"쓴\", \"렇\", \"즌\", \"팬\", \"🚨\", \"셉\", \"돗\", \"술\", \"내\", \"🍭\", \"v\", \"↔\", \"었\", \"죠\", \"짤\", \"끈\", \"얹\", \"장\", \"스\", \"롭\", \"촛\", \"😂\", \"털\", \"풍\", \"칙\", \"◈\", \"쩡\", \"녔\", \"£\", \"넌\", \"훨\", \"꼬\", \"답\", \"벽\", \"ⅱ\", \"멀\", \"쪼\", \"몰\", \"모\", \"놈\", \"폈\", \"㉣\", \"천\", \"갓\", \"섦\", \"물\", \"찢\", \"잠\", \"콜\", \"험\", \"령\", \"륙\", \"셌\", \"\", \"겉\", \"눠\", \"빙\", \"셜\", \"십\", \"킷\", \"떡\", \"추\", \"츠\", \"외\", \"푸\", \"⊙\", \"›\", \"갉\", \"하\", \"덕\", \"폴\", \"띤\", \"누\", \"😣\", \"컬\", \"금\", \" \", \"낼\", \"덧\", \"괴\", \"밉\", \"뽑\", \"©\", \"헌\", \"뱀\", \"깔\", \"색\", \"짐\", \"잭\", \"걸\", \"쇠\", \"쿡\", \"숨\", \"俠\", \"읊\", \"낙\", \"說\", \"슐\", \"綃\", \"🌳\", \"토\", \"엣\", \"압\", \"첩\", \"꼽\", \"짊\", \"體\", \"擒\", \"벌\", \"ʏ\", \"ㅏ\", \"펙\", \"닌\", \"뒤\", \"충\", \"뜻\", \"︎\", \"퍽\", \"Ⅴ\", \"강\", \"쒀\", \"쿰\", \"늄\", \"지\", \"봐\", \"솟\", \"굴\", \"굳\", \"뻤\", \"⑤\", \"콤\", \"급\", \"뱉\", \"콥\", \"왠\", \"쇄\", \"≪\", \"봅\", \"단\", \"랐\", \"텀\", \"펠\", \"쯔\", \"화\", \"벼\", \"축\", \"良\", \"륵\", \"혈\", \"째\", \"핍\", \"폍\", \"뻐\", \"∼\", \"\", \"뜸\", \"뫼\", \"벗\", \"겔\", \"뿐\", \"훅\", \"ⅳ\", \"꼈\", \"람\", \"판\", \"견\", \"칩\", \"😱\", \"프\", \"퀀\", \"臀\", \"복\", \"겪\", \"잖\", \"운\", \"․\", \"궐\", \"집\", \"젤\", \"놀\", \"‥\", \"잡\", \" \", \"뺀\", \"존\", \"랙\", \"냈\", \"묵\", \"얀\", \"빳\", \"숟\", \"흗\", \"슷\", \"니\", \"웃\", \"립\", \"뀐\", \"샘\", \"녁\", \"엑\", \"컸\", \"긴\", \"왔\", \"획\", \"밴\", \"㈜\", \"\", \"¹\", \"빗\", \"튠\", \"붙\", \"뱅\", \"멸\", \"ㄹ\", \"劫\", \"덜\", \"⑶\", \"써\", \"삐\", \"잼\", \"덟\", \"뭉\", \"팍\", \"자\", \"탬\", \"♤\", \"ㅛ\", \"닉\", \"체\", \"틸\", \"서\", \"슛\", \"킴\", \"우\", \"글\", \"되\", \"짓\", \"맛\", \"담\", \"웍\", \"셰\", \"꾀\", \"썬\", \"학\", \"씽\", \"랫\", \"빡\", \"ʟ\", \"냅\", \"갇\", \"덤\", \"펴\", \"둑\", \"엮\", \"입\", \"퀴\", \"팽\", \"챙\", \"밑\", \"왓\", \"씻\", \"ㅋ\", \"拜\", \"넛\", \"퉁\", \"썩\", \"쑤\", \"🏷\", \"책\", \"엎\", \"ㄴ\", \"늬\", \"신\", \"볶\", \"머\", \"껀\", \"ㅝ\", \"쿼\", \"영\", \"빨\", \"얄\", \"톡\"]",
"lossless": false
},
"01-ai/Yi-1.5-34B @ cc100/ar": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 2813283,
"_n_tokens": 1795801,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/de": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 1814876,
"_n_tokens": 698366,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/en": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 1124813,
"_n_tokens": 270399,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/es": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 1664455,
"_n_tokens": 577018,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/fa": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 2054052,
"_n_tokens": 1337264,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/fr": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 1540504,
"_n_tokens": 533106,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/ja": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 1774770,
"_n_tokens": 740791,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/ko": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 1524839,
"_n_tokens": 1203134,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"01-ai/Yi-1.5-34B @ cc100/zh-Hans": {
"tokenizer": "Yi-1.5-34B",
"organization": "Yi",
"vocab_size": 63992,
"_n_bytes": 2633047,
"_n_tokens": 588729,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen2-72B @ cc100/ar": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen2-72B @ cc100/de": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen2-72B @ cc100/en": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen2-72B @ cc100/es": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"Qwen/Qwen2-72B @ cc100/fa": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen2-72B @ cc100/fr": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen2-72B @ cc100/ja": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"Qwen/Qwen2-72B @ cc100/ko": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"立\", \"樂\", \"陸\", \"累\", \"龍\", \"梁\", \"金\", \"識\", \"女\", \"樂\", \"流\", \"良\", \"不\", \"靈\", \"理\"]",
"lossless": false
},
"Qwen/Qwen2-72B @ cc100/zh-Hans": {
"tokenizer": "Qwen2-72B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"apple/DCLM-7B @ cc100/ar": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 2813283,
"_n_tokens": 1106277,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/de": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 1814876,
"_n_tokens": 583628,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/en": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 1124813,
"_n_tokens": 259357,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/es": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 1664455,
"_n_tokens": 494577,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/fa": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 2054052,
"_n_tokens": 866434,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/fr": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 1540504,
"_n_tokens": 458961,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/ja": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 1774770,
"_n_tokens": 605168,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"apple/DCLM-7B @ cc100/ko": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 1524839,
"_n_tokens": 973288,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"立\", \"樂\", \"陸\", \"累\", \"龍\", \"梁\", \"金\", \"識\", \"女\", \"樂\", \"流\", \"良\", \"不\", \"靈\", \"理\"]",
"lossless": false
},
"apple/DCLM-7B @ cc100/zh-Hans": {
"tokenizer": "DCLM-7B",
"organization": "Apple",
"vocab_size": 50277,
"_n_bytes": 2633047,
"_n_tokens": 1220529,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"google/gemma-2-9b @ cc100/ar": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2813283,
"_n_tokens": 563788,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/de": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1814876,
"_n_tokens": 406876,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/en": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1124813,
"_n_tokens": 258010,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/es": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1664455,
"_n_tokens": 361321,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/fa": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2054052,
"_n_tokens": 363762,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/fr": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1540504,
"_n_tokens": 364551,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/ja": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1774770,
"_n_tokens": 307873,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/ko": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1524839,
"_n_tokens": 454410,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"google/gemma-2-9b @ cc100/zh-Hans": {
"tokenizer": "gemma-2-9b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2633047,
"_n_tokens": 631795,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/ar": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2813283,
"_n_tokens": 614186,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/de": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1814876,
"_n_tokens": 499766,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/en": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1124813,
"_n_tokens": 254944,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/es": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1664455,
"_n_tokens": 433286,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/fa": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2054052,
"_n_tokens": 384591,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/fr": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1540504,
"_n_tokens": 412141,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/ja": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1774770,
"_n_tokens": 414715,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/ko": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1524839,
"_n_tokens": 412433,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"meta-llama/Meta-Llama-3.1-405B @ cc100/zh-Hans": {
"tokenizer": "llama3.1",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2633047,
"_n_tokens": 747405,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/ar": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 2813283,
"_n_tokens": 1388980,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/de": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 1814876,
"_n_tokens": 570172,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/en": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 1124813,
"_n_tokens": 276803,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/es": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 1664455,
"_n_tokens": 504711,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/fa": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 2054052,
"_n_tokens": 1114580,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/fr": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 1540504,
"_n_tokens": 467708,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/ja": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 1774770,
"_n_tokens": 665746,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/ko": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 1524839,
"_n_tokens": 711304,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Large-Instruct-2407 @ cc100/zh-Hans": {
"tokenizer": "Mistral-Large-Instruct-2407",
"organization": "Mistral",
"vocab_size": 32768,
"_n_bytes": 2633047,
"_n_tokens": 1022751,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Nemo-Instruct-2407 @ cc100/en": {
"tokenizer": "Mistral-Nemo-Instruct-2407",
"organization": "Mistral",
"vocab_size": 131072,
"_n_bytes": 1124813,
"_n_tokens": 261607,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Nemo-Instruct-2407 @ cc100/zh-Hans": {
"tokenizer": "Mistral-Nemo-Instruct-2407",
"organization": "Mistral",
"vocab_size": 131072,
"_n_bytes": 2633047,
"_n_tokens": 855499,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Nemo-Instruct-2407 @ cc100/fr": {
"tokenizer": "Mistral-Nemo-Instruct-2407",
"organization": "Mistral",
"vocab_size": 131072,
"_n_bytes": 1540504,
"_n_tokens": 361958,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"mistralai/Mistral-Nemo-Instruct-2407 @ cc100/es": {
"tokenizer": "Mistral-Nemo-Instruct-2407",
"organization": "Mistral",
"vocab_size": 131072,
"_n_bytes": 1664455,
"_n_tokens": 392597,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": true
},
"allenai/OLMo-7B-hf @ cc100/en": {
"tokenizer": "OLMo-7B-hf",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1124813,
"_n_tokens": 259357,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B-hf @ cc100/zh-Hans": {
"tokenizer": "OLMo-7B-hf",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2633047,
"_n_tokens": 1220529,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B-hf @ cc100/fr": {
"tokenizer": "OLMo-7B-hf",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1540504,
"_n_tokens": 458961,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
},
"allenai/OLMo-7B-hf @ cc100/es": {
"tokenizer": "OLMo-7B-hf",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1664455,
"_n_tokens": 494577,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"lossless": false
}
}