wav2vec2-slu-1 / vocab.json
Nguyen Tien
Upload processor
471cf81
raw
history blame
10.2 kB
{
"</s>": 2,
"<pad>": 0,
"<s>": 1,
"<unk>": 3,
"a": 5,
"ac": 689,
"ai": 110,
"am": 116,
"an": 122,
"ang": 429,
"anh": 435,
"ao": 128,
"ap": 687,
"at": 688,
"au": 134,
"aw": 414,
"ay": 144,
"b": 95,
"c": 93,
"ch": 99,
"d": 84,
"e": 11,
"ea": 416,
"ec": 695,
"ee": 415,
"ei": 417,
"em": 200,
"en": 206,
"eng": 453,
"eo": 212,
"ep": 693,
"et": 694,
"eu": 419,
"ew": 418,
"f": 85,
"g": 86,
"gh": 103,
"gi": 686,
"h": 87,
"i": 23,
"ia": 242,
"ic": 692,
"ie": 420,
"im": 248,
"in": 254,
"inh": 491,
"io": 426,
"ip": 691,
"it": 690,
"iu": 263,
"iêm": 469,
"iên": 475,
"iêng": 632,
"iêu": 485,
"iếc": 467,
"iếm": 470,
"iến": 476,
"iếng": 633,
"iếp": 481,
"iết": 483,
"iếu": 486,
"iềm": 471,
"iền": 477,
"iềng": 634,
"iều": 487,
"iểm": 472,
"iển": 478,
"iểng": 635,
"iểu": 488,
"iễm": 473,
"iễn": 479,
"iễng": 636,
"iễu": 489,
"iệc": 468,
"iệm": 474,
"iện": 480,
"iệng": 637,
"iệp": 482,
"iệt": 484,
"iệu": 490,
"j": 88,
"k": 89,
"kh": 100,
"l": 90,
"m": 97,
"n": 96,
"ng": 105,
"ngh": 106,
"nh": 102,
"o": 29,
"oa": 269,
"oai": 499,
"oan": 506,
"oang": 640,
"oanh": 646,
"oao": 512,
"oay": 518,
"oe": 278,
"oen": 530,
"oeo": 532,
"oi": 284,
"om": 290,
"on": 296,
"ong": 538,
"oo": 421,
"oong": 655,
"op": 684,
"ot": 685,
"ou": 422,
"ow": 423,
"oy": 424,
"oà": 275,
"oài": 501,
"oàm": 505,
"oàn": 508,
"oàng": 642,
"oành": 648,
"oác": 497,
"oách": 638,
"oái": 500,
"oán": 507,
"oáng": 641,
"oánh": 647,
"oáo": 513,
"oáp": 514,
"oát": 516,
"oáy": 519,
"oãi": 503,
"oãn": 510,
"oãng": 644,
"oèo": 534,
"oéo": 533,
"oét": 536,
"oóc": 544,
"oăm": 523,
"oăn": 524,
"oăng": 651,
"oạc": 498,
"oạch": 639,
"oại": 504,
"oạn": 511,
"oạng": 645,
"oạnh": 649,
"oạp": 515,
"oạt": 517,
"oải": 502,
"oản": 509,
"oảng": 643,
"oảnh": 650,
"oảy": 520,
"oắc": 521,
"oắn": 526,
"oắng": 652,
"oắt": 528,
"oằn": 527,
"oằng": 653,
"oẳn": 525,
"oẳng": 654,
"oặc": 522,
"oặt": 529,
"oẹ": 283,
"oẹt": 537,
"oẻn": 531,
"oẻo": 535,
"oọc": 545,
"p": 82,
"ph": 101,
"q": 78,
"qu": 104,
"r": 80,
"s": 83,
"sh": 413,
"t": 81,
"th": 98,
"tr": 107,
"u": 47,
"ua": 352,
"ue": 425,
"ui": 365,
"um": 371,
"un": 377,
"ung": 563,
"uy": 387,
"uya": 591,
"uynh": 674,
"uyên": 666,
"uyến": 667,
"uyết": 672,
"uyền": 668,
"uyển": 669,
"uyễn": 670,
"uyện": 671,
"uyệt": 673,
"uân": 552,
"uây": 560,
"uê": 360,
"uênh": 657,
"uôi": 571,
"uôm": 577,
"uôn": 582,
"uông": 658,
"uých": 664,
"uýnh": 676,
"uýt": 589,
"uơ": 403,
"uấn": 553,
"uất": 558,
"uấy": 561,
"uần": 554,
"uầy": 562,
"uẩn": 555,
"uẫn": 556,
"uận": 557,
"uật": 559,
"uế": 361,
"uếch": 656,
"uề": 362,
"uể": 363,
"uệ": 364,
"uốc": 569,
"uối": 572,
"uốm": 578,
"uốn": 583,
"uống": 659,
"uốt": 587,
"uồi": 573,
"uồm": 579,
"uồn": 584,
"uồng": 660,
"uổi": 574,
"uổng": 661,
"uỗi": 575,
"uỗm": 580,
"uỗn": 585,
"uỗng": 662,
"uộc": 570,
"uội": 576,
"uộm": 581,
"uộn": 586,
"uộng": 663,
"uột": 588,
"uở": 404,
"uỳnh": 675,
"uỵch": 665,
"uỵt": 590,
"uỷnh": 677,
"uỷu": 592,
"v": 94,
"w": 79,
"x": 92,
"y": 59,
"yêm": 623,
"yên": 626,
"yêu": 628,
"yếm": 624,
"yến": 627,
"yết": 631,
"yếu": 629,
"yểm": 625,
"yểu": 630,
"z": 91,
"|": 4,
"à": 7,
"ài": 112,
"àm": 118,
"àn": 124,
"àng": 431,
"ành": 437,
"ào": 130,
"àu": 136,
"ày": 146,
"á": 6,
"ác": 108,
"ách": 427,
"ái": 111,
"ám": 117,
"án": 123,
"áng": 430,
"ánh": 436,
"áo": 129,
"áp": 140,
"át": 142,
"áu": 135,
"áy": 145,
"â": 71,
"âm": 170,
"ân": 176,
"âng": 447,
"âu": 186,
"ây": 192,
"ã": 9,
"ãi": 114,
"ãm": 120,
"ãn": 126,
"ãng": 433,
"ãnh": 439,
"ão": 132,
"ãu": 138,
"ãy": 148,
"è": 13,
"èm": 202,
"èn": 208,
"èng": 455,
"èo": 214,
"é": 12,
"éc": 198,
"ém": 201,
"én": 207,
"éng": 454,
"éo": 213,
"ép": 218,
"ét": 220,
"ê": 17,
"êm": 222,
"ên": 227,
"ênh": 459,
"êu": 236,
"ì": 25,
"ìa": 244,
"ìm": 250,
"ìn": 256,
"ình": 493,
"ìu": 265,
"í": 24,
"ía": 243,
"ích": 465,
"ím": 249,
"ín": 255,
"ính": 492,
"íp": 259,
"ít": 261,
"íu": 264,
"ò": 31,
"òa": 271,
"òe": 280,
"òi": 286,
"òm": 292,
"òn": 298,
"òng": 540,
"ó": 30,
"óa": 270,
"óc": 276,
"óe": 279,
"ói": 285,
"óm": 291,
"ón": 297,
"óng": 539,
"óp": 302,
"ót": 304,
"ô": 41,
"ôi": 308,
"ôm": 314,
"ôn": 320,
"ông": 546,
"õ": 33,
"õa": 273,
"õi": 288,
"õm": 294,
"õn": 300,
"õng": 542,
"ù": 49,
"ùa": 354,
"ùi": 367,
"ùm": 373,
"ùn": 379,
"ùng": 565,
"ùy": 389,
"ú": 48,
"úa": 353,
"úc": 358,
"úi": 366,
"úm": 372,
"ún": 378,
"úng": 564,
"úp": 383,
"út": 385,
"úy": 388,
"ý": 61,
"ă": 65,
"ăm": 152,
"ăn": 158,
"ăng": 441,
"đ": 77,
"ĩ": 27,
"ĩa": 246,
"ĩm": 252,
"ĩnh": 495,
"ĩu": 267,
"ũ": 51,
"ũa": 356,
"ũi": 369,
"ũm": 375,
"ũn": 381,
"ũng": 567,
"ũy": 391,
"ơ": 35,
"ơi": 330,
"ơm": 336,
"ơn": 342,
"ư": 53,
"ưa": 393,
"ưng": 593,
"ưu": 407,
"ươi": 601,
"ươm": 607,
"ươn": 611,
"ương": 678,
"ươu": 620,
"ước": 599,
"ưới": 602,
"ướm": 608,
"ướn": 612,
"ướng": 679,
"ướp": 616,
"ướt": 618,
"ướu": 621,
"ười": 603,
"ườm": 609,
"ườn": 613,
"ường": 680,
"ưởi": 604,
"ưởng": 681,
"ưỡi": 605,
"ưỡn": 614,
"ưỡng": 682,
"ược": 600,
"ượi": 606,
"ượm": 610,
"ượn": 615,
"ượng": 683,
"ượp": 617,
"ượt": 619,
"ượu": 622,
"ạ": 10,
"ạc": 109,
"ạch": 428,
"ại": 115,
"ạm": 121,
"ạn": 127,
"ạng": 434,
"ạnh": 440,
"ạo": 133,
"ạp": 141,
"ạt": 143,
"ạu": 139,
"ạy": 149,
"ả": 8,
"ải": 113,
"ảm": 119,
"ản": 125,
"ảng": 432,
"ảnh": 438,
"ảo": 131,
"ảu": 137,
"ảy": 147,
"ấ": 72,
"ấc": 168,
"ấm": 171,
"ấn": 177,
"ấng": 448,
"ấp": 182,
"ất": 184,
"ấu": 187,
"ấy": 193,
"ầ": 73,
"ầm": 172,
"ần": 178,
"ầng": 449,
"ầu": 188,
"ầy": 194,
"ẩ": 74,
"ẩm": 173,
"ẩn": 179,
"ẩng": 450,
"ẩu": 189,
"ẩy": 195,
"ẫ": 75,
"ẫm": 174,
"ẫn": 180,
"ẫng": 451,
"ẫu": 190,
"ẫy": 196,
"ậ": 76,
"ậc": 169,
"ậm": 175,
"ận": 181,
"ậng": 452,
"ập": 183,
"ật": 185,
"ậu": 191,
"ậy": 197,
"ắ": 66,
"ắc": 150,
"ắm": 154,
"ắn": 159,
"ắng": 442,
"ắp": 164,
"ắt": 166,
"ằ": 67,
"ằm": 153,
"ằn": 160,
"ằng": 443,
"ẳ": 68,
"ẳm": 155,
"ẳn": 161,
"ẳng": 444,
"ẵ": 69,
"ẵm": 156,
"ẵn": 162,
"ẵng": 445,
"ặ": 70,
"ặc": 151,
"ặm": 157,
"ặn": 163,
"ặng": 446,
"ặp": 165,
"ặt": 167,
"ẹ": 16,
"ẹc": 199,
"ẹm": 205,
"ẹn": 211,
"ẹo": 217,
"ẹp": 219,
"ẹt": 221,
"ẻ": 14,
"ẻm": 203,
"ẻn": 209,
"ẻng": 456,
"ẻo": 215,
"ẽ": 15,
"ẽm": 204,
"ẽn": 210,
"ẽo": 216,
"ế": 18,
"ếch": 457,
"ếm": 223,
"ến": 228,
"ếnh": 460,
"ếp": 232,
"ết": 234,
"ếu": 237,
"ề": 19,
"ềm": 224,
"ền": 229,
"ềnh": 461,
"ều": 238,
"ể": 20,
"ển": 230,
"ểnh": 462,
"ểu": 239,
"ễ": 21,
"ễm": 225,
"ễnh": 463,
"ễu": 240,
"ệ": 22,
"ệch": 458,
"ệm": 226,
"ện": 231,
"ệnh": 464,
"ệp": 233,
"ệt": 235,
"ệu": 241,
"ỉ": 26,
"ỉa": 245,
"ỉm": 251,
"ỉn": 257,
"ỉnh": 494,
"ỉu": 266,
"ị": 28,
"ịa": 247,
"ịch": 466,
"ịm": 253,
"ịn": 258,
"ịnh": 496,
"ịp": 260,
"ịt": 262,
"ịu": 268,
"ọ": 34,
"ọa": 274,
"ọc": 277,
"ọe": 282,
"ọi": 289,
"ọm": 295,
"ọn": 301,
"ọng": 543,
"ọp": 303,
"ọt": 305,
"ỏ": 32,
"ỏa": 272,
"ỏe": 281,
"ỏi": 287,
"ỏm": 293,
"ỏn": 299,
"ỏng": 541,
"ố": 42,
"ốc": 306,
"ối": 309,
"ốm": 315,
"ốn": 321,
"ống": 547,
"ốp": 326,
"ốt": 328,
"ồ": 43,
"ồi": 310,
"ồm": 316,
"ồn": 322,
"ồng": 548,
"ổ": 44,
"ổi": 311,
"ổm": 317,
"ổn": 323,
"ổng": 549,
"ỗ": 45,
"ỗi": 312,
"ỗm": 318,
"ỗn": 324,
"ỗng": 550,
"ộ": 46,
"ộc": 307,
"ội": 313,
"ộm": 319,
"ộn": 325,
"ộng": 551,
"ộp": 327,
"ột": 329,
"ớ": 36,
"ới": 331,
"ớm": 337,
"ớn": 343,
"ớp": 348,
"ớt": 350,
"ờ": 37,
"ời": 332,
"ờm": 338,
"ờn": 344,
"ở": 38,
"ởi": 333,
"ởm": 339,
"ởn": 345,
"ỡ": 39,
"ỡi": 334,
"ỡm": 340,
"ỡn": 346,
"ợ": 40,
"ợi": 335,
"ợm": 341,
"ợn": 347,
"ợp": 349,
"ợt": 351,
"ụ": 52,
"ụa": 357,
"ục": 359,
"ụi": 370,
"ụm": 376,
"ụn": 382,
"ụng": 568,
"ụp": 384,
"ụt": 386,
"ụy": 392,
"ủ": 50,
"ủa": 355,
"ủi": 368,
"ủm": 374,
"ủn": 380,
"ủng": 566,
"ủy": 390,
"ứ": 54,
"ứa": 394,
"ức": 399,
"ứng": 594,
"ứt": 405,
"ứu": 408,
"ừ": 55,
"ừa": 395,
"ừm": 402,
"ừng": 595,
"ừu": 409,
"ử": 56,
"ửa": 396,
"ửi": 401,
"ửng": 596,
"ửu": 410,
"ữ": 57,
"ữa": 397,
"ững": 597,
"ữu": 411,
"ự": 58,
"ựa": 398,
"ực": 400,
"ựng": 598,
"ựt": 406,
"ựu": 412,
"ỳ": 60,
"ỵ": 64,
"ỷ": 62,
"ỹ": 63
}