waveletdeboshir commited on
Commit
bdf10b9
1 Parent(s): 6e7541c

Remove languages

Browse files
Files changed (2) hide show
  1. special_tokens_map.json +0 -97
  2. tokenizer_config.json +0 -97
special_tokens_map.json CHANGED
@@ -3,104 +3,7 @@
3
  "<|endoftext|>",
4
  "<|startoftranscript|>",
5
  "<|en|>",
6
- "<|zh|>",
7
- "<|de|>",
8
- "<|es|>",
9
  "<|ru|>",
10
- "<|ko|>",
11
- "<|fr|>",
12
- "<|ja|>",
13
- "<|pt|>",
14
- "<|tr|>",
15
- "<|pl|>",
16
- "<|ca|>",
17
- "<|nl|>",
18
- "<|ar|>",
19
- "<|sv|>",
20
- "<|it|>",
21
- "<|id|>",
22
- "<|hi|>",
23
- "<|fi|>",
24
- "<|vi|>",
25
- "<|he|>",
26
- "<|uk|>",
27
- "<|el|>",
28
- "<|ms|>",
29
- "<|cs|>",
30
- "<|ro|>",
31
- "<|da|>",
32
- "<|hu|>",
33
- "<|ta|>",
34
- "<|no|>",
35
- "<|th|>",
36
- "<|ur|>",
37
- "<|hr|>",
38
- "<|bg|>",
39
- "<|lt|>",
40
- "<|la|>",
41
- "<|mi|>",
42
- "<|ml|>",
43
- "<|cy|>",
44
- "<|sk|>",
45
- "<|te|>",
46
- "<|fa|>",
47
- "<|lv|>",
48
- "<|bn|>",
49
- "<|sr|>",
50
- "<|az|>",
51
- "<|sl|>",
52
- "<|kn|>",
53
- "<|et|>",
54
- "<|mk|>",
55
- "<|br|>",
56
- "<|eu|>",
57
- "<|is|>",
58
- "<|hy|>",
59
- "<|ne|>",
60
- "<|mn|>",
61
- "<|bs|>",
62
- "<|kk|>",
63
- "<|sq|>",
64
- "<|sw|>",
65
- "<|gl|>",
66
- "<|mr|>",
67
- "<|pa|>",
68
- "<|si|>",
69
- "<|km|>",
70
- "<|sn|>",
71
- "<|yo|>",
72
- "<|so|>",
73
- "<|af|>",
74
- "<|oc|>",
75
- "<|ka|>",
76
- "<|be|>",
77
- "<|tg|>",
78
- "<|sd|>",
79
- "<|gu|>",
80
- "<|am|>",
81
- "<|yi|>",
82
- "<|lo|>",
83
- "<|uz|>",
84
- "<|fo|>",
85
- "<|ht|>",
86
- "<|ps|>",
87
- "<|tk|>",
88
- "<|nn|>",
89
- "<|mt|>",
90
- "<|sa|>",
91
- "<|lb|>",
92
- "<|my|>",
93
- "<|bo|>",
94
- "<|tl|>",
95
- "<|mg|>",
96
- "<|as|>",
97
- "<|tt|>",
98
- "<|haw|>",
99
- "<|ln|>",
100
- "<|ha|>",
101
- "<|ba|>",
102
- "<|jw|>",
103
- "<|su|>",
104
  "<|translate|>",
105
  "<|transcribe|>",
106
  "<|startoflm|>",
 
3
  "<|endoftext|>",
4
  "<|startoftranscript|>",
5
  "<|en|>",
 
 
 
6
  "<|ru|>",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
  "<|translate|>",
8
  "<|transcribe|>",
9
  "<|startoflm|>",
tokenizer_config.json CHANGED
@@ -87,104 +87,7 @@
87
  "<|endoftext|>",
88
  "<|startoftranscript|>",
89
  "<|en|>",
90
- "<|zh|>",
91
- "<|de|>",
92
- "<|es|>",
93
  "<|ru|>",
94
- "<|ko|>",
95
- "<|fr|>",
96
- "<|ja|>",
97
- "<|pt|>",
98
- "<|tr|>",
99
- "<|pl|>",
100
- "<|ca|>",
101
- "<|nl|>",
102
- "<|ar|>",
103
- "<|sv|>",
104
- "<|it|>",
105
- "<|id|>",
106
- "<|hi|>",
107
- "<|fi|>",
108
- "<|vi|>",
109
- "<|he|>",
110
- "<|uk|>",
111
- "<|el|>",
112
- "<|ms|>",
113
- "<|cs|>",
114
- "<|ro|>",
115
- "<|da|>",
116
- "<|hu|>",
117
- "<|ta|>",
118
- "<|no|>",
119
- "<|th|>",
120
- "<|ur|>",
121
- "<|hr|>",
122
- "<|bg|>",
123
- "<|lt|>",
124
- "<|la|>",
125
- "<|mi|>",
126
- "<|ml|>",
127
- "<|cy|>",
128
- "<|sk|>",
129
- "<|te|>",
130
- "<|fa|>",
131
- "<|lv|>",
132
- "<|bn|>",
133
- "<|sr|>",
134
- "<|az|>",
135
- "<|sl|>",
136
- "<|kn|>",
137
- "<|et|>",
138
- "<|mk|>",
139
- "<|br|>",
140
- "<|eu|>",
141
- "<|is|>",
142
- "<|hy|>",
143
- "<|ne|>",
144
- "<|mn|>",
145
- "<|bs|>",
146
- "<|kk|>",
147
- "<|sq|>",
148
- "<|sw|>",
149
- "<|gl|>",
150
- "<|mr|>",
151
- "<|pa|>",
152
- "<|si|>",
153
- "<|km|>",
154
- "<|sn|>",
155
- "<|yo|>",
156
- "<|so|>",
157
- "<|af|>",
158
- "<|oc|>",
159
- "<|ka|>",
160
- "<|be|>",
161
- "<|tg|>",
162
- "<|sd|>",
163
- "<|gu|>",
164
- "<|am|>",
165
- "<|yi|>",
166
- "<|lo|>",
167
- "<|uz|>",
168
- "<|fo|>",
169
- "<|ht|>",
170
- "<|ps|>",
171
- "<|tk|>",
172
- "<|nn|>",
173
- "<|mt|>",
174
- "<|sa|>",
175
- "<|lb|>",
176
- "<|my|>",
177
- "<|bo|>",
178
- "<|tl|>",
179
- "<|mg|>",
180
- "<|as|>",
181
- "<|tt|>",
182
- "<|haw|>",
183
- "<|ln|>",
184
- "<|ha|>",
185
- "<|ba|>",
186
- "<|jw|>",
187
- "<|su|>",
188
  "<|translate|>",
189
  "<|transcribe|>",
190
  "<|startoflm|>",
 
87
  "<|endoftext|>",
88
  "<|startoftranscript|>",
89
  "<|en|>",
 
 
 
90
  "<|ru|>",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
91
  "<|translate|>",
92
  "<|transcribe|>",
93
  "<|startoflm|>",