brianyan918 commited on
Commit
0c036ab
1 Parent(s): 25d4fb3

Update model

Browse files
Files changed (21) hide show
  1. README.md +1291 -0
  2. data/token_list/bpe_unigram1000/bpe.model +3 -0
  3. exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz +0 -0
  4. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/RESULTS.md +29 -0
  5. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/config.yaml +1194 -0
  6. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/acc.png +0 -0
  7. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/backward_time.png +0 -0
  8. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/cer.png +0 -0
  9. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/cer_ctc.png +0 -0
  10. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/forward_time.png +0 -0
  11. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/gpu_max_cached_mem_GB.png +0 -0
  12. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/iter_time.png +0 -0
  13. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/loss.png +0 -0
  14. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/loss_att.png +0 -0
  15. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/loss_ctc.png +0 -0
  16. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/optim0_lr0.png +0 -0
  17. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/optim_step_time.png +0 -0
  18. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/train_time.png +0 -0
  19. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/wer.png +0 -0
  20. exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/valid.acc.ave.pth +3 -0
  21. meta.yaml +8 -0
README.md ADDED
@@ -0,0 +1,1291 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - espnet
4
+ - audio
5
+ - automatic-speech-recognition
6
+ language: noinfo
7
+ datasets:
8
+ - iwslt22_dialect
9
+ license: cc-by-4.0
10
+ ---
11
+
12
+ ## ESPnet2 ASR model
13
+
14
+ ### `espnet/brianyan918_iwslt22_dialect_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug`
15
+
16
+ This model was trained by Brian Yan using iwslt22_dialect recipe in [espnet](https://github.com/espnet/espnet/).
17
+
18
+ ### Demo: How to use in ESPnet2
19
+
20
+ ```bash
21
+ cd espnet
22
+ git checkout 77fce65312877a132bbae01917ad26b74f6e2e14
23
+ pip install -e .
24
+ cd egs2/iwslt22_dialect/asr1
25
+ ./run.sh --skip_data_prep false --skip_train true --download_model espnet/brianyan918_iwslt22_dialect_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug
26
+ ```
27
+
28
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
29
+ # RESULTS
30
+ ## Environments
31
+ - date: `Wed Feb 2 05:32:30 EST 2022`
32
+ - python version: `3.8.12 (default, Oct 12 2021, 13:49:34) [GCC 7.5.0]`
33
+ - espnet version: `espnet 0.10.6a1`
34
+ - pytorch version: `pytorch 1.8.1`
35
+ - Git hash: `99581e0f5af3ad68851d556645e7292771436df9`
36
+ - Commit date: `Sat Jan 29 11:32:38 2022 -0500`
37
+
38
+ ## asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp
39
+ ### WER
40
+
41
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
42
+ |---|---|---|---|---|---|---|---|---|
43
+ |decode_asr_asr_model_valid.acc.ave/test1|4204|27370|54.7|39.5|5.8|8.8|54.2|87.9|
44
+
45
+ ### CER
46
+
47
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
48
+ |---|---|---|---|---|---|---|---|---|
49
+ |decode_asr_asr_model_valid.acc.ave/test1|4204|145852|84.1|7.1|8.8|11.5|27.4|87.9|
50
+
51
+ ### TER
52
+
53
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
54
+ |---|---|---|---|---|---|---|---|---|
55
+ |decode_asr_asr_model_valid.acc.ave/test1|4204|64424|63.8|22.8|13.4|12.2|48.3|87.9|
56
+
57
+ ## ASR config
58
+
59
+ <details><summary>expand</summary>
60
+
61
+ ```
62
+ config: conf/tuning/train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug.yaml
63
+ print_config: false
64
+ log_level: INFO
65
+ dry_run: false
66
+ iterator_type: sequence
67
+ output_dir: exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp
68
+ ngpu: 1
69
+ seed: 0
70
+ num_workers: 1
71
+ num_att_plot: 3
72
+ dist_backend: nccl
73
+ dist_init_method: env://
74
+ dist_world_size: 4
75
+ dist_rank: 0
76
+ local_rank: 0
77
+ dist_master_addr: localhost
78
+ dist_master_port: 55101
79
+ dist_launcher: null
80
+ multiprocessing_distributed: true
81
+ unused_parameters: false
82
+ sharded_ddp: false
83
+ cudnn_enabled: true
84
+ cudnn_benchmark: false
85
+ cudnn_deterministic: true
86
+ collect_stats: false
87
+ write_collected_feats: false
88
+ max_epoch: 80
89
+ patience: null
90
+ val_scheduler_criterion:
91
+ - valid
92
+ - loss
93
+ early_stopping_criterion:
94
+ - valid
95
+ - loss
96
+ - min
97
+ best_model_criterion:
98
+ - - valid
99
+ - acc
100
+ - max
101
+ keep_nbest_models: 10
102
+ nbest_averaging_interval: 0
103
+ grad_clip: 5.0
104
+ grad_clip_type: 2.0
105
+ grad_noise: false
106
+ accum_grad: 2
107
+ no_forward_run: false
108
+ resume: true
109
+ train_dtype: float32
110
+ use_amp: false
111
+ log_interval: null
112
+ use_matplotlib: true
113
+ use_tensorboard: true
114
+ use_wandb: false
115
+ wandb_project: null
116
+ wandb_id: null
117
+ wandb_entity: null
118
+ wandb_name: null
119
+ wandb_model_log_interval: -1
120
+ detect_anomaly: false
121
+ pretrain_path: null
122
+ init_param: []
123
+ ignore_init_mismatch: false
124
+ freeze_param: []
125
+ num_iters_per_epoch: null
126
+ batch_size: 20
127
+ valid_batch_size: null
128
+ batch_bins: 25000000
129
+ valid_batch_bins: null
130
+ train_shape_file:
131
+ - exp/asr_stats_raw_bpe1000_sp/train/speech_shape
132
+ - exp/asr_stats_raw_bpe1000_sp/train/text_shape.bpe
133
+ valid_shape_file:
134
+ - exp/asr_stats_raw_bpe1000_sp/valid/speech_shape
135
+ - exp/asr_stats_raw_bpe1000_sp/valid/text_shape.bpe
136
+ batch_type: numel
137
+ valid_batch_type: null
138
+ fold_length:
139
+ - 80000
140
+ - 150
141
+ sort_in_batch: descending
142
+ sort_batch: descending
143
+ multiple_iterator: false
144
+ chunk_length: 500
145
+ chunk_shift_ratio: 0.5
146
+ num_cache_chunks: 1024
147
+ train_data_path_and_name_and_type:
148
+ - - /scratch/iwslt22asrdump/raw/train_sp/wav.scp
149
+ - speech
150
+ - kaldi_ark
151
+ - - /scratch/iwslt22asrdump/raw/train_sp/text
152
+ - text
153
+ - text
154
+ valid_data_path_and_name_and_type:
155
+ - - /scratch/iwslt22asrdump/raw/dev/wav.scp
156
+ - speech
157
+ - kaldi_ark
158
+ - - /scratch/iwslt22asrdump/raw/dev/text
159
+ - text
160
+ - text
161
+ allow_variable_data_keys: false
162
+ max_cache_size: 0.0
163
+ max_cache_fd: 32
164
+ valid_max_cache_size: null
165
+ optim: adam
166
+ optim_conf:
167
+ lr: 0.002
168
+ weight_decay: 1.0e-06
169
+ scheduler: warmuplr
170
+ scheduler_conf:
171
+ warmup_steps: 15000
172
+ token_list:
173
+ - <blank>
174
+ - <unk>
175
+ - ّ
176
+ - ي
177
+ - ا
178
+ - ِ
179
+ - ل
180
+ - َ
181
+ - و
182
+ - ه
183
+ - ة
184
+ - م
185
+ - ر
186
+ - ك
187
+ - ▁ما
188
+ - ُ
189
+ - ب
190
+ - ش
191
+ - د
192
+ - ت
193
+ - ▁في
194
+ - َّ
195
+ - ▁ن
196
+ - ▁ي
197
+ - ▁ت
198
+ - ن
199
+ - ▁لا
200
+ - ح
201
+ - ▁ه
202
+ - س
203
+ - وا
204
+ - ▁م
205
+ - ف
206
+ - ▁إي
207
+ - ع
208
+ - ▁ب
209
+ - ها
210
+ - ط
211
+ - ى
212
+ - ق
213
+ - ▁الل
214
+ - ▁أ
215
+ - ج
216
+ - ▁والل
217
+ - ▁و
218
+ - ▁إيه
219
+ - ▁ا
220
+ - ▁يا
221
+ - ز
222
+ - ▁تو
223
+ - ▁بش
224
+ - ص
225
+ - ▁أه
226
+ - خ
227
+ - ات
228
+ - ▁إنت
229
+ - ▁أنا
230
+ - نا
231
+ - ▁شن
232
+ - ▁ق
233
+ - ▁ش
234
+ - ▁ك
235
+ - يت
236
+ - ين
237
+ - ▁ف
238
+ - ار
239
+ - ▁قال
240
+ - ▁باهي
241
+ - ▁ع
242
+ - ▁من
243
+ - ▁ل
244
+ - ▁مش
245
+ - ▁كان
246
+ - ▁حت
247
+ - ▁ول
248
+ - هم
249
+ - ▁ر
250
+ - ان
251
+ - ▁س
252
+ - ض
253
+ - ني
254
+ - ▁بال
255
+ - ▁على
256
+ - ▁متاع
257
+ - ▁كي
258
+ - ▁ال
259
+ - ▁ح
260
+ - ▁كل
261
+ - ▁آنا
262
+ - ▁الم
263
+ - ▁خ
264
+ - ▁الس
265
+ - ▁وال
266
+ - ون
267
+ - ور
268
+ - ▁أم
269
+ - ▁هك
270
+ - ▁آش
271
+ - ▁الد
272
+ - ▁عاد
273
+ - ▁ج
274
+ - ▁معناها
275
+ - ▁مع
276
+ - اش
277
+ - ▁الص
278
+ - ▁نهار
279
+ - ▁لل
280
+ - لها
281
+ - ▁تي
282
+ - ▁رب
283
+ - ▁خاطر
284
+ - ▁أكهو
285
+ - غ
286
+ - ▁شي
287
+ - الل
288
+ - ام
289
+ - تها
290
+ - ▁ون
291
+ - ▁آك
292
+ - ▁فهمت
293
+ - وم
294
+ - ▁موش
295
+ - مشي
296
+ - ▁ص
297
+ - ▁اليوم
298
+ - ▁مر
299
+ - ست
300
+ - ▁الب
301
+ - ▁لاباس
302
+ - تلي
303
+ - ▁الكل
304
+ - ▁عال
305
+ - ذ
306
+ - ▁فم
307
+ - ▁الك
308
+ - ▁حاجة
309
+ - ▁شوي
310
+ - اكا
311
+ - ▁ياخي
312
+ - ▁هاني
313
+ - ▁صح
314
+ - اس
315
+ - ▁آه
316
+ - ▁برشة
317
+ - ▁الن
318
+ - ▁وت
319
+ - ▁الج
320
+ - لك
321
+ - ▁راهو
322
+ - سم
323
+ - ▁الح
324
+ - مت
325
+ - ▁الت
326
+ - ▁بعد
327
+ - اج
328
+ - عد
329
+ - ▁انشا
330
+ - وش
331
+ - لت
332
+ - ▁وين
333
+ - ث
334
+ - ▁ولا
335
+ - ▁باش
336
+ - ▁فيها
337
+ - نت
338
+ - ▁إ
339
+ - ▁الأ
340
+ - ▁الف
341
+ - ▁إم
342
+ - ▁واحد
343
+ - ▁ألو
344
+ - ▁عندي
345
+ - ▁أك
346
+ - ▁خل
347
+ - ▁وي
348
+ - ▁تعمل
349
+ - أ
350
+ - ▁ريت
351
+ - ▁وأ
352
+ - ▁تعرف
353
+ - بت
354
+ - ▁الع
355
+ - ▁مشيت
356
+ - ▁وه
357
+ - ▁حاصيلو
358
+ - ▁بالل
359
+ - ▁نعمل
360
+ - ▁غ
361
+ - ▁تجي
362
+ - ▁يجي
363
+ - ▁كيفاش
364
+ - ▁عملت
365
+ - ظ
366
+ - اك
367
+ - ▁هاو
368
+ - ▁اش
369
+ - ▁قد
370
+ - ▁نق
371
+ - ▁د
372
+ - ▁زادا
373
+ - ▁فيه
374
+ - رة
375
+ - ▁بر
376
+ - ▁الش
377
+ - ▁ز
378
+ - ▁كيما
379
+ - ▁الا
380
+ - ند
381
+ - عم
382
+ - ▁نح
383
+ - ▁بنتي
384
+ - ▁نمشي
385
+ - ▁عليك
386
+ - ▁نعرفش
387
+ - ▁كهو
388
+ - ▁وم
389
+ - ▁ط
390
+ - تي
391
+ - ▁خير
392
+ - ▁آ
393
+ - مش
394
+ - ▁عليه
395
+ - له
396
+ - حت
397
+ - ▁إيا
398
+ - ▁أحنا
399
+ - ▁تع
400
+ - الا
401
+ - عب
402
+ - ▁ديما
403
+ - ▁تت
404
+ - ▁جو
405
+ - ▁مالا
406
+ - ▁أو
407
+ - ▁قلتلك
408
+ - ▁معنتها
409
+ - لنا
410
+ - ▁شكون
411
+ - ▁تحب
412
+ - بر
413
+ - ▁الر
414
+ - ▁وا
415
+ - ▁الق
416
+ - اء
417
+ - ▁عل
418
+ - ▁البارح
419
+ - ▁وخ
420
+ - ▁سافا
421
+ - ▁هوما
422
+ - ▁ولدي
423
+ - ▁
424
+ - ▁نعرف
425
+ - يف
426
+ - رت
427
+ - ▁وب
428
+ - ▁روح
429
+ - ▁علاش
430
+ - ▁هاذاك
431
+ - ▁رو
432
+ - وس
433
+ - ▁جا
434
+ - ▁كيف
435
+ - طر
436
+ - ▁غادي
437
+ - يكا
438
+ - عمل
439
+ - ▁نحب
440
+ - ▁عندك
441
+ - ▁وما
442
+ - ▁فر
443
+ - اني
444
+ - ▁قلتله
445
+ - ▁الط
446
+ - فر
447
+ - ▁دار
448
+ - ▁عليها
449
+ - ▁يعمل
450
+ - ▁نت
451
+ - ▁تح
452
+ - باح
453
+ - ▁ماهو
454
+ - ▁وكل
455
+ - ▁وع
456
+ - قت
457
+ - ▁فهمتك
458
+ - عر
459
+ - ▁وس
460
+ - ▁تر
461
+ - ▁سي
462
+ - يلة
463
+ - ▁قلت
464
+ - ▁رمضان
465
+ - صل
466
+ - ▁آما
467
+ - ▁الواحد
468
+ - ▁بيه
469
+ - ▁ثلاثة
470
+ - ▁فهمتني
471
+ - ▁ها
472
+ - بط
473
+ - ▁مازال
474
+ - قل
475
+ - ▁بالك
476
+ - ▁معناتها
477
+ - ▁ور
478
+ - ▁قلتلها
479
+ - ▁يس
480
+ - رب
481
+ - ▁ام
482
+ - ▁وبعد
483
+ - ▁الث
484
+ - ▁وإنت
485
+ - ▁بحذا
486
+ - ▁لازم
487
+ - ْ
488
+ - ▁بن
489
+ - قرا
490
+ - سك
491
+ - ▁يت
492
+ - خل
493
+ - ▁فه
494
+ - عت
495
+ - ▁هاك
496
+ - ▁تق
497
+ - ▁قبل
498
+ - ▁وك
499
+ - ▁نقول
500
+ - ▁الز
501
+ - حم
502
+ - ▁عادش
503
+ - حكي
504
+ - وها
505
+ - بة
506
+ - نس
507
+ - طل
508
+ - ▁علاه
509
+ - ذا
510
+ - ▁سا
511
+ - ▁طل
512
+ - الي
513
+ - ▁يق
514
+ - ▁دو
515
+ - حوا
516
+ - حد
517
+ - ▁نشوف
518
+ - نة
519
+ - ▁لي
520
+ - ▁تك
521
+ - ▁نا
522
+ - ▁هاذ
523
+ - ▁خويا
524
+ - ▁المر
525
+ - ▁وينك
526
+ - ▁البر
527
+ - ▁أتو
528
+ - ينا
529
+ - ▁حل
530
+ - ولي
531
+ - ▁ثم
532
+ - ▁عم
533
+ - ▁آي
534
+ - ▁قر
535
+ - از
536
+ - ▁وح
537
+ - كش
538
+ - بعة
539
+ - ▁كيفاه
540
+ - ▁نع
541
+ - ▁الحمدلله
542
+ - ▁ياسر
543
+ - ▁الخ
544
+ - ▁معاك
545
+ - ▁معاه
546
+ - ▁تقول
547
+ - دة
548
+ - ▁حكاية
549
+ - تش
550
+ - ▁حس
551
+ - ▁غدوا
552
+ - ▁بالحق
553
+ - روا
554
+ - وز
555
+ - ▁تخ
556
+ - ▁العيد
557
+ - رجع
558
+ - ▁بالي
559
+ - ▁جات
560
+ - ▁وج
561
+ - حة
562
+ - ▁وش
563
+ - ▁آخر
564
+ - ▁طا
565
+ - ▁مت
566
+ - لقا
567
+ - تك
568
+ - ▁مس
569
+ - ▁راني
570
+ - كون
571
+ - ▁صاحب
572
+ - ▁هاكا
573
+ - ▁قول
574
+ - ▁عر
575
+ - ▁عنده
576
+ - ▁يلزم
577
+ - ▁هاذا
578
+ - ▁يخ
579
+ - ▁وقتاش
580
+ - ▁وقت
581
+ - بع
582
+ - ▁العش
583
+ - ▁هاذي
584
+ - هاش
585
+ - ينة
586
+ - ▁هاذاكا
587
+ - عطي
588
+ - ▁تنج
589
+ - ▁باهية
590
+ - نيا
591
+ - فت
592
+ - ▁يحب
593
+ - ▁تف
594
+ - ▁أهلا
595
+ - وف
596
+ - ▁غدوة
597
+ - ▁بيك
598
+ - ▁بد
599
+ - عن
600
+ - ▁در
601
+ - ▁ننج
602
+ - هار
603
+ - ▁الحكاية
604
+ - مون
605
+ - وق
606
+ - ▁نورمال
607
+ - ▁عندها
608
+ - خر
609
+ - ▁بو
610
+ - ▁حب
611
+ - ▁آكا
612
+ - ▁وف
613
+ - ▁هاذيكا
614
+ - ▁ديجا
615
+ - ▁وق
616
+ - ▁طي
617
+ - لتل
618
+ - بعث
619
+ - ▁تص
620
+ - رك
621
+ - ▁مانيش
622
+ - ▁العادة
623
+ - ▁شوف
624
+ - ضر
625
+ - ▁يمشي
626
+ - ▁نعملوا
627
+ - ▁عرفت
628
+ - ▁زال
629
+ - ▁متع
630
+ - ▁عمل
631
+ - ▁بيها
632
+ - ▁نحكي
633
+ - اع
634
+ - ▁نج
635
+ - معة
636
+ - ▁والكل
637
+ - عناها
638
+ - ▁يعي
639
+ - ▁نجي
640
+ - ستن
641
+ - ▁هاذيك
642
+ - ▁عام
643
+ - ▁فلوس
644
+ - قة
645
+ - تين
646
+ - ▁بالقدا
647
+ - لهم
648
+ - ▁تخدم
649
+ - ▁ٱ
650
+ - ▁شيء
651
+ - ▁راهي
652
+ - ▁جاب
653
+ - ولاد
654
+ - ابل
655
+ - ▁ماك
656
+ - عة
657
+ - ▁نمشيوا
658
+ - وني
659
+ - شري
660
+ - بار
661
+ - انس
662
+ - ▁وقتها
663
+ - ▁جديد
664
+ - ▁يز
665
+ - ▁كر
666
+ - ▁حاسيلو
667
+ - ▁شق
668
+ - ▁اه
669
+ - ▁سايي
670
+ - ▁انشالل
671
+ - رج
672
+ - مني
673
+ - ▁بلا
674
+ - ▁صحيح
675
+ - ▁غير
676
+ - ▁يخدم
677
+ - مان
678
+ - وكا
679
+ - ▁عند
680
+ - ▁قاعدة
681
+ - ▁تس
682
+ - ربة
683
+ - ▁راس
684
+ - ▁حط
685
+ - ▁نكل
686
+ - تني
687
+ - ▁الو
688
+ - سيون
689
+ - ▁عندنا
690
+ - ▁لو
691
+ - ▁ست
692
+ - صف
693
+ - ▁ض
694
+ - ▁كامل
695
+ - ▁نخدم
696
+ - ▁يبدا
697
+ - ▁دونك
698
+ - ▁أمور
699
+ - رات
700
+ - ▁تونس
701
+ - بدا
702
+ - ▁تحكي
703
+ - ▁سو
704
+ - ▁جاي
705
+ - ▁وحدة
706
+ - ▁ساعة
707
+ - حنا
708
+ - ▁بكري
709
+ - ▁إل
710
+ - ▁وبر
711
+ - ▁كم
712
+ - ▁تبدا
713
+ - ارة
714
+ - ادي
715
+ - رق
716
+ - لوا
717
+ - ▁يمكن
718
+ - ▁خاط
719
+ - ▁وص
720
+ - جين
721
+ - ▁هاذاي
722
+ - ▁هز
723
+ - قد
724
+ - ▁قل
725
+ - ▁وكهو
726
+ - ▁نص
727
+ - ▁دي
728
+ - لقى
729
+ - ▁وأنا
730
+ - سين
731
+ - ▁يح
732
+ - ▁ماشي
733
+ - ▁شو
734
+ - ▁خذيت
735
+ - امات
736
+ - ▁كنت
737
+ - خرج
738
+ - ▁لقيت
739
+ - رتاح
740
+ - كس
741
+ - ▁حاجات
742
+ - ▁مريق
743
+ - ▁مل
744
+ - ليفون
745
+ - اوا
746
+ - ▁شفت
747
+ - ▁عاملة
748
+ - ▁تن
749
+ - ▁والا
750
+ - سأل
751
+ - ▁حد
752
+ - ▁قاللك
753
+ - ▁العباد
754
+ - ▁عالاخ
755
+ - ▁وآك
756
+ - ▁ماني
757
+ - ▁ناخذ
758
+ - ▁حم
759
+ - ▁الإ
760
+ - ▁ماضي
761
+ - ▁ث
762
+ - الة
763
+ - ▁أخرى
764
+ - رين
765
+ - ▁تشوف
766
+ - ▁نخرج
767
+ - ▁أربعة
768
+ - ▁ألف
769
+ - نيش
770
+ - ▁هاي
771
+ - آ
772
+ - ▁فيك
773
+ - رشة
774
+ - ولة
775
+ - فلة
776
+ - ▁بابا
777
+ - ▁أما
778
+ - ▁روحي
779
+ - ▁فيهم
780
+ - ▁رج
781
+ - ▁ليك
782
+ - ونس
783
+ - يرة
784
+ - ▁وأكهو
785
+ - ندي
786
+ - ▁صار
787
+ - شك
788
+ - ▁نرو
789
+ - ▁آكهو
790
+ - ▁تش
791
+ - ▁غاديكا
792
+ - ▁معاها
793
+ - ▁لب
794
+ - ▁أذاكا
795
+ - ▁آني
796
+ - ▁يوم
797
+ - عملوا
798
+ - ▁نقعد
799
+ - دوا
800
+ - ▁عد
801
+ - سمع
802
+ - متني
803
+ - ▁الخدمة
804
+ - ▁مازلت
805
+ - ▁قعدت
806
+ - ايا
807
+ - ▁برك
808
+ - قعد
809
+ - ▁خرجت
810
+ - ضح
811
+ - ▁قالل
812
+ - ▁يقول
813
+ - ▁وفي
814
+ - ▁حق
815
+ - ختي
816
+ - ▁يعني
817
+ - خدم
818
+ - ▁جيت
819
+ - ▁نرمال
820
+ - طف
821
+ - ▁عجب
822
+ - ▁تقعد
823
+ - ▁مشينا
824
+ - اية
825
+ - ▁خدمة
826
+ - لدي
827
+ - روف
828
+ - ▁الفطر
829
+ - ▁مشكل
830
+ - ▁سل
831
+ - ▁وآنا
832
+ - الط
833
+ - ▁بالس
834
+ - ▁هانا
835
+ - ▁أوه
836
+ - ▁أذيكا
837
+ - ▁وإ
838
+ - ▁عليهم
839
+ - ▁حالة
840
+ - جت
841
+ - قضي
842
+ - ▁لق
843
+ - ▁ونصف
844
+ - سعة
845
+ - عطيه
846
+ - عاو
847
+ - خانة
848
+ - ▁مخ
849
+ - ▁شبيك
850
+ - بيعة
851
+ - ▁أهوك
852
+ - يني
853
+ - ▁تعد
854
+ - ▁خال
855
+ - ▁قريب
856
+ - ▁راك
857
+ - ▁قالت
858
+ - ▁لتو
859
+ - ▁أكثر
860
+ - اعة
861
+ - ▁يظهرلي
862
+ - ▁ماشية
863
+ - سمعني
864
+ - ▁نسيت
865
+ - ▁ينج
866
+ - ▁الحمدلل
867
+ - هدي
868
+ - ▁وشن
869
+ - ▁تطي
870
+ - ▁هنا
871
+ - ▁نسمع
872
+ - ▁إنتوما
873
+ - ▁نحكيلك
874
+ - ▁قاعد
875
+ - ▁اسمعني
876
+ - خرين
877
+ - إ
878
+ - ماعة
879
+ - ▁بالر
880
+ - ▁دا
881
+ - ▁عمر
882
+ - ▁نشري
883
+ - ▁قهوة
884
+ - ▁تبارك
885
+ - ▁صب
886
+ - ▁مشات
887
+ - غر
888
+ - ▁شريت
889
+ - ▁عامل
890
+ - ▁زوج
891
+ - ثنين
892
+ - ▁برب
893
+ - ريق
894
+ - ▁نكم
895
+ - ▁لم
896
+ - بيب
897
+ - ▁مياة
898
+ - ▁مالل
899
+ - ▁قعد
900
+ - ▁سخون
901
+ - قس
902
+ - ▁وحده
903
+ - ▁اسمع
904
+ - ▁خمسة
905
+ - ▁غالي
906
+ - ▁الأو
907
+ - رلي
908
+ - ▁العظيم
909
+ - ▁ترو
910
+ - تهم
911
+ - كري
912
+ - ▁نجيب
913
+ - ▁جملة
914
+ - قول
915
+ - ▁قلتلي
916
+ - ▁إيجا
917
+ - ▁يقعد
918
+ - ▁إيام
919
+ - ▁يعطيك
920
+ - ▁نخل
921
+ - ▁دب
922
+ - يمة
923
+ - رهبة
924
+ - ▁نهز
925
+ - ▁محم
926
+ - ▁بين
927
+ - غار
928
+ - ▁نحنا
929
+ - ▁بون
930
+ - ▁الغ
931
+ - ▁شهر
932
+ - ▁بار
933
+ - رقة
934
+ - ▁نطي
935
+ - ئ
936
+ - ترو
937
+ - ▁ملا
938
+ - ▁الكرهبة
939
+ - ▁باه
940
+ - ▁عالإخ
941
+ - ▁عباد
942
+ - ▁بلاصة
943
+ - ▁مشى
944
+ - بيع
945
+ - ▁نفس
946
+ - ▁عملنا
947
+ - ▁واح
948
+ - ▁أحلاه
949
+ - ▁بحذاك
950
+ - ▁لأ
951
+ - ▁دخ
952
+ - باب
953
+ - ▁ودر
954
+ - ▁غالب
955
+ - ▁ناكل
956
+ - ▁مثلا
957
+ - ء
958
+ - ▁راقد
959
+ - ▁تفر
960
+ - ▁الوقت
961
+ - ▁تاخذ
962
+ - حذا
963
+ - نتر
964
+ - ▁نبدا
965
+ - ▁حال
966
+ - ▁مريم
967
+ - الم
968
+ - ▁جمعة
969
+ - رجول
970
+ - ▁معايا
971
+ - ▁تخرج
972
+ - ▁باس
973
+ - ▁ساعات
974
+ - ▁عندهم
975
+ - ▁نتفر
976
+ - مسة
977
+ - ▁الجمعة
978
+ - بعين
979
+ - ▁أكاهو
980
+ - ▁ميش
981
+ - مراة
982
+ - ▁خذا
983
+ - ▁ظ
984
+ - ▁سيدي
985
+ - ▁معاي
986
+ - ▁شبيه
987
+ - ▁حكا
988
+ - ▁سف
989
+ - ▁بعضنا
990
+ - ▁بالض
991
+ - ▁ليلة
992
+ - ▁زعما
993
+ - ▁الحق
994
+ - مضان
995
+ - ▁صعيب
996
+ - ▁قالتلك
997
+ - ً
998
+ - ملة
999
+ - ▁بق
1000
+ - عرف
1001
+ - لاطة
1002
+ - ▁خرج
1003
+ - ▁أخت
1004
+ - ▁تقوللي
1005
+ - ▁معانا
1006
+ - ▁صغير
1007
+ - ▁إسمه
1008
+ - ▁بعض
1009
+ - ▁العام
1010
+ - ▁علينا
1011
+ - ▁يتع
1012
+ - ▁فاش
1013
+ - ▁شع
1014
+ - ▁معاهم
1015
+ - ▁يسالش
1016
+ - ▁لهنا
1017
+ - ▁سمعت
1018
+ - ▁البار
1019
+ - ▁نتصو
1020
+ - ▁الاخ
1021
+ - ▁وكان
1022
+ - وبة
1023
+ - دمة
1024
+ - ▁كون
1025
+ - ▁مبعد
1026
+ - ▁تسمع
1027
+ - ▁بعيد
1028
+ - ▁تاكل
1029
+ - ▁نلقا
1030
+ - لامة
1031
+ - لاثة
1032
+ - ▁ذ
1033
+ - ▁تحس
1034
+ - ▁الواح
1035
+ - ▁لدار
1036
+ - ▁فاتت
1037
+ - ▁تاو
1038
+ - ▁أحوالك
1039
+ - ▁عاملين
1040
+ - ▁كبيرة
1041
+ - عجب
1042
+ - ▁بنت
1043
+ - ▁بيدي
1044
+ - ▁حكيت
1045
+ - ▁تحط
1046
+ - ▁مسكينة
1047
+ - ▁هاذوكم
1048
+ - ▁نزيد
1049
+ - لاث
1050
+ - ▁عشرة
1051
+ - ▁عيني
1052
+ - ▁تعب
1053
+ - ▁ياكل
1054
+ - ▁وزيد
1055
+ - ▁طول
1056
+ - ▁حمدلله
1057
+ - ▁وقتاه
1058
+ - ▁معناه
1059
+ - ▁وآش
1060
+ - ▁ووه
1061
+ - ▁وواحد
1062
+ - ▁نشوفوا
1063
+ - ▁عيد
1064
+ - ▁بصراحة
1065
+ - ▁بحذانا
1066
+ - ▁قاعدين
1067
+ - ▁راجل
1068
+ - ▁وحدي
1069
+ - ▁وعشرين
1070
+ - ▁لين
1071
+ - ▁خايب
1072
+ - ▁قالتله
1073
+ - ▁تهز
1074
+ - عيد
1075
+ - ▁كبير
1076
+ - ▁يعرف
1077
+ - ▁عارف
1078
+ - ▁الفلوس
1079
+ - ▁زايد
1080
+ - ▁خدمت
1081
+ - ▁هاذوما
1082
+ - ▁سلاطة
1083
+ - ▁فارغة
1084
+ - ▁ساعتين
1085
+ - ▁تبد
1086
+ - ▁راو
1087
+ - ▁مائة
1088
+ - ▁بعضهم
1089
+ - ▁ظاهرلي
1090
+ - ▁الفازة
1091
+ - كتب
1092
+ - ▁القهوة
1093
+ - سبوك
1094
+ - ▁زاد
1095
+ - ▁ضرب
1096
+ - حكيلي
1097
+ - ▁فوق
1098
+ - ▁عاود
1099
+ - ▁راي
1100
+ - ▁ومبعد
1101
+ - ▁حوايج
1102
+ - ▁دخلت
1103
+ - ▁يقوللك
1104
+ - ▁زيد
1105
+ - ▁زلت
1106
+ - لفزة
1107
+ - ▁وقال
1108
+ - ▁يهب
1109
+ - ▁يلزمني
1110
+ - ▁الحمد
1111
+ - ▁أذي
1112
+ - طبيعت
1113
+ - ▁دورة
1114
+ - ▁عالأقل
1115
+ - ▁آذاك
1116
+ - ▁وبال
1117
+ - ▁الجاي
1118
+ - عطيني
1119
+ - ▁ياخذ
1120
+ - ▁احكيلي
1121
+ - ▁نهبط
1122
+ - ▁رقدت
1123
+ - بلاصة
1124
+ - ▁عزيز
1125
+ - ▁صغار
1126
+ - ▁أقسم
1127
+ - ▁جيب
1128
+ - ▁وصلت
1129
+ - ▁أحوال
1130
+ - ▁جيست
1131
+ - ▁جماعة
1132
+ - سئل
1133
+ - ▁خوذ
1134
+ - ▁يهز
1135
+ - ▁الأخرى
1136
+ - ▁آلاف
1137
+ - ▁إسمع
1138
+ - ▁الحقيقة
1139
+ - ▁ناقص
1140
+ - ▁حاط
1141
+ - ▁موجود
1142
+ - عباد
1143
+ - ▁آذيك
1144
+ - ▁خارج
1145
+ - ▁الخير
1146
+ - ▁البنات
1147
+ - بقى
1148
+ - ▁طرف
1149
+ - ▁سينون
1150
+ - ▁ماذاب
1151
+ - ▁البحر
1152
+ - ▁نرقد
1153
+ - مدلله
1154
+ - ▁إيجى
1155
+ - ▁خالتي
1156
+ - ▁فازة
1157
+ - ▁بريك
1158
+ - ▁شريبتك
1159
+ - ▁تطلع
1160
+ - ؤ
1161
+ - ▁المشكلة
1162
+ - ▁طري
1163
+ - ▁مادام
1164
+ - ▁طلبت
1165
+ - ▁يلعب
1166
+ - ▁نعاود
1167
+ - ▁وحدك
1168
+ - ▁ظاهر
1169
+ - ٱ
1170
+ - ژ
1171
+ - ٍ
1172
+ - <sos/eos>
1173
+ init: null
1174
+ input_size: null
1175
+ ctc_conf:
1176
+ dropout_rate: 0.0
1177
+ ctc_type: builtin
1178
+ reduce: true
1179
+ ignore_nan_grad: true
1180
+ joint_net_conf: null
1181
+ model_conf:
1182
+ ctc_weight: 0.3
1183
+ lsm_weight: 0.1
1184
+ length_normalized_loss: false
1185
+ use_preprocessor: true
1186
+ token_type: bpe
1187
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1188
+ non_linguistic_symbols: null
1189
+ cleaner: null
1190
+ g2p: null
1191
+ speech_volume_normalize: null
1192
+ rir_scp: null
1193
+ rir_apply_prob: 1.0
1194
+ noise_scp: null
1195
+ noise_apply_prob: 1.0
1196
+ noise_db_range: '13_15'
1197
+ frontend: default
1198
+ frontend_conf:
1199
+ n_fft: 512
1200
+ hop_length: 256
1201
+ fs: 16k
1202
+ specaug: specaug
1203
+ specaug_conf:
1204
+ apply_time_warp: true
1205
+ time_warp_window: 5
1206
+ time_warp_mode: bicubic
1207
+ apply_freq_mask: true
1208
+ freq_mask_width_range:
1209
+ - 0
1210
+ - 27
1211
+ num_freq_mask: 2
1212
+ apply_time_mask: true
1213
+ time_mask_width_ratio_range:
1214
+ - 0.0
1215
+ - 0.05
1216
+ num_time_mask: 5
1217
+ normalize: global_mvn
1218
+ normalize_conf:
1219
+ stats_file: exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz
1220
+ preencoder: null
1221
+ preencoder_conf: {}
1222
+ encoder: conformer
1223
+ encoder_conf:
1224
+ output_size: 256
1225
+ attention_heads: 4
1226
+ linear_units: 1024
1227
+ num_blocks: 12
1228
+ dropout_rate: 0.1
1229
+ positional_dropout_rate: 0.1
1230
+ attention_dropout_rate: 0.1
1231
+ input_layer: conv2d
1232
+ normalize_before: true
1233
+ macaron_style: true
1234
+ rel_pos_type: latest
1235
+ pos_enc_layer_type: rel_pos
1236
+ selfattention_layer_type: rel_selfattn
1237
+ activation_type: swish
1238
+ use_cnn_module: true
1239
+ cnn_module_kernel: 31
1240
+ postencoder: null
1241
+ postencoder_conf: {}
1242
+ decoder: transformer
1243
+ decoder_conf:
1244
+ attention_heads: 4
1245
+ linear_units: 2048
1246
+ num_blocks: 6
1247
+ dropout_rate: 0.1
1248
+ positional_dropout_rate: 0.1
1249
+ self_attention_dropout_rate: 0.1
1250
+ src_attention_dropout_rate: 0.1
1251
+ required:
1252
+ - output_dir
1253
+ - token_list
1254
+ version: 0.10.6a1
1255
+ distributed: true
1256
+ ```
1257
+
1258
+ </details>
1259
+
1260
+
1261
+
1262
+ ### Citing ESPnet
1263
+
1264
+ ```BibTex
1265
+ @inproceedings{watanabe2018espnet,
1266
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1267
+ title={{ESPnet}: End-to-End Speech Processing Toolkit},
1268
+ year={2018},
1269
+ booktitle={Proceedings of Interspeech},
1270
+ pages={2207--2211},
1271
+ doi={10.21437/Interspeech.2018-1456},
1272
+ url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
1273
+ }
1274
+
1275
+
1276
+
1277
+
1278
+ ```
1279
+
1280
+ or arXiv:
1281
+
1282
+ ```bibtex
1283
+ @misc{watanabe2018espnet,
1284
+ title={ESPnet: End-to-End Speech Processing Toolkit},
1285
+ author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
1286
+ year={2018},
1287
+ eprint={1804.00015},
1288
+ archivePrefix={arXiv},
1289
+ primaryClass={cs.CL}
1290
+ }
1291
+ ```
data/token_list/bpe_unigram1000/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b27d1d64f3af87cbf228b01f406b915d36cceae638f8563a26d1bd9237f947af
3
+ size 255317
exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz ADDED
Binary file (1.4 kB). View file
 
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/RESULTS.md ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <!-- Generated by scripts/utils/show_asr_result.sh -->
2
+ # RESULTS
3
+ ## Environments
4
+ - date: `Wed Feb 2 05:32:30 EST 2022`
5
+ - python version: `3.8.12 (default, Oct 12 2021, 13:49:34) [GCC 7.5.0]`
6
+ - espnet version: `espnet 0.10.6a1`
7
+ - pytorch version: `pytorch 1.8.1`
8
+ - Git hash: `99581e0f5af3ad68851d556645e7292771436df9`
9
+ - Commit date: `Sat Jan 29 11:32:38 2022 -0500`
10
+
11
+ ## asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp
12
+ ### WER
13
+
14
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
15
+ |---|---|---|---|---|---|---|---|---|
16
+ |decode_asr_asr_model_valid.acc.ave/test1|4204|27370|54.7|39.5|5.8|8.8|54.2|87.9|
17
+
18
+ ### CER
19
+
20
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
21
+ |---|---|---|---|---|---|---|---|---|
22
+ |decode_asr_asr_model_valid.acc.ave/test1|4204|145852|84.1|7.1|8.8|11.5|27.4|87.9|
23
+
24
+ ### TER
25
+
26
+ |dataset|Snt|Wrd|Corr|Sub|Del|Ins|Err|S.Err|
27
+ |---|---|---|---|---|---|---|---|---|
28
+ |decode_asr_asr_model_valid.acc.ave/test1|4204|64424|63.8|22.8|13.4|12.2|48.3|87.9|
29
+
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/config.yaml ADDED
@@ -0,0 +1,1194 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/tuning/train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ dry_run: false
5
+ iterator_type: sequence
6
+ output_dir: exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp
7
+ ngpu: 1
8
+ seed: 0
9
+ num_workers: 1
10
+ num_att_plot: 3
11
+ dist_backend: nccl
12
+ dist_init_method: env://
13
+ dist_world_size: 4
14
+ dist_rank: 0
15
+ local_rank: 0
16
+ dist_master_addr: localhost
17
+ dist_master_port: 55101
18
+ dist_launcher: null
19
+ multiprocessing_distributed: true
20
+ unused_parameters: false
21
+ sharded_ddp: false
22
+ cudnn_enabled: true
23
+ cudnn_benchmark: false
24
+ cudnn_deterministic: true
25
+ collect_stats: false
26
+ write_collected_feats: false
27
+ max_epoch: 80
28
+ patience: null
29
+ val_scheduler_criterion:
30
+ - valid
31
+ - loss
32
+ early_stopping_criterion:
33
+ - valid
34
+ - loss
35
+ - min
36
+ best_model_criterion:
37
+ - - valid
38
+ - acc
39
+ - max
40
+ keep_nbest_models: 10
41
+ nbest_averaging_interval: 0
42
+ grad_clip: 5.0
43
+ grad_clip_type: 2.0
44
+ grad_noise: false
45
+ accum_grad: 2
46
+ no_forward_run: false
47
+ resume: true
48
+ train_dtype: float32
49
+ use_amp: false
50
+ log_interval: null
51
+ use_matplotlib: true
52
+ use_tensorboard: true
53
+ use_wandb: false
54
+ wandb_project: null
55
+ wandb_id: null
56
+ wandb_entity: null
57
+ wandb_name: null
58
+ wandb_model_log_interval: -1
59
+ detect_anomaly: false
60
+ pretrain_path: null
61
+ init_param: []
62
+ ignore_init_mismatch: false
63
+ freeze_param: []
64
+ num_iters_per_epoch: null
65
+ batch_size: 20
66
+ valid_batch_size: null
67
+ batch_bins: 25000000
68
+ valid_batch_bins: null
69
+ train_shape_file:
70
+ - exp/asr_stats_raw_bpe1000_sp/train/speech_shape
71
+ - exp/asr_stats_raw_bpe1000_sp/train/text_shape.bpe
72
+ valid_shape_file:
73
+ - exp/asr_stats_raw_bpe1000_sp/valid/speech_shape
74
+ - exp/asr_stats_raw_bpe1000_sp/valid/text_shape.bpe
75
+ batch_type: numel
76
+ valid_batch_type: null
77
+ fold_length:
78
+ - 80000
79
+ - 150
80
+ sort_in_batch: descending
81
+ sort_batch: descending
82
+ multiple_iterator: false
83
+ chunk_length: 500
84
+ chunk_shift_ratio: 0.5
85
+ num_cache_chunks: 1024
86
+ train_data_path_and_name_and_type:
87
+ - - /scratch/iwslt22asrdump/raw/train_sp/wav.scp
88
+ - speech
89
+ - kaldi_ark
90
+ - - /scratch/iwslt22asrdump/raw/train_sp/text
91
+ - text
92
+ - text
93
+ valid_data_path_and_name_and_type:
94
+ - - /scratch/iwslt22asrdump/raw/dev/wav.scp
95
+ - speech
96
+ - kaldi_ark
97
+ - - /scratch/iwslt22asrdump/raw/dev/text
98
+ - text
99
+ - text
100
+ allow_variable_data_keys: false
101
+ max_cache_size: 0.0
102
+ max_cache_fd: 32
103
+ valid_max_cache_size: null
104
+ optim: adam
105
+ optim_conf:
106
+ lr: 0.002
107
+ weight_decay: 1.0e-06
108
+ scheduler: warmuplr
109
+ scheduler_conf:
110
+ warmup_steps: 15000
111
+ token_list:
112
+ - <blank>
113
+ - <unk>
114
+ - ّ
115
+ - ي
116
+ - ا
117
+ - ِ
118
+ - ل
119
+ - َ
120
+ - و
121
+ - ه
122
+ - ة
123
+ - م
124
+ - ر
125
+ - ك
126
+ - ▁ما
127
+ - ُ
128
+ - ب
129
+ - ش
130
+ - د
131
+ - ت
132
+ - ▁في
133
+ - َّ
134
+ - ▁ن
135
+ - ▁ي
136
+ - ▁ت
137
+ - ن
138
+ - ▁لا
139
+ - ح
140
+ - ▁ه
141
+ - س
142
+ - وا
143
+ - ▁م
144
+ - ف
145
+ - ▁إي
146
+ - ع
147
+ - ▁ب
148
+ - ها
149
+ - ط
150
+ - ى
151
+ - ق
152
+ - ▁الل
153
+ - ▁أ
154
+ - ج
155
+ - ▁والل
156
+ - ▁و
157
+ - ▁إيه
158
+ - ▁ا
159
+ - ▁يا
160
+ - ز
161
+ - ▁تو
162
+ - ▁بش
163
+ - ص
164
+ - ▁أه
165
+ - خ
166
+ - ات
167
+ - ▁إنت
168
+ - ▁أنا
169
+ - نا
170
+ - ▁شن
171
+ - ▁ق
172
+ - ▁ش
173
+ - ▁ك
174
+ - يت
175
+ - ين
176
+ - ▁ف
177
+ - ار
178
+ - ▁قال
179
+ - ▁باهي
180
+ - ▁ع
181
+ - ▁من
182
+ - ▁ل
183
+ - ▁مش
184
+ - ▁كان
185
+ - ▁حت
186
+ - ▁ول
187
+ - هم
188
+ - ▁ر
189
+ - ان
190
+ - ▁س
191
+ - ض
192
+ - ني
193
+ - ▁بال
194
+ - ▁على
195
+ - ▁متاع
196
+ - ▁كي
197
+ - ▁ال
198
+ - ▁ح
199
+ - ▁كل
200
+ - ▁آنا
201
+ - ▁الم
202
+ - ▁خ
203
+ - ▁الس
204
+ - ▁وال
205
+ - ون
206
+ - ور
207
+ - ▁أم
208
+ - ▁هك
209
+ - ▁آش
210
+ - ▁الد
211
+ - ▁عاد
212
+ - ▁ج
213
+ - ▁معناها
214
+ - ▁مع
215
+ - اش
216
+ - ▁الص
217
+ - ▁نهار
218
+ - ▁لل
219
+ - لها
220
+ - ▁تي
221
+ - ▁رب
222
+ - ▁خاطر
223
+ - ▁أكهو
224
+ - غ
225
+ - ▁شي
226
+ - الل
227
+ - ام
228
+ - تها
229
+ - ▁ون
230
+ - ▁آك
231
+ - ▁فهمت
232
+ - وم
233
+ - ▁موش
234
+ - مشي
235
+ - ▁ص
236
+ - ▁اليوم
237
+ - ▁مر
238
+ - ست
239
+ - ▁الب
240
+ - ▁لاباس
241
+ - تلي
242
+ - ▁الكل
243
+ - ▁عال
244
+ - ذ
245
+ - ▁فم
246
+ - ▁الك
247
+ - ▁حاجة
248
+ - ▁شوي
249
+ - اكا
250
+ - ▁ياخي
251
+ - ▁هاني
252
+ - ▁صح
253
+ - اس
254
+ - ▁آه
255
+ - ▁برشة
256
+ - ▁الن
257
+ - ▁وت
258
+ - ▁الج
259
+ - لك
260
+ - ▁راهو
261
+ - سم
262
+ - ▁الح
263
+ - مت
264
+ - ▁الت
265
+ - ▁بعد
266
+ - اج
267
+ - عد
268
+ - ▁انشا
269
+ - وش
270
+ - لت
271
+ - ▁وين
272
+ - ث
273
+ - ▁ولا
274
+ - ▁باش
275
+ - ▁فيها
276
+ - نت
277
+ - ▁إ
278
+ - ▁الأ
279
+ - ▁الف
280
+ - ▁إم
281
+ - ▁واحد
282
+ - ▁ألو
283
+ - ▁عندي
284
+ - ▁أك
285
+ - ▁خل
286
+ - ▁وي
287
+ - ▁تعمل
288
+ - أ
289
+ - ▁ريت
290
+ - ▁وأ
291
+ - ▁تعرف
292
+ - بت
293
+ - ▁الع
294
+ - ▁مشيت
295
+ - ▁وه
296
+ - ▁حاصيلو
297
+ - ▁بالل
298
+ - ▁نعمل
299
+ - ▁غ
300
+ - ▁تجي
301
+ - ▁يجي
302
+ - ▁كيفاش
303
+ - ▁عملت
304
+ - ظ
305
+ - اك
306
+ - ▁هاو
307
+ - ▁اش
308
+ - ▁قد
309
+ - ▁نق
310
+ - ▁د
311
+ - ▁زادا
312
+ - ▁فيه
313
+ - رة
314
+ - ▁بر
315
+ - ▁الش
316
+ - ▁ز
317
+ - ▁كيما
318
+ - ▁الا
319
+ - ند
320
+ - عم
321
+ - ▁نح
322
+ - ▁بنتي
323
+ - ▁نمشي
324
+ - ▁عليك
325
+ - ▁نعرفش
326
+ - ▁كهو
327
+ - ▁وم
328
+ - ▁ط
329
+ - تي
330
+ - ▁خير
331
+ - ▁آ
332
+ - مش
333
+ - ▁عليه
334
+ - له
335
+ - حت
336
+ - ▁إيا
337
+ - ▁أحنا
338
+ - ▁تع
339
+ - الا
340
+ - عب
341
+ - ▁ديما
342
+ - ▁تت
343
+ - ▁جو
344
+ - ▁مالا
345
+ - ▁أو
346
+ - ▁قلتلك
347
+ - ▁معنتها
348
+ - لنا
349
+ - ▁شكون
350
+ - ▁تحب
351
+ - بر
352
+ - ▁الر
353
+ - ▁وا
354
+ - ▁الق
355
+ - اء
356
+ - ▁عل
357
+ - ▁البارح
358
+ - ▁وخ
359
+ - ▁سافا
360
+ - ▁هوما
361
+ - ▁ولدي
362
+ - ▁
363
+ - ▁نعرف
364
+ - يف
365
+ - رت
366
+ - ▁وب
367
+ - ▁روح
368
+ - ▁علاش
369
+ - ▁هاذاك
370
+ - ▁رو
371
+ - وس
372
+ - ▁جا
373
+ - ▁كيف
374
+ - طر
375
+ - ▁غادي
376
+ - يكا
377
+ - عمل
378
+ - ▁نحب
379
+ - ▁عندك
380
+ - ▁وما
381
+ - ▁فر
382
+ - اني
383
+ - ▁قلتله
384
+ - ▁الط
385
+ - فر
386
+ - ▁دار
387
+ - ▁عليها
388
+ - ▁يعمل
389
+ - ▁نت
390
+ - ▁تح
391
+ - باح
392
+ - ▁ماهو
393
+ - ▁وكل
394
+ - ▁وع
395
+ - قت
396
+ - ▁فهمتك
397
+ - عر
398
+ - ▁وس
399
+ - ▁تر
400
+ - ▁سي
401
+ - يلة
402
+ - ▁قلت
403
+ - ▁رمضان
404
+ - صل
405
+ - ▁آما
406
+ - ▁الواحد
407
+ - ▁بيه
408
+ - ▁ثلاثة
409
+ - ▁فهمتني
410
+ - ▁ها
411
+ - بط
412
+ - ▁مازال
413
+ - قل
414
+ - ▁بالك
415
+ - ▁معناتها
416
+ - ▁ور
417
+ - ▁قلتلها
418
+ - ▁يس
419
+ - رب
420
+ - ▁ام
421
+ - ▁وبعد
422
+ - ▁الث
423
+ - ▁وإنت
424
+ - ▁بحذا
425
+ - ▁لازم
426
+ - ْ
427
+ - ▁بن
428
+ - قرا
429
+ - سك
430
+ - ▁يت
431
+ - خل
432
+ - ▁فه
433
+ - عت
434
+ - ▁هاك
435
+ - ▁تق
436
+ - ▁قبل
437
+ - ▁وك
438
+ - ▁نقول
439
+ - ▁الز
440
+ - حم
441
+ - ▁عادش
442
+ - حكي
443
+ - وها
444
+ - بة
445
+ - نس
446
+ - طل
447
+ - ▁علاه
448
+ - ذا
449
+ - ▁سا
450
+ - ▁طل
451
+ - الي
452
+ - ▁يق
453
+ - ▁دو
454
+ - حوا
455
+ - حد
456
+ - ▁نشوف
457
+ - نة
458
+ - ▁لي
459
+ - ▁تك
460
+ - ▁نا
461
+ - ▁هاذ
462
+ - ▁خويا
463
+ - ▁المر
464
+ - ▁وينك
465
+ - ▁البر
466
+ - ▁أتو
467
+ - ينا
468
+ - ▁حل
469
+ - ولي
470
+ - ▁ثم
471
+ - ▁عم
472
+ - ▁آي
473
+ - ▁قر
474
+ - از
475
+ - ▁وح
476
+ - كش
477
+ - بعة
478
+ - ▁كيفاه
479
+ - ▁نع
480
+ - ▁الحمدلله
481
+ - ▁ياسر
482
+ - ▁الخ
483
+ - ▁معاك
484
+ - ▁معاه
485
+ - ▁تقول
486
+ - دة
487
+ - ▁حكاية
488
+ - تش
489
+ - ▁حس
490
+ - ▁غدوا
491
+ - ▁بالحق
492
+ - روا
493
+ - وز
494
+ - ▁تخ
495
+ - ▁العيد
496
+ - رجع
497
+ - ▁بالي
498
+ - ▁جات
499
+ - ▁وج
500
+ - حة
501
+ - ▁وش
502
+ - ▁آخر
503
+ - ▁طا
504
+ - ▁مت
505
+ - لقا
506
+ - تك
507
+ - ▁مس
508
+ - ▁راني
509
+ - كون
510
+ - ▁صاحب
511
+ - ▁هاكا
512
+ - ▁قول
513
+ - ▁عر
514
+ - ▁عنده
515
+ - ▁يلزم
516
+ - ▁هاذا
517
+ - ▁يخ
518
+ - ▁وقتاش
519
+ - ▁وقت
520
+ - بع
521
+ - ▁العش
522
+ - ▁هاذي
523
+ - هاش
524
+ - ينة
525
+ - ▁هاذاكا
526
+ - عطي
527
+ - ▁تنج
528
+ - ▁باهية
529
+ - نيا
530
+ - فت
531
+ - ▁يحب
532
+ - ▁تف
533
+ - ▁أهلا
534
+ - وف
535
+ - ▁غدوة
536
+ - ▁بيك
537
+ - ▁بد
538
+ - عن
539
+ - ▁در
540
+ - ▁ننج
541
+ - هار
542
+ - ▁الحكاية
543
+ - مون
544
+ - وق
545
+ - ▁نورمال
546
+ - ▁عندها
547
+ - خر
548
+ - ▁بو
549
+ - ▁حب
550
+ - ▁آكا
551
+ - ▁وف
552
+ - ▁هاذيكا
553
+ - ▁ديجا
554
+ - ▁وق
555
+ - ▁طي
556
+ - لتل
557
+ - بعث
558
+ - ▁تص
559
+ - رك
560
+ - ▁مانيش
561
+ - ▁العادة
562
+ - ▁شوف
563
+ - ضر
564
+ - ▁يمشي
565
+ - ▁نعملوا
566
+ - ▁عرفت
567
+ - ▁زال
568
+ - ▁متع
569
+ - ▁عمل
570
+ - ▁بيها
571
+ - ▁نحكي
572
+ - اع
573
+ - ▁نج
574
+ - معة
575
+ - ▁والكل
576
+ - عناها
577
+ - ▁يعي
578
+ - ▁نجي
579
+ - ستن
580
+ - ▁هاذيك
581
+ - ▁عام
582
+ - ▁فلوس
583
+ - قة
584
+ - تين
585
+ - ▁بالقدا
586
+ - لهم
587
+ - ▁تخدم
588
+ - ▁ٱ
589
+ - ▁شيء
590
+ - ▁راهي
591
+ - ▁جاب
592
+ - ولاد
593
+ - ابل
594
+ - ▁ماك
595
+ - عة
596
+ - ▁نمشيوا
597
+ - وني
598
+ - شري
599
+ - بار
600
+ - انس
601
+ - ▁وقتها
602
+ - ▁جديد
603
+ - ▁يز
604
+ - ▁كر
605
+ - ▁حاسيلو
606
+ - ▁شق
607
+ - ▁اه
608
+ - ▁سايي
609
+ - ▁انشالل
610
+ - رج
611
+ - مني
612
+ - ▁بلا
613
+ - ▁صحيح
614
+ - ▁غير
615
+ - ▁يخدم
616
+ - مان
617
+ - وكا
618
+ - ▁عند
619
+ - ▁قاعدة
620
+ - ▁تس
621
+ - ربة
622
+ - ▁راس
623
+ - ▁حط
624
+ - ▁نكل
625
+ - تني
626
+ - ▁الو
627
+ - سيون
628
+ - ▁عندنا
629
+ - ▁لو
630
+ - ▁ست
631
+ - صف
632
+ - ▁ض
633
+ - ▁كامل
634
+ - ▁نخدم
635
+ - ▁يبدا
636
+ - ▁دونك
637
+ - ▁أمور
638
+ - رات
639
+ - ▁تونس
640
+ - بدا
641
+ - ▁تحكي
642
+ - ▁سو
643
+ - ▁جاي
644
+ - ▁وحدة
645
+ - ▁ساعة
646
+ - حنا
647
+ - ▁بكري
648
+ - ▁إل
649
+ - ▁وبر
650
+ - ▁كم
651
+ - ▁تبدا
652
+ - ارة
653
+ - ادي
654
+ - رق
655
+ - لوا
656
+ - ▁يمكن
657
+ - ▁خاط
658
+ - ▁وص
659
+ - جين
660
+ - ▁هاذاي
661
+ - ▁هز
662
+ - قد
663
+ - ▁قل
664
+ - ▁وكهو
665
+ - ▁نص
666
+ - ▁دي
667
+ - لقى
668
+ - ▁وأنا
669
+ - سين
670
+ - ▁يح
671
+ - ▁ماشي
672
+ - ▁شو
673
+ - ▁خذيت
674
+ - امات
675
+ - ▁كنت
676
+ - خرج
677
+ - ▁لقيت
678
+ - رتاح
679
+ - كس
680
+ - ▁حاجات
681
+ - ▁مريق
682
+ - ▁مل
683
+ - ليفون
684
+ - اوا
685
+ - ▁شفت
686
+ - ▁عاملة
687
+ - ▁تن
688
+ - ▁والا
689
+ - سأل
690
+ - ▁حد
691
+ - ▁قاللك
692
+ - ▁العباد
693
+ - ▁عالاخ
694
+ - ▁وآك
695
+ - ▁ماني
696
+ - ▁ناخذ
697
+ - ▁حم
698
+ - ▁الإ
699
+ - ▁ماضي
700
+ - ▁ث
701
+ - الة
702
+ - ▁أخرى
703
+ - رين
704
+ - ▁تشوف
705
+ - ▁نخرج
706
+ - ▁أربعة
707
+ - ▁ألف
708
+ - نيش
709
+ - ▁هاي
710
+ - آ
711
+ - ▁فيك
712
+ - رشة
713
+ - ولة
714
+ - فلة
715
+ - ▁بابا
716
+ - ▁أما
717
+ - ▁روحي
718
+ - ▁فيهم
719
+ - ▁رج
720
+ - ▁ليك
721
+ - ونس
722
+ - يرة
723
+ - ▁وأكهو
724
+ - ندي
725
+ - ▁صار
726
+ - شك
727
+ - ▁نرو
728
+ - ▁آكهو
729
+ - ▁تش
730
+ - ▁غاديكا
731
+ - ▁معاها
732
+ - ▁لب
733
+ - ▁أذاكا
734
+ - ▁آني
735
+ - ▁يوم
736
+ - عملوا
737
+ - ▁نقعد
738
+ - دوا
739
+ - ▁عد
740
+ - سمع
741
+ - متني
742
+ - ▁الخدمة
743
+ - ▁مازلت
744
+ - ▁قعدت
745
+ - ايا
746
+ - ▁برك
747
+ - قعد
748
+ - ▁خرجت
749
+ - ضح
750
+ - ▁قالل
751
+ - ▁يقول
752
+ - ▁وفي
753
+ - ▁حق
754
+ - ختي
755
+ - ▁يعني
756
+ - خدم
757
+ - ▁جيت
758
+ - ▁نرمال
759
+ - طف
760
+ - ▁عجب
761
+ - ▁تقعد
762
+ - ▁مشينا
763
+ - اية
764
+ - ▁خدمة
765
+ - لدي
766
+ - روف
767
+ - ▁الفطر
768
+ - ▁مشكل
769
+ - ▁سل
770
+ - ▁وآنا
771
+ - الط
772
+ - ▁بالس
773
+ - ▁هانا
774
+ - ▁أوه
775
+ - ▁أذيكا
776
+ - ▁وإ
777
+ - ▁عليهم
778
+ - ▁حالة
779
+ - جت
780
+ - قضي
781
+ - ▁لق
782
+ - ▁ونصف
783
+ - سعة
784
+ - عطيه
785
+ - عاو
786
+ - خانة
787
+ - ▁مخ
788
+ - ▁شبيك
789
+ - بيعة
790
+ - ▁أهوك
791
+ - يني
792
+ - ▁تعد
793
+ - ▁خال
794
+ - ▁قريب
795
+ - ▁راك
796
+ - ▁قالت
797
+ - ▁لتو
798
+ - ▁أكثر
799
+ - اعة
800
+ - ▁يظهرلي
801
+ - ▁ماشية
802
+ - سمعني
803
+ - ▁نسيت
804
+ - ▁ينج
805
+ - ▁الحمدلل
806
+ - هدي
807
+ - ▁وشن
808
+ - ▁تطي
809
+ - ▁هنا
810
+ - ▁نسمع
811
+ - ▁إنتوما
812
+ - ▁نحكيلك
813
+ - ▁قاعد
814
+ - ▁اسمعني
815
+ - خرين
816
+ - إ
817
+ - ماعة
818
+ - ▁بالر
819
+ - ▁دا
820
+ - ▁عمر
821
+ - ▁نشري
822
+ - ▁قهوة
823
+ - ▁تبارك
824
+ - ▁صب
825
+ - ▁مشات
826
+ - غر
827
+ - ▁شريت
828
+ - ▁عامل
829
+ - ▁زوج
830
+ - ثنين
831
+ - ▁برب
832
+ - ريق
833
+ - ▁نكم
834
+ - ▁لم
835
+ - بيب
836
+ - ▁مياة
837
+ - ▁مالل
838
+ - ▁قعد
839
+ - ▁سخون
840
+ - قس
841
+ - ▁وحده
842
+ - ▁اسمع
843
+ - ▁خمسة
844
+ - ▁غالي
845
+ - ▁الأو
846
+ - رلي
847
+ - ▁العظيم
848
+ - ▁ترو
849
+ - تهم
850
+ - كري
851
+ - ▁نجيب
852
+ - ▁جملة
853
+ - قول
854
+ - ▁قلتلي
855
+ - ▁إيجا
856
+ - ▁يقعد
857
+ - ▁إيام
858
+ - ▁يعطيك
859
+ - ▁نخل
860
+ - ▁دب
861
+ - يمة
862
+ - رهبة
863
+ - ▁نهز
864
+ - ▁محم
865
+ - ▁بين
866
+ - غار
867
+ - ▁نحنا
868
+ - ▁بون
869
+ - ▁الغ
870
+ - ▁شهر
871
+ - ▁بار
872
+ - رقة
873
+ - ▁نطي
874
+ - ئ
875
+ - ترو
876
+ - ▁ملا
877
+ - ▁الكرهبة
878
+ - ▁باه
879
+ - ▁عالإخ
880
+ - ▁عباد
881
+ - ▁بلاصة
882
+ - ▁مشى
883
+ - بيع
884
+ - ▁نفس
885
+ - ▁عملنا
886
+ - ▁واح
887
+ - ▁أحلاه
888
+ - ▁بحذاك
889
+ - ▁لأ
890
+ - ▁دخ
891
+ - باب
892
+ - ▁ودر
893
+ - ▁غالب
894
+ - ▁ناكل
895
+ - ▁مثلا
896
+ - ء
897
+ - ▁راقد
898
+ - ▁تفر
899
+ - ▁الوقت
900
+ - ▁تاخذ
901
+ - حذا
902
+ - نتر
903
+ - ▁نبدا
904
+ - ▁حال
905
+ - ▁مريم
906
+ - الم
907
+ - ▁جمعة
908
+ - رجول
909
+ - ▁معايا
910
+ - ▁تخرج
911
+ - ▁باس
912
+ - ▁ساعات
913
+ - ▁عندهم
914
+ - ▁نتفر
915
+ - مسة
916
+ - ▁الجمعة
917
+ - بعين
918
+ - ▁أكاهو
919
+ - ▁ميش
920
+ - مراة
921
+ - ▁خذا
922
+ - ▁ظ
923
+ - ▁سيدي
924
+ - ▁معاي
925
+ - ▁شبيه
926
+ - ▁حكا
927
+ - ▁سف
928
+ - ▁بعضنا
929
+ - ▁بالض
930
+ - ▁ليلة
931
+ - ▁زعما
932
+ - ▁الحق
933
+ - مضان
934
+ - ▁صعيب
935
+ - ▁قالتلك
936
+ - ً
937
+ - ملة
938
+ - ▁بق
939
+ - عرف
940
+ - لاطة
941
+ - ▁خرج
942
+ - ▁أخت
943
+ - ▁تقوللي
944
+ - ▁معانا
945
+ - ▁صغير
946
+ - ▁إسمه
947
+ - ▁بعض
948
+ - ▁العام
949
+ - ▁علينا
950
+ - ▁يتع
951
+ - ▁فاش
952
+ - ▁شع
953
+ - ▁معاهم
954
+ - ▁يسالش
955
+ - ▁لهنا
956
+ - ▁سمعت
957
+ - ▁البار
958
+ - ▁نتصو
959
+ - ▁الاخ
960
+ - ▁وكان
961
+ - وبة
962
+ - دمة
963
+ - ▁كون
964
+ - ▁مبعد
965
+ - ▁تسمع
966
+ - ▁بعيد
967
+ - ▁تاكل
968
+ - ▁نلقا
969
+ - لامة
970
+ - لاثة
971
+ - ▁ذ
972
+ - ▁تحس
973
+ - ▁الواح
974
+ - ▁لدار
975
+ - ▁فاتت
976
+ - ▁تاو
977
+ - ▁أحوالك
978
+ - ▁عاملين
979
+ - ▁كبيرة
980
+ - عجب
981
+ - ▁بنت
982
+ - ▁بيدي
983
+ - ▁حكيت
984
+ - ▁تحط
985
+ - ▁مسكينة
986
+ - ▁هاذوكم
987
+ - ▁نزيد
988
+ - لاث
989
+ - ▁عشرة
990
+ - ▁عيني
991
+ - ▁تعب
992
+ - ▁ياكل
993
+ - ▁وزيد
994
+ - ▁طول
995
+ - ▁حمدلله
996
+ - ▁وقتاه
997
+ - ▁معناه
998
+ - ▁وآش
999
+ - ▁ووه
1000
+ - ▁وواحد
1001
+ - ▁نشوفوا
1002
+ - ▁عيد
1003
+ - ▁بصراحة
1004
+ - ▁بحذانا
1005
+ - ▁قاعدين
1006
+ - ▁راجل
1007
+ - ▁وحدي
1008
+ - ▁وعشرين
1009
+ - ▁لين
1010
+ - ▁خايب
1011
+ - ▁قالتله
1012
+ - ▁تهز
1013
+ - عيد
1014
+ - ▁كبير
1015
+ - ▁يعرف
1016
+ - ▁عارف
1017
+ - ▁الفلوس
1018
+ - ▁زايد
1019
+ - ▁خدمت
1020
+ - ▁هاذوما
1021
+ - ▁سلاطة
1022
+ - ▁فارغة
1023
+ - ▁ساعتين
1024
+ - ▁تبد
1025
+ - ▁راو
1026
+ - ▁مائة
1027
+ - ▁بعضهم
1028
+ - ▁ظاهرلي
1029
+ - ▁الفازة
1030
+ - كتب
1031
+ - ▁القهوة
1032
+ - سبوك
1033
+ - ▁زاد
1034
+ - ▁ضرب
1035
+ - حكيلي
1036
+ - ▁فوق
1037
+ - ▁عاود
1038
+ - ▁راي
1039
+ - ▁ومبعد
1040
+ - ▁حوايج
1041
+ - ▁دخلت
1042
+ - ▁يقوللك
1043
+ - ▁زيد
1044
+ - ▁زلت
1045
+ - لفزة
1046
+ - ▁وقال
1047
+ - ▁يهب
1048
+ - ▁يلزمني
1049
+ - ▁الحمد
1050
+ - ▁أذي
1051
+ - طبيعت
1052
+ - ▁دورة
1053
+ - ▁عالأقل
1054
+ - ▁آذاك
1055
+ - ▁وبال
1056
+ - ▁الجاي
1057
+ - عطيني
1058
+ - ▁ياخذ
1059
+ - ▁احكيلي
1060
+ - ▁نهبط
1061
+ - ▁رقدت
1062
+ - بلاصة
1063
+ - ▁عزيز
1064
+ - ▁صغار
1065
+ - ▁أقسم
1066
+ - ▁جيب
1067
+ - ▁وصلت
1068
+ - ▁أحوال
1069
+ - ▁جيست
1070
+ - ▁جماعة
1071
+ - سئل
1072
+ - ▁خوذ
1073
+ - ▁يهز
1074
+ - ▁الأخرى
1075
+ - ▁آلاف
1076
+ - ▁إسمع
1077
+ - ▁الحقيقة
1078
+ - ▁ناقص
1079
+ - ▁حاط
1080
+ - ▁موجود
1081
+ - عباد
1082
+ - ▁آذيك
1083
+ - ▁خارج
1084
+ - ▁الخير
1085
+ - ▁البنات
1086
+ - بقى
1087
+ - ▁طرف
1088
+ - ▁سينون
1089
+ - ▁ماذاب
1090
+ - ▁البحر
1091
+ - ▁نرقد
1092
+ - مدلله
1093
+ - ▁إيجى
1094
+ - ▁خالتي
1095
+ - ▁فازة
1096
+ - ▁بريك
1097
+ - ▁شريبتك
1098
+ - ▁تطلع
1099
+ - ؤ
1100
+ - ▁المشكلة
1101
+ - ▁طري
1102
+ - ▁مادام
1103
+ - ▁طلبت
1104
+ - ▁يلعب
1105
+ - ▁نعاود
1106
+ - ▁وحدك
1107
+ - ▁ظاهر
1108
+ - ٱ
1109
+ - ژ
1110
+ - ٍ
1111
+ - <sos/eos>
1112
+ init: null
1113
+ input_size: null
1114
+ ctc_conf:
1115
+ dropout_rate: 0.0
1116
+ ctc_type: builtin
1117
+ reduce: true
1118
+ ignore_nan_grad: true
1119
+ joint_net_conf: null
1120
+ model_conf:
1121
+ ctc_weight: 0.3
1122
+ lsm_weight: 0.1
1123
+ length_normalized_loss: false
1124
+ use_preprocessor: true
1125
+ token_type: bpe
1126
+ bpemodel: data/token_list/bpe_unigram1000/bpe.model
1127
+ non_linguistic_symbols: null
1128
+ cleaner: null
1129
+ g2p: null
1130
+ speech_volume_normalize: null
1131
+ rir_scp: null
1132
+ rir_apply_prob: 1.0
1133
+ noise_scp: null
1134
+ noise_apply_prob: 1.0
1135
+ noise_db_range: '13_15'
1136
+ frontend: default
1137
+ frontend_conf:
1138
+ n_fft: 512
1139
+ hop_length: 256
1140
+ fs: 16k
1141
+ specaug: specaug
1142
+ specaug_conf:
1143
+ apply_time_warp: true
1144
+ time_warp_window: 5
1145
+ time_warp_mode: bicubic
1146
+ apply_freq_mask: true
1147
+ freq_mask_width_range:
1148
+ - 0
1149
+ - 27
1150
+ num_freq_mask: 2
1151
+ apply_time_mask: true
1152
+ time_mask_width_ratio_range:
1153
+ - 0.0
1154
+ - 0.05
1155
+ num_time_mask: 5
1156
+ normalize: global_mvn
1157
+ normalize_conf:
1158
+ stats_file: exp/asr_stats_raw_bpe1000_sp/train/feats_stats.npz
1159
+ preencoder: null
1160
+ preencoder_conf: {}
1161
+ encoder: conformer
1162
+ encoder_conf:
1163
+ output_size: 256
1164
+ attention_heads: 4
1165
+ linear_units: 1024
1166
+ num_blocks: 12
1167
+ dropout_rate: 0.1
1168
+ positional_dropout_rate: 0.1
1169
+ attention_dropout_rate: 0.1
1170
+ input_layer: conv2d
1171
+ normalize_before: true
1172
+ macaron_style: true
1173
+ rel_pos_type: latest
1174
+ pos_enc_layer_type: rel_pos
1175
+ selfattention_layer_type: rel_selfattn
1176
+ activation_type: swish
1177
+ use_cnn_module: true
1178
+ cnn_module_kernel: 31
1179
+ postencoder: null
1180
+ postencoder_conf: {}
1181
+ decoder: transformer
1182
+ decoder_conf:
1183
+ attention_heads: 4
1184
+ linear_units: 2048
1185
+ num_blocks: 6
1186
+ dropout_rate: 0.1
1187
+ positional_dropout_rate: 0.1
1188
+ self_attention_dropout_rate: 0.1
1189
+ src_attention_dropout_rate: 0.1
1190
+ required:
1191
+ - output_dir
1192
+ - token_list
1193
+ version: 0.10.6a1
1194
+ distributed: true
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/acc.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/backward_time.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/cer.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/cer_ctc.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/forward_time.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/iter_time.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/loss.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/loss_att.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/loss_ctc.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/optim0_lr0.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/optim_step_time.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/train_time.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/images/wer.png ADDED
exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/valid.acc.ave.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:622fcefd33851cb797b32ff463ab375e8e4b1f9ae24ce2ef9beced8d42bd1ec1
3
+ size 124958573
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: 0.10.7a1
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/valid.acc.ave.pth
4
+ python: "3.8.12 (default, Oct 12 2021, 13:49:34) \n[GCC 7.5.0]"
5
+ timestamp: 1644335600.821329
6
+ torch: 1.8.1
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_conformer_ctc0.3_lr2e-3_warmup15k_newspecaug_raw_bpe1000_sp/config.yaml