AlexN
/

xls-r-300m-fr

Automatic Speech Recognition

Generated from Trainer

hf-asr-leaderboard

mozilla-foundation/common_voice_8_0

robust-speech-event

Inference Endpoints

Model card Files Files and versions Community

AlexN commited on Jan 29, 2022

Commit

44c4739

•

1 Parent(s): ee05d5c

from pretrained on tokenizer

Files changed (1) hide show

run_speech_recognition_ctc.py +5 -4

run_speech_recognition_ctc.py CHANGED Viewed

@@ -522,10 +522,11 @@ def main():
     # one local process can concurrently download model & vocab.
     # load feature_extractor and tokenizer
-    tokenizer = Wav2Vec2CTCTokenizer(tokenizer_name_or_path,
-                                     use_auth_token=data_args.use_auth_token,
-                                     **tokenizer_kwargs,
-                                    )
     feature_extractor = AutoFeatureExtractor.from_pretrained(
         model_args.model_name_or_path, cache_dir=model_args.cache_dir, use_auth_token=data_args.use_auth_token
     )

     # one local process can concurrently download model & vocab.
     # load feature_extractor and tokenizer
+    tokenizer = Wav2Vec2CTCTokenizer.from_pretrained(
+        tokenizer_name_or_path,
+        use_auth_token=data_args.use_auth_token,
+        **tokenizer_kwargs,
+    )
     feature_extractor = AutoFeatureExtractor.from_pretrained(
         model_args.model_name_or_path, cache_dir=model_args.cache_dir, use_auth_token=data_args.use_auth_token
     )