Spaces:

cdactvm
/

Hindi_ASR

Running

cdactvm commited on Oct 1

Commit

9d82bb3

•

1 Parent(s): 9097e9c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ from replaceWords import replace_words
 transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
 transcriber_hindi_old = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_old")
-processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-2.0-hindi_old")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
 decoder = build_ctcdecoder(
@@ -30,7 +30,7 @@ processor_with_lm = Wav2Vec2ProcessorWithLM(
     decoder=decoder
     )
 processor.feature_extractor._processor_class = "Wav2Vec2ProcessorWithLM"
-transcriber_hindi_lm = pipeline("automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_old", tokenizer=processor_with_lm, feature_extractor=processor_with_lm.feature_extractor, decoder=processor_with_lm.decoder)
 def transcribe_hindi_new(audio):

 transcriber_hindi_new = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1")
 transcriber_hindi_old = pipeline(task="automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_old")
+processor = AutoProcessor.from_pretrained("cdactvm/w2v-bert-2.0-hindi_v1")
 vocab_dict = processor.tokenizer.get_vocab()
 sorted_vocab_dict = {k.lower(): v for k, v in sorted(vocab_dict.items(), key=lambda item: item[1])}
 decoder = build_ctcdecoder(
     decoder=decoder
     )
 processor.feature_extractor._processor_class = "Wav2Vec2ProcessorWithLM"
+transcriber_hindi_lm = pipeline("automatic-speech-recognition", model="cdactvm/w2v-bert-2.0-hindi_v1", tokenizer=processor_with_lm, feature_extractor=processor_with_lm.feature_extractor, decoder=processor_with_lm.decoder)
 def transcribe_hindi_new(audio):