reazonspeech-espnet-v1
reazonspeech-espnet-v1
es un modelo de reconocimiento automático del habla (ASR) entrenado con espnet2 para el español ecuatoriano. Este modelo tiene como objetivo reconocer el habla de diferentes regiones y acentos del Ecuador, usando un corpus propio y el corpus de Common Voice. El modelo usa una arquitectura de transformador con codificación por subpalabras (BPE). El modelo alcanza un WER de X% y un MOS de Y en el conjunto de datos de prueba. Para más detalles sobre el modelo, puedes consultar este artículo.
- Downloads last month
- 1
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.