Spaces:

IES-Rafael-Alberti
/

AudioToImage

Running

Bartusito commited on Nov 6, 2023

Commit

5d9a7ee

•

1 Parent(s): 41661eb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import gradio as gr
 from huggingsound import SpeechRecognitionModel
 from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler
 from transformers import pipeline
@@ -6,9 +7,14 @@ from transformers import pipeline
 # Función para convertir la tasa de muestreo del audio de entrada
 def modelo1(audio):
     # Convertir la tasa de muestreo del audio
-    whisper = pipeline('automatic-speech-recognition', model = 'openai/whisper-medium', device = -1)
-    text = whisper(audio)
-    text = text["text"]
     return text
 def modelo2(text):

 import gradio as gr
+import numpy as np
 from huggingsound import SpeechRecognitionModel
 from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler
 from transformers import pipeline
 # Función para convertir la tasa de muestreo del audio de entrada
 def modelo1(audio):
     # Convertir la tasa de muestreo del audio
+    audio_data, sample_rate = audio
+    # Asegurarse de que audio_data sea un array NumPy
+    if not isinstance(audio_data, np.ndarray):
+        audio_data = np.array(audio_data)
+    # Utilizar audio_data como entrada para el modelo
+    whisper = pipeline('automatic-speech-recognition', model='openai/whisper-medium', device=-1)  # Cambia 'device' a -1 para usar la CPU
+    text = whisper(audio_data)
     return text
 def modelo2(text):