Spaces:
Runtime error
Runtime error
anyantudre
commited on
Commit
•
3beb5b3
1
Parent(s):
5eb8c24
Update goai_stt.py
Browse files- goai_stt.py +6 -15
goai_stt.py
CHANGED
@@ -1,8 +1,8 @@
|
|
1 |
import torch
|
2 |
-
import numpy as np
|
3 |
import librosa
|
4 |
import time
|
5 |
from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
|
|
|
6 |
|
7 |
device = 0 if torch.cuda.is_available() else "cpu"
|
8 |
|
@@ -12,8 +12,8 @@ def goai_stt(fichier):
|
|
12 |
|
13 |
Paramètres
|
14 |
----------
|
15 |
-
fichier: str | np.ndarray
|
16 |
-
Le chemin d'accès au fichier audio ou le
|
17 |
|
18 |
Return
|
19 |
----------
|
@@ -21,7 +21,6 @@ def goai_stt(fichier):
|
|
21 |
Le texte transcrit.
|
22 |
"""
|
23 |
|
24 |
-
|
25 |
print("Fichier entré en entréé ---------> ", fichier)
|
26 |
|
27 |
if fichier is None:
|
@@ -41,19 +40,11 @@ def goai_stt(fichier):
|
|
41 |
if isinstance(fichier, str):
|
42 |
### preprocessing de l'audio à partir d'un fichier
|
43 |
signal, sampling_rate = librosa.load(fichier, sr=16000)
|
44 |
-
|
45 |
-
elif isinstance(fichier, np.ndarray):
|
46 |
-
### preprocessing de l'audio à partir d'un tableau numpy
|
47 |
-
signal = fichier
|
48 |
-
sampling_rate = 16000
|
49 |
else:
|
50 |
-
|
|
|
51 |
|
52 |
-
|
53 |
-
if not isinstance(signal, np.ndarray):
|
54 |
-
raise TypeError("Le signal audio doit être un tableau numpy.")
|
55 |
-
|
56 |
-
inputs = processor(signal, sampling_rate=sampling_rate, return_tensors="pt", padding=True).to(device)
|
57 |
|
58 |
### faire l'inference
|
59 |
with torch.no_grad():
|
|
|
1 |
import torch
|
|
|
2 |
import librosa
|
3 |
import time
|
4 |
from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
|
5 |
+
import numpy as np
|
6 |
|
7 |
device = 0 if torch.cuda.is_available() else "cpu"
|
8 |
|
|
|
12 |
|
13 |
Paramètres
|
14 |
----------
|
15 |
+
fichier: str | tuple[int, np.ndarray]
|
16 |
+
Le chemin d'accès au fichier audio ou le tuple contenant le taux d'échantillonnage et les données audio.
|
17 |
|
18 |
Return
|
19 |
----------
|
|
|
21 |
Le texte transcrit.
|
22 |
"""
|
23 |
|
|
|
24 |
print("Fichier entré en entréé ---------> ", fichier)
|
25 |
|
26 |
if fichier is None:
|
|
|
40 |
if isinstance(fichier, str):
|
41 |
### preprocessing de l'audio à partir d'un fichier
|
42 |
signal, sampling_rate = librosa.load(fichier, sr=16000)
|
|
|
|
|
|
|
|
|
|
|
43 |
else:
|
44 |
+
### preprocessing de l'audio à partir d'un tableau numpy
|
45 |
+
sampling_rate, signal = fichier
|
46 |
|
47 |
+
inputs = processor(signal, sampling_rate=16000, return_tensors="pt", padding=True).to(device)
|
|
|
|
|
|
|
|
|
48 |
|
49 |
### faire l'inference
|
50 |
with torch.no_grad():
|