anyantudre commited on
Commit
3beb5b3
1 Parent(s): 5eb8c24

Update goai_stt.py

Browse files
Files changed (1) hide show
  1. goai_stt.py +6 -15
goai_stt.py CHANGED
@@ -1,8 +1,8 @@
1
  import torch
2
- import numpy as np
3
  import librosa
4
  import time
5
  from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
 
6
 
7
  device = 0 if torch.cuda.is_available() else "cpu"
8
 
@@ -12,8 +12,8 @@ def goai_stt(fichier):
12
 
13
  Paramètres
14
  ----------
15
- fichier: str | np.ndarray
16
- Le chemin d'accès au fichier audio ou le tableau numpy.
17
 
18
  Return
19
  ----------
@@ -21,7 +21,6 @@ def goai_stt(fichier):
21
  Le texte transcrit.
22
  """
23
 
24
-
25
  print("Fichier entré en entréé ---------> ", fichier)
26
 
27
  if fichier is None:
@@ -41,19 +40,11 @@ def goai_stt(fichier):
41
  if isinstance(fichier, str):
42
  ### preprocessing de l'audio à partir d'un fichier
43
  signal, sampling_rate = librosa.load(fichier, sr=16000)
44
-
45
- elif isinstance(fichier, np.ndarray):
46
- ### preprocessing de l'audio à partir d'un tableau numpy
47
- signal = fichier
48
- sampling_rate = 16000
49
  else:
50
- raise ValueError("Le type de fichier audio est invalide.")
 
51
 
52
- # Ensure the signal is a numpy array and has correct dimensions
53
- if not isinstance(signal, np.ndarray):
54
- raise TypeError("Le signal audio doit être un tableau numpy.")
55
-
56
- inputs = processor(signal, sampling_rate=sampling_rate, return_tensors="pt", padding=True).to(device)
57
 
58
  ### faire l'inference
59
  with torch.no_grad():
 
1
  import torch
 
2
  import librosa
3
  import time
4
  from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
5
+ import numpy as np
6
 
7
  device = 0 if torch.cuda.is_available() else "cpu"
8
 
 
12
 
13
  Paramètres
14
  ----------
15
+ fichier: str | tuple[int, np.ndarray]
16
+ Le chemin d'accès au fichier audio ou le tuple contenant le taux d'échantillonnage et les données audio.
17
 
18
  Return
19
  ----------
 
21
  Le texte transcrit.
22
  """
23
 
 
24
  print("Fichier entré en entréé ---------> ", fichier)
25
 
26
  if fichier is None:
 
40
  if isinstance(fichier, str):
41
  ### preprocessing de l'audio à partir d'un fichier
42
  signal, sampling_rate = librosa.load(fichier, sr=16000)
 
 
 
 
 
43
  else:
44
+ ### preprocessing de l'audio à partir d'un tableau numpy
45
+ sampling_rate, signal = fichier
46
 
47
+ inputs = processor(signal, sampling_rate=16000, return_tensors="pt", padding=True).to(device)
 
 
 
 
48
 
49
  ### faire l'inference
50
  with torch.no_grad():