Spaces:

3loi
/

WavLM-SER-Multi-Baseline-Odyssey2024

Runtime error

3loi commited on Mar 5

Commit

c3d029a

•

1 Parent(s): f9b0e0d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,13 +8,14 @@ import numpy as np
 def classify_audio(audio_file):
     model = AutoModelForAudioClassification.from_pretrained("3loi/SER-Odyssey-Baseline-WavLM-Multi-Attributes", trust_remote_code=True)
-    mean, std = -8.278621631819787e-05, 0.08485510250851999
     sr, raw_wav = audio_file
@@ -30,8 +31,14 @@ def classify_audio(audio_file):
     wavs = torch.tensor(norm_wav).unsqueeze(0)
     pred = model(wavs, mask).detach().numpy()
-    print(str(pred))
-    return str(pred)
 def main():

+mean, std = -8.278621631819787e-05, 0.08485510250851999
+id2label = {0: 'arousal', 1: 'dominance', 2: 'valence'}
 def classify_audio(audio_file):
     model = AutoModelForAudioClassification.from_pretrained("3loi/SER-Odyssey-Baseline-WavLM-Multi-Attributes", trust_remote_code=True)
     sr, raw_wav = audio_file
     wavs = torch.tensor(norm_wav).unsqueeze(0)
     pred = model(wavs, mask).detach().numpy()
+    pred = {}
+    for i, audio_pred in enumerate(pred.numpy()):
+        pred[i] = {}
+        for att_i, att_val in enumerate(audio_pred):
+            pred[i][id2label[att_i]] = att_val
+    return pred
 def main():