Spaces:

nairaxo
/

shikomori-asr

Sleeping

App Files Files Community

nairaxo commited on 20 days ago

Commit

a710bbe

•

1 Parent(s): 0dade2f

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -17

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ from transformers import pipeline
 # Chargement des deux modèles Whisper
 model_roman = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-bible")
-model_arabic = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-bible")
 # Fonction de transcription avec sélection du modèle
 def transcribe(audio, model_choice):
@@ -13,33 +13,45 @@ def transcribe(audio, model_choice):
         transcription = model_arabic(audio)["text"]
     return transcription
-# Interface Gradio
 mf_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
-        gr.inputs.Audio(source="microphone", type="filepath", label="Entrée Audio"),
-        gr.inputs.Radio(choices=["Modèle en alphabet latin", "Modèle en alphabet arabe"], label="Choisissez un modèle")
     ],
-    outputs="text",
-    title="Transcription en Shikomori",
-    description="Choisissez un modèle pour transcrire l'audio en shikomori."
 )
 file_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
-        # gr.inputs.Audio(source="microphone", type="filepath", label="Entrée Audio"),
-        gr.inputs.Audio(source="upload", type="filepath", optional=True, label="Entrée Audio"),
-        gr.inputs.Radio(choices=["Modèle en alphabet latin", "Modèle en alphabet arabe"], label="Choisissez un modèle")
     ],
-    outputs="text",
-    title="Transcription en Shikomori",
-    description="Choisissez un modèle pour transcrire l'audio en shikomori."
 )
-# iface.launch()
 with demo:
-    gr.TabbedInterface([mf_transcribe, file_transcribe], ["Microphone", "Audio file"])
-demo.launch(enable_queue=True)

 # Chargement des deux modèles Whisper
 model_roman = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-bible")
+model_arabic = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-bible-arabic")
 # Fonction de transcription avec sélection du modèle
 def transcribe(audio, model_choice):
         transcription = model_arabic(audio)["text"]
     return transcription
+# Initialisation des blocs pour l'interface Gradio
+demo = gr.Blocks()
+# Interface Gradio pour microphone
 mf_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
+        gr.Audio(source="microphone", type="filepath", label="🎤 Entrée Audio (Microphone)"),
+        gr.Radio(choices=["Modèle en alphabet latin", "Modèle en alphabet arabe"], label="Sélection du modèle de transcription",
+                 value="Modèle en alphabet latin",
+                 style={"font-family": "Arial", "font-size": "16px", "color": "#333"}),
     ],
+    outputs=gr.Textbox(label="📄 Transcription en Shikomori", lines=5, max_lines=10, style={"background-color": "#F0F8FF", "font-size": "15px"}),
+    title="Transcription Audio en Shikomori",
+    description="<p style='color: #555;'>Sélectionnez une méthode et un modèle pour transcrire l'audio en langue Shikomori. Ce service prend en charge les transcriptions en alphabet latin et arabe.</p>",
+    theme="compact",
 )
+# Interface Gradio pour fichier audio
 file_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
+        gr.Audio(type="filepath", optional=True, label="📂 Entrée Audio (Fichier)"),
+        gr.Radio(choices=["Modèle en alphabet latin", "Modèle en alphabet arabe"], label="Sélection du modèle de transcription",
+                 value="Modèle en alphabet latin",
+                 style={"font-family": "Arial", "font-size": "16px", "color": "#333"}),
     ],
+    outputs=gr.Textbox(label="📄 Transcription en Shikomori", lines=5, max_lines=10, style={"background-color": "#F0F8FF", "font-size": "15px"}),
+    title="Transcription Audio en Shikomori",
+    description="<p style='color: #555;'>Chargez un fichier audio et sélectionnez un modèle pour transcrire l'audio en langue Shikomori. Transcription possible en alphabet latin ou arabe.</p>",
+    theme="compact",
 )
+# Utilisation de l'interface avec des onglets
 with demo:
+    gr.TabbedInterface(
+        [mf_transcribe, file_transcribe],
+        ["🔊 Microphone", "📁 Fichier Audio"]
+    )
+# Lancement de l'application
+demo.launch(enable_queue=True, server_port=5001, share=True)