Spaces:

nairaxo
/

shikomori-asr

Sleeping

App Files Files Community

shikomori-asr / app.py

nairaxo

Update app.py

b234b92 verified 20 days ago

raw

history blame

2.78 kB

	import gradio as gr
	from transformers import pipeline

	# Chargement des deux modèles Whisper
	model_roman = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-bible")
	model_arabic = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-bible-arabic")

	# Fonction de transcription avec sélection du modèle
	def transcribe(audio, model_choice):
	if model_choice == "Modèle en alphabet latin":
	transcription = model_roman(audio)["text"]
	else:
	transcription = model_arabic(audio)["text"]
	return transcription

	# Initialisation des blocs pour l'interface Gradio
	demo = gr.Blocks()

	# Interface Gradio pour microphone
	mf_transcribe = gr.Interface(
	fn=transcribe,
	inputs=[
	gr.Audio(sources=["microphone"], type="filepath", label="🎤 Entrée Audio (Microphone)"),
	gr.Radio(choices=["Modèle en alphabet latin", "Modèle en alphabet arabe"], label="Sélection du modèle de transcription",
	value="Modèle en alphabet latin",
	# style={"font-family": "Arial", "font-size": "16px", "color": "#333"}
	),
	],
	outputs=gr.Textbox(label="📄 Transcription en Shikomori", lines=5, max_lines=10, style={"background-color": "#F0F8FF", "font-size": "15px"}),
	title="Transcription Audio en Shikomori",
	description="<p style='color: #555;'>Sélectionnez une méthode et un modèle pour transcrire l'audio en langue Shikomori. Ce service prend en charge les transcriptions en alphabet latin et arabe.</p>",
	theme="compact",
	)

	# Interface Gradio pour fichier audio
	file_transcribe = gr.Interface(
	fn=transcribe,
	inputs=[
	gr.Audio(type="filepath", optional=True, label="📂 Entrée Audio (Fichier)"),
	gr.Radio(choices=["Modèle en alphabet latin", "Modèle en alphabet arabe"], label="Sélection du modèle de transcription",
	value="Modèle en alphabet latin",
	# style={"font-family": "Arial", "font-size": "16px", "color": "#333"}
	),
	],
	outputs=gr.Textbox(label="📄 Transcription en Shikomori", lines=5, max_lines=10, style={"background-color": "#F0F8FF", "font-size": "15px"}),
	title="Transcription Audio en Shikomori",
	description="<p style='color: #555;'>Chargez un fichier audio et sélectionnez un modèle pour transcrire l'audio en langue Shikomori. Transcription possible en alphabet latin ou arabe.</p>",
	theme="compact",
	)

	# Utilisation de l'interface avec des onglets
	with demo:
	gr.TabbedInterface(
	[mf_transcribe, file_transcribe],
	["🔊 Microphone", "📁 Fichier Audio"]
	)

	# Lancement de l'application
	# demo.launch(enable_queue=True, server_port=5001, share=True)

	demo.launch(enable_queue=True)