Spaces:

somosnlp-hackathon-2023
/

T5unami-small-v1

Runtime error

App Files Files Community

NickyNicky commited on Apr 9, 2023

Commit

ad34766

•

1 Parent(s): 681bb8c

Upload 3 files

Browse files

Files changed (3) hide show

Problema_tarjetaCredito.ogg +0 -0
app.py +87 -0
requirements.txt +4 -0

Problema_tarjetaCredito.ogg ADDED Viewed

Binary file (14.5 kB). View file

app.py ADDED Viewed

	@@ -0,0 +1,87 @@

+import time
+import torch
+from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM, AutoTokenizer, AutoModelForSeq2SeqLM
+import gradio as gr
+import speech_recognition as sr
+from math import log2, pow
+import os
+#from scipy.fftpack import fft
+import gc
+peft_model_id='hackathon-somos-nlp-2023/T5unami-small-v1'
+config = PeftConfig.from_pretrained(peft_model_id)
+model2 = AutoModelForSeq2SeqLM.from_pretrained(config.base_model_name_or_path, return_dict=True,
+                                               # load_in_8bit=True,
+                                               # load_in_8bit_fp32_cpu_offload=True,
+                                               device_map='auto')
+tokenizer2 = AutoTokenizer.from_pretrained(peft_model_id)
+model2 = PeftModel.from_pretrained(model2, peft_model_id)
+Problema_tarjetaCredito= os.path.abspath("Problema_tarjetaCredito.ogg")
+list_audios= [[Problema_tarjetaCredito]]
+def gen_conversation(text,max_new_tokens=100):
+  text = "<SN>instruction: " + text + "\n "
+  batch = tokenizer2(text, return_tensors='pt')
+  output_tokens = model2.generate(**batch,
+                                    max_new_tokens=max_new_tokens,
+                                    eos_token_id= tokenizer2.eos_token_id,
+                                    pad_token_id= tokenizer2.pad_token_id,
+                                    bos_token_id= tokenizer2.bos_token_id,
+                                    early_stopping = True,
+                                    no_repeat_ngram_size=2,
+                                    repetition_penalty=1.2,
+                                    temperature=.69,
+                                    num_beams=3
+                                    )
+  gc.collect()
+  return tokenizer2.decode(output_tokens[0], skip_special_tokens=True).split("\n")[-1].replace("output:","")
+conversacion = ""
+def speech_to_text(audio_file, texto_adicional):
+    global conversacion
+    if audio_file is not None:
+        # Lógica para entrada de audio
+        r = sr.Recognizer()
+        audio_data = sr.AudioFile(audio_file)
+        with audio_data as source:
+            audio = r.record(source)
+        text_enrada=""
+        texto_generado = r.recognize_google(audio, language="es-ES")
+        texto_generado= f"[|Audio a texto|]:{texto_generado}\n" + "<br>[AGENTE]:"+gen_conversation(texto_generado,max_new_tokens=50)
+        texto_generado = "<div style='color: #66b3ff;'>" + texto_generado + "</div><br>"
+    else:
+        texto_generado= f"[|Solo texto|]:{texto_adicional}\n" + "<br>[AGENTE]:"+gen_conversation(texto_adicional,max_new_tokens=50)
+        texto_generado = "<div style='color: #66b3ff;'> " + texto_generado + "</div><br>"
+    conversacion += texto_generado
+    return conversacion
+iface = gr.Interface(
+    fn=speech_to_text,
+    inputs=[gr.inputs.Audio(label="Voz", type="filepath"), gr.inputs.Textbox(label="Texto adicional")],
+    outputs=gr.outputs.HTML(label=["chatbot","state"]),
+    title="Chat bot para empresas.",
+    description="Este modelo convierte la entrada de voz o texto y hace inferencia",
+    examples=list_audios,
+    theme="default",
+    layout="vertical",
+    allow_flagging=False,
+    flagging_dir=None,
+    server_name=None,
+    server_port=None,
+    live=False,
+    capture_session=False
+)
+iface.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+transformers==4.27.4
+speech_recognition==3.10.0
+peft==0.3.0.dev0
+gradio==3.24.1