import gradio as gr from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline pretrained_model = "datificate/gpt2-small-spanish" tokenizer = AutoTokenizer.from_pretrained(pretrained_model, use_fast=True) tuned_model = 'jorge-henao/gpt2-small-spanish-historias-conflicto-col' sonnets_pipe = pipeline('text2text-generation', model=tuned_model, tokenizer=tokenizer) def make_new_story(prompt, max_lenght): ouputs = sonnets_pipe(prompt, max_length=max_lenght, num_beams=5, early_stopping=True, repetition_penalty=20.0, num_return_sequences=1) return ouputs[0]['generated_text'] description = """
El 28 de Junio de 2022 la Comisión de la verdad, una entidad del estado Colombiano que busca el esclarecimiento de los patrones y causas explicativas del conflicto armado interno, liberó el volumen testimonial titulado Cuando los pájaros No Cantaban. Historias del conflicto armado colombianos. Una serie de historias del conflicto armado donde el lenguaje en español, con su diversidad y riqueza lingüística de las víctimas es protagonista. En este experimento fue entrenado un modelo gpt-2 con las más de 400 historias de víctimas del conflicto armado colombiano que conforma el volúmen testimonial del informe.
Por: Jorge Henao 🇨🇴 Twitter LinkedIn
""" article = """
Sin pretensiones de arrojar afirmaciones concluyentes, la formulación de esas preguntas tienen como motivación un objetivo de interés nacional: la búsqueda de nuevas maneras de apoyar la difusión y conocimiento de la memoria histórica Colombiana. Algo fundamental para construir una nación en torno a objetivos comunes.
Este espacio hace parte del proyecto open source Ask2Democracy (repo en github con FastAPI) que busca ayudar con el entendimiento de temas relevantes para el país, como las pasadas elecciones presidenciales 2022 y la memoria histórica Colombiana. Para este experimento fue construido el dataset con las historias portado en formato Hugging Face.
""" examples = [ ['cuando salí no había nadie', 130 ], ['La última vez que la vi', 280], ['LLegaron y mi vida se fue', 400] ] iface = gr.Interface(fn=make_new_story, title= "Ask2Democracy - Generador de historias basado en los testimonios del conflicto Colombiano 🇨🇴", description = description, inputs=[ gr.inputs.Textbox(lines=2, placeholder="Escrbe algo para comenzar", label='Escribe algo para comenzar'), gr.inputs.Slider(minimum = 20, maximum = 1000, default = 280, step = 5, label='Tamaño de la historia')], outputs=[ gr.outputs.Textbox(label="Tu historia"), ], examples = examples, article = article, theme = 'peach' ) iface.launch(enable_queue=True)