Spaces:

Mxode
/

NanoTranslator-Demo

Running

App Files Files Community

Mxode commited on 13 days ago

Commit

04c7753

•

1 Parent(s): d38170c

Upload app.py

Browse files

Files changed (1) hide show

app.py +90 -0

app.py ADDED Viewed

	@@ -0,0 +1,90 @@

+import streamlit as st
+from transformers import (
+    PreTrainedTokenizerBase,
+    PreTrainedTokenizerFast,
+    AutoModelForCausalLM,
+)
+model_dict = {
+    "NanoTranslator-XS": "Mxode/NanoTranslator-XS",
+    "NanoTranslator-S": "Mxode/NanoTranslator-S",
+    "NanoTranslator-M": "Mxode/NanoTranslator-M",
+    "NanoTranslator-M2": "Mxode/NanoTranslator-M2",
+    "NanoTranslator-L": "Mxode/NanoTranslator-L",
+    "NanoTranslator-XL": "Mxode/NanoTranslator-XL",
+    "NanoTranslator-XXL": "Mxode/NanoTranslator-XXL",
+    "NanoTranslator-XXL2": "Mxode/NanoTranslator-XXL2",
+}
+# initialize model
+@st.cache_resource
+def load_model(model_path: str):
+    model = AutoModelForCausalLM.from_pretrained(model_path)
+    tokenizer = PreTrainedTokenizerFast.from_pretrained(model_path)
+    return model, tokenizer
+def translate(text: str, model, tokenizer: PreTrainedTokenizerBase, **kwargs):
+    generation_args = dict(
+        max_new_tokens=kwargs.pop("max_new_tokens", 64),
+        do_sample=kwargs.pop("do_sample", True),
+        temperature=kwargs.pop("temperature", 0.55),
+        top_p=kwargs.pop("top_p", 0.8),
+        top_k=kwargs.pop("top_k", 40),
+        **kwargs
+    )
+    prompt = "<|im_start|>" + text + "<|endoftext|>"
+    model_inputs = tokenizer([prompt], return_tensors="pt").to(model.device)
+    generated_ids = model.generate(model_inputs.input_ids, **generation_args)
+    generated_ids = [
+        output_ids[len(input_ids) :]
+        for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
+    ]
+    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    return response
+st.title("NanoTranslator-Demo")
+st.sidebar.title("Options")
+model_choice = st.sidebar.selectbox("Model", list(model_dict.keys()))
+do_sample = st.sidebar.checkbox("do_sample", value=True)
+max_new_tokens = st.sidebar.slider(
+    "max_new_tokens", min_value=1, max_value=256, value=64
+)
+temperature = st.sidebar.slider(
+    "temperature", min_value=0.01, max_value=1.5, value=0.55, step=0.01
+)
+top_p = st.sidebar.slider("top_p", min_value=0.01, max_value=1.0, value=0.8, step=0.01)
+top_k = st.sidebar.slider("top_k", min_value=1, max_value=100, value=40, step=1)
+# 根据选择的模型加载
+model_path = model_dict[model_choice]
+model, tokenizer = load_model(model_path)
+input_text = st.text_area(
+    "Please input the text to be translated (Currently supports only English to Chinese):",
+    "Each step of the cell cycle is monitored by internal.",
+)
+if st.button("translate"):
+    if input_text.strip():
+        with st.spinner("Translating..."):
+            translation = translate(
+                input_text,
+                model,
+                tokenizer,
+                max_new_tokens=max_new_tokens,
+                do_sample=do_sample,
+                temperature=temperature,
+                top_p=top_p,
+                top_k=top_k,
+            )
+        st.success("Translated successfully!")
+        st.write(translation)
+    else:
+        st.warning("Please input text before translation!")