Spaces:

ANWAR101
/

summarization-api

Sleeping

App Files Files Community

Anwar11234 commited on Mar 24

Commit

3204b21

•

1 Parent(s): 879ec11

initial commit

Browse files

Files changed (3) hide show

Dockerfile +10 -0
app.py +54 -0
requirements.txt +5 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,10 @@

+FROM python:3.10.9
+WORKDIR /
+RUN pip install --no-cache-dir --upgrade -r /requirements.txt
+RUN mkdir -p /.cache/huggingface/hub \
+    && chmod -R 777 /.cache/huggingface \
+COPY . .
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,54 @@

+from fastapi import FastAPI, Body, Depends
+from typing import Dict
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
+from peft import PeftModel, PeftConfig
+from fastapi.middleware.cors import CORSMiddleware
+import os
+from huggingface_hub import HfApi
+hf_api = HfApi()  # Create a Hugging Face API client
+access_token = os.environ.get("HF_TOKEN")
+hf_api.set_access_token(access_token)
+app = FastAPI()
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=['*'],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"]
+)
+def load_model():
+    peft_model_id = "ANWAR101/lora-bart-base-youtube-cnn"
+    config = PeftConfig.from_pretrained(peft_model_id , use_auth_token=access_token)
+    model = AutoModelForSeq2SeqLM.from_pretrained(config.base_model_name_or_path)
+    tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
+    model = PeftModel.from_pretrained(model, peft_model_id)
+    return model , tokenizer
+@app.post("/summarize")
+async def summarize(data: Dict[str, str] = Body(...)):
+    """Summarize a text using the loaded Peft model."""
+    model , tokenizer = load_model()
+    text = data.get("text")
+    # Check for missing text
+    if not text:
+        return {"error": "Missing text in request body"}, 400
+    # Preprocess the text
+    inputs = tokenizer(text, truncation=True, return_tensors="pt")
+    # Generate summary using the model
+    outputs = model.generate(
+        **inputs, max_length=300, min_length=50, do_sample=True, num_beams=3,
+        no_repeat_ngram_size=2, temperature=0.6, length_penalty=1.0
+    )
+    summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    response = {"summary": summary}
+    return response

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+transformers==4.38.2
+peft==0.3.0
+fastapi
+uvicorn
+huggingface_hub