Spaces:

jeevavijay10
/

code-gen

Runtime error

App Files Files Community

jeevavijay10 commited on Jul 27, 2023

Commit

5cc1d21

•

1 Parent(s): f464a86

change model to WizardCoder

Browse files

Files changed (2) hide show

app-salesforce.py +26 -0
app.py +57 -11

app-salesforce.py ADDED Viewed

	@@ -0,0 +1,26 @@

+import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM
+# checkpoint = "Salesforce/codegen25-7b-instruct"
+# checkpoint = "Salesforce/codegen-2B-nl"
+checkpoint = "Salesforce/codegen2-1B"
+tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True)
+# model = AutoModelForCausalLM.from_pretrained(checkpoint, cache_dir="models/")
+model = AutoModelForCausalLM.from_pretrained(checkpoint)
+def code_gen(text):
+    input_ids = tokenizer(text, return_tensors="pt").input_ids
+    generated_ids = model.generate(input_ids, max_length=128)
+    response = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
+    print(response)
+    return response
+iface = gr.Interface(fn=code_gen,
+                     inputs=gr.inputs.Textbox(
+                         label="Input Source Code"),
+                     outputs="text",
+                     title="Code Generation")
+iface.launch()

app.py CHANGED Viewed

@@ -1,20 +1,66 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM
-# checkpoint = "Salesforce/codegen25-7b-instruct"
-# checkpoint = "Salesforce/codegen-2B-nl"
-checkpoint = "Salesforce/codegen2-1B"
-tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True)
-# model = AutoModelForCausalLM.from_pretrained(checkpoint, cache_dir="models/")
-model = AutoModelForCausalLM.from_pretrained(checkpoint)
 def code_gen(text):
-    input_ids = tokenizer(text, return_tensors="pt").input_ids
-    generated_ids = model.generate(input_ids, max_length=128)
-    response = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
     print(response)
-    return response
 iface = gr.Interface(fn=code_gen,

+import torch
 import gradio as gr
+from transformers import AutoTokenizer, pipeline, logging
+from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
+model_name_or_path = "TheBloke/WizardCoder-Guanaco-15B-V1.1-GPTQ"
+model_basename = "gptq_model-4bit-128g"
+use_triton = False
+device =  "cuda:0" if torch.cuda.is_available() else "cpu"
+tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
+model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,
+                                           model_basename=model_basename,
+                                           use_safetensors=True,
+                                           trust_remote_code=False,
+                                           device=device,
+                                           use_triton=use_triton,
+                                           quantize_config=None,
+                                           cache_dir="models/"
+                                           )
+"""
+To download from a specific branch, use the revision parameter, as in this example:
+model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,
+        revision="gptq-4bit-32g-actorder_True",
+        model_basename=model_basename,
+        use_safetensors=True,
+        trust_remote_code=False,
+        device="cuda:0",
+        quantize_config=None)
+"""
 def code_gen(text):
+    # input_ids = tokenizer(text, return_tensors='pt').input_ids.to(device)
+    # output = model.generate(
+    #     inputs=input_ids, temperature=0.7, max_new_tokens=124)
+    # print(tokenizer.decode(output[0]))
+    # Inference can also be done using transformers' pipeline
+    # Prevent printing spurious transformers error when using pipeline with AutoGPTQ
+    logging.set_verbosity(logging.CRITICAL)
+    print("*** Pipeline:")
+    pipe = pipeline(
+        "text-generation",
+        model=model,
+        tokenizer=tokenizer,
+        max_new_tokens=124,
+        temperature=0.7,
+        top_p=0.95,
+        repetition_penalty=1.15
+    )
+    response = pipe(text)
     print(response)
+    return response[0]['generated_text']
 iface = gr.Interface(fn=code_gen,