starcoder2

Running on Zero

Tonic commited on Feb 28

Commit

5a2e45f

•

1 Parent(s): f4b9dcc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -20,7 +20,8 @@ if not hf_token:
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
-model = AutoModelForCausalLM.from_pretrained( model_path, quantization_config=quantization_config).to("cuda")
 @spaces.GPU
 def generate_text(prompt, temperature, max_length):
     inputs = tokenizer.encode(prompt, return_tensors="pt").to("cuda")

 tokenizer = AutoTokenizer.from_pretrained(model_path)
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
+model = AutoModelForCausalLM.from_pretrained( model_path, quantization_config=quantization_config)
 @spaces.GPU
 def generate_text(prompt, temperature, max_length):
     inputs = tokenizer.encode(prompt, return_tensors="pt").to("cuda")