EuroLLM-9B-Instruct

Paused

Rijgersberg commited on Jun 27

Commit

4a2e0f3

•

1 Parent(s): 1aa1944

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,7 +14,7 @@ DEFAULT_MAX_NEW_TOKENS = 1024
 MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "8192"))
 if torch.cuda.is_available():
-    model_id = "google/gemma-2-27b-it"
     model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="cuda")
     tokenizer = AutoTokenizer.from_pretrained(model_id)

 MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "8192"))
 if torch.cuda.is_available():
+    model_id = "google/gemma-2-9b-it"
     model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="cuda")
     tokenizer = AutoTokenizer.from_pretrained(model_id)