Spaces:

kanhatakeyama
/

tanuki8x8bchat

Running

a100 kh commited on Aug 31

Commit

b865247

•

1 Parent(s): 4f21439

r

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import gradio as gr
-from huggingface_hub import InferenceClient
 from openai import OpenAI
 # Modify OpenAI's API key and API base to use vLLM's API server.
@@ -37,7 +37,7 @@ def respond(
     response = ""
     for message in client.chat.completions.create(
-        model_name=model_name,
         messages=messages,
         max_tokens=max_tokens,
         stream=True,

 import gradio as gr
+# from huggingface_hub import InferenceClient
 from openai import OpenAI
 # Modify OpenAI's API key and API base to use vLLM's API server.
     response = ""
     for message in client.chat.completions.create(
+        model=model_name,
         messages=messages,
         max_tokens=max_tokens,
         stream=True,