Spaces:

omersaidd
/

Gemma2-llamacpp

Runtime error

omersaidd commited on Aug 28

Commit

e59a11e

•

1 Parent(s): 954d18e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,17 +14,25 @@ from huggingface_hub import hf_hub_download
 huggingface_token = os.getenv("HUGGINGFACE_TOKEN")
 hf_hub_download(
-    repo_id="cognitivecomputations/dolphin-2.9.4-llama3.1-8b-gguf",
-    filename="dolphin-2.9.4-llama3.1-8b-Q2_K.gguf",
     local_dir="./models"
 )
 hf_hub_download(
-    repo_id="cognitivecomputations/dolphin-2.9.4-llama3.1-8b-gguf",
-    filename="dolphin-2.9.4-llama3.1-8b-Q3_K_L.gguf",
     local_dir="./models"
 )
 llm = None
 llm_model = None
@@ -41,7 +49,7 @@ def respond(
     top_k,
     repeat_penalty,
 ):
-    chat_template = MessagesFormatterType.GEMMA2
     global llm
     global llm_model
@@ -115,13 +123,14 @@ demo = gr.ChatInterface(
     respond,
     additional_inputs=[
         gr.Dropdown([
-                'dolphin-2.9.4-llama3.1-8b-Q2_K.gguf',
-                'dolphin-2.9.4-llama3.1-8b-Q3_K_L.gguf'
             ],
-            value="dolphin-2.9.4-llama3.1-8b-Q3_K_L.gguf",
             label="Model"
         ),
-        gr.Textbox(value="Sen yardımsever bir asistansın.", label="System message"),
         gr.Slider(minimum=1, maximum=4096, value=2048, step=1, label="Max tokens"),
         gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
@@ -150,7 +159,7 @@ demo = gr.ChatInterface(
     undo_btn="Undo",
     clear_btn="Clear",
     submit_btn="Send",
-    title="Chat with LLama 3.1 using llama.cpp",
     description=description,
     chatbot=gr.Chatbot(
         scale=1,

 huggingface_token = os.getenv("HUGGINGFACE_TOKEN")
 hf_hub_download(
+    repo_id="bartowski/gemma-2-9b-it-GGUF",
+    filename="gemma-2-9b-it-Q5_K_M.gguf",
     local_dir="./models"
 )
 hf_hub_download(
+    repo_id="bartowski/gemma-2-27b-it-GGUF",
+    filename="gemma-2-27b-it-Q5_K_M.gguf",
     local_dir="./models"
 )
+hf_hub_download(
+    repo_id="google/gemma-2-2b-it-GGUF",
+    filename="2b_it_v2.gguf",
+    local_dir="./models",
+    token=huggingface_token
+)
 llm = None
 llm_model = None
     top_k,
     repeat_penalty,
 ):
+    chat_template = MessagesFormatterType.GEMMA_2
     global llm
     global llm_model
     respond,
     additional_inputs=[
         gr.Dropdown([
+                'gemma-2-9b-it-Q5_K_M.gguf',
+                'gemma-2-27b-it-Q5_K_M.gguf',
+                '2b_it_v2.gguf'
             ],
+            value="2b_it_v2.gguf",
             label="Model"
         ),
+        gr.Textbox(value="You are a helpful assistant.", label="System message"),
         gr.Slider(minimum=1, maximum=4096, value=2048, step=1, label="Max tokens"),
         gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
     undo_btn="Undo",
     clear_btn="Clear",
     submit_btn="Send",
+    title="Chat with Gemma 2 using llama.cpp",
     description=description,
     chatbot=gr.Chatbot(
         scale=1,