Spaces:

Limour
/

llama-python-streamingllm

Runtime error

App Files Files Community

Limour commited on Feb 13

Commit

67ae2ac

•

1 Parent(s): 6481b74

Upload 2 files

Browse files

Files changed (2) hide show

gradio_streamingllm.py +25 -22
llama_cpp_python_streamingllm.py +6 -7

gradio_streamingllm.py CHANGED Viewed

@@ -25,6 +25,9 @@ from mods.btn_suggest import init as btn_suggest_init
 # ========== 融合功能的按钮 ==========
 from mods.btn_submit_vo_suggest import init as btn_submit_vo_suggest_init
 # ========== 重置按钮 ==========
 from mods.btn_reset import init as btn_reset_init
@@ -98,10 +101,17 @@ with gr.Blocks() as chatting:
     with gr.Row(equal_height=True):
         cfg['chatbot'] = gr.Chatbot(height='60vh', scale=2, value=cfg['chatbot'],
                                     avatar_images=(r'assets/user.png', r'assets/chatbot.webp'))
-        with gr.Column(scale=1, elem_id="area"):
-            cfg['rag'] = gr.Textbox(label='RAG', lines=2, show_copy_button=True, elem_id="RAG-area")
-            cfg['vo'] = gr.Textbox(label='VO', show_copy_button=True, elem_id="VO-area")
-            cfg['s_info'] = gr.Textbox(value=cfg['model'].venv_info, max_lines=1, label='info', interactive=False)
     cfg['msg'] = gr.Textbox(label='Prompt', lines=2, max_lines=2, elem_id='prompt', autofocus=True, **cfg['msg'])
     cfg['gr'] = gr
@@ -119,37 +129,27 @@ with gr.Blocks() as chatting:
     btn_submit_vo_suggest_init(cfg)
     # ========== 用于调试 ==========
     btn_reset_init(cfg)
 #  ========== 让聊天界面的文本框等高 ==========
 custom_css = r'''
-#area > div {
-    height: 100%;
-}
-#RAG-area {
-    flex-grow: 1;
-}
-#RAG-area > label {
-    height: 100%;
-    display: flex;
-    flex-direction: column;
 }
-#RAG-area > label > textarea {
     flex-grow: 1;
-    max-height: 20vh;
 }
-#VO-area {
-    flex-grow: 1;
-}
-#VO-area > label {
     height: 100%;
     display: flex;
     flex-direction: column;
 }
-#VO-area > label > textarea {
     flex-grow: 1;
-    max-height: 20vh;
 }
 #prompt > label > textarea {
     max-height: 63px;
@@ -162,6 +162,9 @@ custom_css = r'''
 .setting input {
     margin-top: auto;
 }
 '''
 # ========== 开始运行 ==========

 # ========== 融合功能的按钮 ==========
 from mods.btn_submit_vo_suggest import init as btn_submit_vo_suggest_init
+# ========== 更新状态栏的按钮 ==========
+from mods.btn_status_bar import init as btn_status_bar_init
 # ========== 重置按钮 ==========
 from mods.btn_reset import init as btn_reset_init
     with gr.Row(equal_height=True):
         cfg['chatbot'] = gr.Chatbot(height='60vh', scale=2, value=cfg['chatbot'],
                                     avatar_images=(r'assets/user.png', r'assets/chatbot.webp'))
+        with gr.Column(scale=1):
+            with gr.Tab(label='Main', elem_id='area'):
+                cfg['rag'] = gr.Textbox(label='RAG', lines=2, show_copy_button=True, elem_classes="area")
+                cfg['vo'] = gr.Textbox(label='VO', lines=2, show_copy_button=True, elem_classes="area")
+                cfg['s_info'] = gr.Textbox(value=cfg['model'].venv_info, max_lines=1, label='info', interactive=False)
+            with gr.Tab(label='状态栏', elem_id='area'):
+                cfg['status_bar'] = gr.Dataframe(
+                    headers=['属性', '值'],
+                    type="array",
+                    elem_id='StatusBar'
+                )
     cfg['msg'] = gr.Textbox(label='Prompt', lines=2, max_lines=2, elem_id='prompt', autofocus=True, **cfg['msg'])
     cfg['gr'] = gr
     btn_submit_vo_suggest_init(cfg)
+    btn_status_bar_init(cfg)
     # ========== 用于调试 ==========
     btn_reset_init(cfg)
 #  ========== 让聊天界面的文本框等高 ==========
 custom_css = r'''
+#area > div > div {
+    height: 53vh;
 }
+.area {
     flex-grow: 1;
 }
+.area > label {
     height: 100%;
     display: flex;
     flex-direction: column;
+    max-height: 16vh;
 }
+.area > label > textarea {
     flex-grow: 1;
 }
 #prompt > label > textarea {
     max-height: 63px;
 .setting input {
     margin-top: auto;
 }
+#StatusBar {
+    max-height: 53vh;
+}
 '''
 # ========== 开始运行 ==========

llama_cpp_python_streamingllm.py CHANGED Viewed

@@ -57,15 +57,15 @@ class StreamingLLM(Llama):
             self.kv_cache_seq_trim()
         return True
-    def venv_remove(self, name: str, keep_last=False):
         if len(self.venv) <= 1:
             return False
         if name not in self.venv_idx_map:
             return False
         venv_idx = self.venv_idx_map.index(name) + 1
         while self.venv_idx_map:
-            if keep_last and self.venv_idx_map.count(name) <= 1:
-                break  # 保留最后一个
             self.venv_idx_map.pop(venv_idx - 1)  # 删除
             if venv_idx == len(self.venv) - 1:
                 # 最后一层
@@ -282,10 +282,9 @@ class StreamingLLM(Llama):
                     self._input_ids, self._scores[-1, :]
             ):
                 return
-            tokens_or_none = yield token
-            tokens = [token]
-            if tokens_or_none is not None:
-                tokens.extend(tokens_or_none)
     def load_session(self, filepath: str):
         n_tokens = POINTER(llama_cpp.c_size_t)(llama_cpp.c_size_t(0))

             self.kv_cache_seq_trim()
         return True
+    def venv_remove(self, name: str, keep_last=0):
         if len(self.venv) <= 1:
             return False
         if name not in self.venv_idx_map:
             return False
         venv_idx = self.venv_idx_map.index(name) + 1
         while self.venv_idx_map:
+            if keep_last and self.venv_idx_map.count(name) <= keep_last:
+                break  # 保留最后n个
             self.venv_idx_map.pop(venv_idx - 1)  # 删除
             if venv_idx == len(self.venv) - 1:
                 # 最后一层
                     self._input_ids, self._scores[-1, :]
             ):
                 return
+            tokens = yield token
+            if tokens is None:
+                tokens = [token]
     def load_session(self, filepath: str):
         n_tokens = POINTER(llama_cpp.c_size_t)(llama_cpp.c_size_t(0))