Spaces:

xu-song
/

self-chat

Sleeping

xu song commited on Aug 5

Commit

5658533

•

1 Parent(s): 931d3ff

update

Files changed (1) hide show

models/cpp_qwen2.py CHANGED Viewed

@@ -47,8 +47,7 @@ class Qwen2Simulator(Simulator):
                 tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer(self.hf_tokenizer),
                 n_ctx=config.MAX_SEQUENCE_LENGTH,  #
                 # n_threads=None, # 默认会根据cpu数来设置 n_threads
-                use_mlock=True,
                 verbose=True,
             )
         else:
@@ -58,7 +57,7 @@ class Qwen2Simulator(Simulator):
                 tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer(self.hf_tokenizer),
                 filename="*fp16.gguf",
                 n_ctx=config.MAX_SEQUENCE_LENGTH,
-                use_mlock=True,
                 verbose=False,
             )
         logger.info(f"llm has been initialized: {self.llm}, "
@@ -150,6 +149,6 @@ if __name__ == "__main__":
     message = {"role": "user", "content": generated_text}
     print(message)
-    for generated_text, all_tokens in bot.generate_query(message, all_tokens, stream=True):
         print(generated_text, all_tokens)

                 tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer(self.hf_tokenizer),
                 n_ctx=config.MAX_SEQUENCE_LENGTH,  #
                 # n_threads=None, # 默认会根据cpu数来设置 n_threads
+                # use_mlock=True,
                 verbose=True,
             )
         else:
                 tokenizer=llama_cpp.llama_tokenizer.LlamaHFTokenizer(self.hf_tokenizer),
                 filename="*fp16.gguf",
                 n_ctx=config.MAX_SEQUENCE_LENGTH,
+                # use_mlock=True,
                 verbose=False,
             )
         logger.info(f"llm has been initialized: {self.llm}, "
     message = {"role": "user", "content": generated_text}
     print(message)
+    for generated_text, all_tokens in bot.generate_response(message, all_tokens, stream=True):
         print(generated_text, all_tokens)