Spaces:

winglian
/

llama-adapter

Paused

winglian commited on Apr 13, 2023

Commit

9999ab8

•

1 Parent(s): 7c60b85

llama adapter doesn't support use_cache yet

Files changed (1) hide show

llama_lora/ui/inference_ui.py CHANGED Viewed

@@ -111,6 +111,7 @@ def do_inference(
             top_k=top_k,
             repetition_penalty=repetition_penalty,
             num_beams=num_beams,
         )
         generate_params = {

             top_k=top_k,
             repetition_penalty=repetition_penalty,
             num_beams=num_beams,
+            use_cache=False,
         )
         generate_params = {