Spaces:

qminh369
/

Compression

Sleeping

qminh369 commited on May 14

Commit

5573dde

•

1 Parent(s): f061107

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,8 +5,8 @@ import tiktoken
 compressors = {
     "xlm-roberta": PromptCompressor(
-        #model_name="microsoft/llmlingua-2-xlm-roberta-large-meetingbank",
-        model_name='qminh369/token-classification-llmlingua2-xlm-roberta-42k_merge_1_epoch',
         use_llmlingua2=True,
         device_map="cpu"
     )
@@ -14,9 +14,6 @@ compressors = {
 tokenizer = tiktoken.encoding_for_model("gpt-4")
-with open('data/benchmark_33_bctn_so_lieu_5context.json', 'r') as f:
-    examples = json.load(f)
 def compress(original_prompt, compression_rate, base_model="xlm-roberta", force_tokens=['\n'], chunk_end_tokens=['.', '\n']):
     if '\\n' in force_tokens:
         idx = force_tokens.index('\\n')

 compressors = {
     "xlm-roberta": PromptCompressor(
+        model_name="microsoft/llmlingua-2-xlm-roberta-large-meetingbank",
+        #model_name='qminh369/token-classification-llmlingua2-xlm-roberta-42k_merge_1_epoch',
         use_llmlingua2=True,
         device_map="cpu"
     )
 tokenizer = tiktoken.encoding_for_model("gpt-4")
 def compress(original_prompt, compression_rate, base_model="xlm-roberta", force_tokens=['\n'], chunk_end_tokens=['.', '\n']):
     if '\\n' in force_tokens:
         idx = force_tokens.index('\\n')