Spaces:

ironserengety
/

GraphRAG-Local-to-Global

Sleeping

Saif Rehman Nasir commited on Sep 30

Commit

a2ff208

•

1 Parent(s): f7e22b6

Change model to zephyr

Files changed (1) hide show

rag.py CHANGED Viewed

@@ -22,13 +22,13 @@ NEO4J_PASSWORD = os.getenv("NEO4J_PASSWORD")
 vector_index = os.getenv("VECTOR_INDEX")
 chat_llm = HuggingFaceEndpoint(
-    repo_id="meta-llama/Meta-Llama-3-8B-Instruct",
     task="text-generation",
     max_new_tokens=4096,
     do_sample=False,
 )
-global_tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B-Instruct")
 def local_retriever(query: str):
@@ -276,9 +276,8 @@ def global_retriever(query: str, level: int, response_type: str):
         i += 1
     ###Debug####
-    tokens = global_tokenizer(intermediate_results)
-    print(f"Number of input tokens: {len(tokens)}")
     ###Debug###
     final_response = reduce_chain.invoke(
         {

 vector_index = os.getenv("VECTOR_INDEX")
 chat_llm = HuggingFaceEndpoint(
+    repo_id="HuggingFaceH4/zephyr-7b-beta",
     task="text-generation",
     max_new_tokens=4096,
     do_sample=False,
 )
+# global_tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3-8B-Instruct")
 def local_retriever(query: str):
         i += 1
     ###Debug####
+    # tokens = global_tokenizer(intermediate_results)
+    # print(f"Number of input tokens: {len(tokens)}")
     ###Debug###
     final_response = reduce_chain.invoke(
         {