Spaces:

kartavya23
/

GitChat

Sleeping

App Files Files Community

kartavya23 commited on Jul 8

Commit

47ad957

•

1 Parent(s): 5f9e152

Upload 4 files

Browse files

Files changed (4) hide show

rag_101/__pycache__/retriever.cpython-39.pyc +0 -0
rag_101/client.py +61 -0
rag_101/rag.py +52 -0
rag_101/retriever.py +160 -0

rag_101/__pycache__/retriever.cpython-39.pyc ADDED Viewed

Binary file (4.88 kB). View file

rag_101/client.py ADDED Viewed

	@@ -0,0 +1,61 @@

+from langchain.callbacks import FileCallbackHandler
+from langchain_community.chat_models import ChatOllama
+from langchain_core.output_parsers import StrOutputParser
+from langchain_core.prompts import ChatPromptTemplate
+from loguru import logger
+from rag_101.retriever import (
+    RAGException,
+    create_parent_retriever,
+    load_embedding_model,
+    load_pdf,
+    load_reranker_model,
+    retrieve_context,
+)
+class RAGClient:
+    embedding_model = load_embedding_model()
+    reranker_model = load_reranker_model()
+    def __init__(self, files, model="mistral"):
+        docs = load_pdf(files=files)
+        self.retriever = create_parent_retriever(docs, self.embedding_model)
+        llm = ChatOllama(model=model)
+        prompt_template = ChatPromptTemplate.from_template(
+            (
+                "Please answer the following question based on the provided `context` that follows the question.\n"
+                "Think step by step before coming to answer. If you do not know the answer then just say 'I do not know'\n"
+                "question: {question}\n"
+                "context: ```{context}```\n"
+            )
+        )
+        self.chain = prompt_template | llm | StrOutputParser()
+    def stream(self, query: str) -> dict:
+        try:
+            context, similarity_score = self.retrieve_context(query)[0]
+            context = context.page_content
+            if similarity_score < 0.005:
+                context = "This context is not confident. " + context
+        except RAGException as e:
+            context, similarity_score = e.args[0], 0
+        logger.info(context)
+        for r in self.chain.stream({"context": context, "question": query}):
+            yield r
+    def retrieve_context(self, query: str):
+        return retrieve_context(
+            query, retriever=self.retriever, reranker_model=self.reranker_model
+        )
+    def generate(self, query: str) -> dict:
+        contexts = self.retrieve_context(query)
+        return {
+            "contexts": contexts,
+            "response": self.chain.invoke(
+                {"context": contexts[0][0].page_content, "question": query}
+            ),
+        }

rag_101/rag.py ADDED Viewed

	@@ -0,0 +1,52 @@

+import time
+from typing import List, Optional, Union
+from langchain_community.chat_models import ChatOllama
+from langchain_core.output_parsers import StrOutputParser
+from langchain_core.prompts import ChatPromptTemplate
+from retriever import (
+    create_parent_retriever,
+    load_embedding_model,
+    load_pdf,
+    load_reranker_model,
+    retrieve_context,
+)
+def main(
+    file: str = "2401.08406v3.pdf",
+    llm_name="mistral",
+):
+    docs = load_pdf(files=file)
+    embedding_model = load_embedding_model()
+    retriever = create_parent_retriever(docs, embedding_model)
+    reranker_model = load_reranker_model()
+    llm = ChatOllama(model=llm_name)
+    prompt_template = ChatPromptTemplate.from_template(
+        (
+            "Please answer the following question based on the provided `context` that follows the question.\n"
+            "If you do not know the answer then just say 'I do not know'\n"
+            "question: {question}\n"
+            "context: ```{context}```\n"
+        )
+    )
+    chain = prompt_template | llm | StrOutputParser()
+    while True:
+        query = input("Ask question: ")
+        context = retrieve_context(
+            query, retriever=retriever, reranker_model=reranker_model
+        )[0]
+        print("LLM Response: ", end="")
+        for e in chain.stream({"context": context[0].page_content, "question": query}):
+            print(e, end="")
+        print()
+        time.sleep(0.1)
+if __name__ == "__main__":
+    from jsonargparse import CLI
+    CLI(main)

rag_101/retriever.py ADDED Viewed

	@@ -0,0 +1,160 @@

+import os
+os.environ["HF_HOME"] = "weights"
+os.environ["TORCH_HOME"] = "weights"
+from typing import List, Optional, Union
+from langchain.callbacks import FileCallbackHandler
+from langchain.retrievers import ContextualCompressionRetriever, ParentDocumentRetriever
+from langchain.retrievers.document_compressors import EmbeddingsFilter
+from langchain.storage import InMemoryStore
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain_community.document_loaders import UnstructuredFileLoader
+from langchain_community.embeddings import HuggingFaceEmbeddings
+from langchain_community.vectorstores import FAISS, Chroma
+from langchain_core.documents import Document
+from loguru import logger
+from rich import print
+from sentence_transformers import CrossEncoder
+from unstructured.cleaners.core import clean_extra_whitespace, group_broken_paragraphs
+logfile = "log/output.log"
+logger.add(logfile, colorize=True, enqueue=True)
+handler = FileCallbackHandler(logfile)
+persist_directory = None
+class RAGException(Exception):
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+def rerank_docs(reranker_model, query, retrieved_docs):
+    query_and_docs = [(query, r.page_content) for r in retrieved_docs]
+    scores = reranker_model.predict(query_and_docs)
+    return sorted(list(zip(retrieved_docs, scores)), key=lambda x: x[1], reverse=True)
+def load_pdf(
+    files: Union[str, List[str]] = "2401.08406v3.pdf"
+) -> List[Document]:
+    if isinstance(files, str):
+        loader = UnstructuredFileLoader(
+            files,
+            post_processors=[clean_extra_whitespace, group_broken_paragraphs],
+        )
+        return loader.load()
+    loaders = [
+        UnstructuredFileLoader(
+            file,
+            post_processors=[clean_extra_whitespace, group_broken_paragraphs],
+        )
+        for file in files
+    ]
+    docs = []
+    for loader in loaders:
+        docs.extend(
+            loader.load(),
+        )
+    return docs
+def create_parent_retriever(
+    docs: List[Document], embeddings_model: HuggingFaceEmbeddings()
+):
+    parent_splitter = RecursiveCharacterTextSplitter(
+        separators=["\n\n\n", "\n\n"],
+        chunk_size=2000,
+        length_function=len,
+        is_separator_regex=False,
+    )
+    # This text splitter is used to create the child documents
+    child_splitter = RecursiveCharacterTextSplitter(
+        separators=["\n\n\n", "\n\n"],
+        chunk_size=1000,
+        chunk_overlap=300,
+        length_function=len,
+        is_separator_regex=False,
+    )
+    # The vectorstore to use to index the child chunks
+    vectorstore = Chroma(
+        collection_name="split_documents",
+        embedding_function=embeddings_model,
+        persist_directory=persist_directory,
+    )
+    # The storage layer for the parent documents
+    store = InMemoryStore()
+    retriever = ParentDocumentRetriever(
+        vectorstore=vectorstore,
+        docstore=store,
+        child_splitter=child_splitter,
+        parent_splitter=parent_splitter,
+        k=10,
+    )
+    retriever.add_documents(docs)
+    return retriever
+def retrieve_context(query, retriever, reranker_model):
+    retrieved_docs = retriever.get_relevant_documents(query)
+    if len(retrieved_docs) == 0:
+        raise RAGException(
+            f"Couldn't retrieve any relevant document with the query `{query}`. Try modifying your question!"
+        )
+    reranked_docs = rerank_docs(
+        query=query, retrieved_docs=retrieved_docs, reranker_model=reranker_model
+    )
+    return reranked_docs
+def load_embedding_model(
+    model_name: str = "BAAI/bge-large-en-v1.5", device: str = "cuda"
+) -> HuggingFaceEmbeddings:
+    model_kwargs = {"device": device}
+    encode_kwargs = {
+        "normalize_embeddings": True
+    }  # set True to compute cosine similarity
+    embedding_model = HuggingFaceEmbeddings(
+        model_name=model_name,
+        model_kwargs=model_kwargs,
+        encode_kwargs=encode_kwargs,
+    )
+    return embedding_model
+def load_reranker_model(
+    reranker_model_name: str = "BAAI/bge-reranker-large", device: str = "cuda"
+) -> CrossEncoder:
+    reranker_model = CrossEncoder(
+        model_name=reranker_model_name, max_length=1024, device=device
+    )
+    return reranker_model
+def main(
+    file: str = "2401.08406v3.pdf",
+    query: Optional[str] = None,
+    llm_name="mistral",
+):
+    docs = load_pdf(files=file)
+    embedding_model = load_embedding_model()
+    retriever = create_parent_retriever(docs, embedding_model)
+    reranker_model = load_reranker_model()
+    context = retrieve_context(
+        query, retriever=retriever, reranker_model=reranker_model
+    )[0]
+    print("context:\n", context, "\n", "=" * 50, "\n")
+if __name__ == "__main__":
+    from jsonargparse import CLI
+    CLI(main)