Basic_RAG_AI_Chatbot_with_chatGPT

Sleeping

PCFISH commited on Nov 27, 2023

Commit

f1ec1d5

•

1 Parent(s): ec113e6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -59,13 +59,23 @@ def get_json_file(docs):
 # 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
 def get_text_chunks(documents):
     text_splitter = RecursiveCharacterTextSplitter(
-        chunk_size=1000, # 청크의 크기를 지정합니다.
-        chunk_overlap=200, # 청크 사이의 중복을 지정합니다.
-        length_function=len # 텍스트의 길이를 측정하는 함수를 지정합니다.
     )
-    documents = text_splitter.split_documents(documents) # 문서들을 청크로 나눕니다
-    return documents # 나눈 청크를 반환합니다.
 # 텍스트 청크들로부터 벡터 스토어를 생성하는 함수입니다.

 # 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
 def get_text_chunks(documents):
     text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=1000,
+        chunk_overlap=200,
+        length_function=len
     )
+    # 각 문서의 내용을 리스트에 추가
+    texts = []
+    for doc in documents:
+        if isinstance(doc, str):
+            # 문자열인 경우 그대로 추가
+            texts.append(doc)
+        else:
+            # 그 외의 경우에는 문서의 내용을 추가
+            texts.append(doc.page_content)
+    # 나눈 청크를 반환
+    return text_splitter.split_documents(texts)
 # 텍스트 청크들로부터 벡터 스토어를 생성하는 함수입니다.