Spaces:
Sleeping
Sleeping
更新注释
Browse files- crazy_functional.py +1 -1
- crazy_functions/理解PDF文档内容.py +1 -0
crazy_functional.py
CHANGED
@@ -107,7 +107,7 @@ def get_crazy_functions():
|
|
107 |
"Color": "stop",
|
108 |
"Function": HotReload(总结word文档)
|
109 |
},
|
110 |
-
"
|
111 |
# HotReload 的意思是热更新,修改函数插件代码后,不需要重启程序,代码直接生效
|
112 |
"Color": "stop",
|
113 |
"AsButton": False, # 加入下拉菜单中
|
|
|
107 |
"Color": "stop",
|
108 |
"Function": HotReload(总结word文档)
|
109 |
},
|
110 |
+
"理解PDF文档内容 (模仿ChatPDF)": {
|
111 |
# HotReload 的意思是热更新,修改函数插件代码后,不需要重启程序,代码直接生效
|
112 |
"Color": "stop",
|
113 |
"AsButton": False, # 加入下拉菜单中
|
crazy_functions/理解PDF文档内容.py
CHANGED
@@ -10,6 +10,7 @@ def 解析PDF(file_name, llm_kwargs, plugin_kwargs, chatbot, history, system_pro
|
|
10 |
print('begin analysis on:', file_name)
|
11 |
file_content, page_one = read_and_clean_pdf_text(file_name)
|
12 |
|
|
|
13 |
# 递归地切割PDF文件,每一块(尽量是完整的一个section,比如introduction,experiment等,必要时再进行切割)
|
14 |
# 的长度必须小于 2500 个 Token
|
15 |
TOKEN_LIMIT_PER_FRAGMENT = 2500
|
|
|
10 |
print('begin analysis on:', file_name)
|
11 |
file_content, page_one = read_and_clean_pdf_text(file_name)
|
12 |
|
13 |
+
############################## <第零步,从摘要中提取高价值信息,放到history中> ##################################
|
14 |
# 递归地切割PDF文件,每一块(尽量是完整的一个section,比如introduction,experiment等,必要时再进行切割)
|
15 |
# 的长度必须小于 2500 个 Token
|
16 |
TOKEN_LIMIT_PER_FRAGMENT = 2500
|