Spaces:
Sleeping
Sleeping
Merge remote-tracking branch 'origin/test-3-29'
Browse files- .gitignore +2 -1
- crazy_functions/代码重写为全英文_多线程.py +75 -0
- crazy_functions/高级功能函数模板.py +10 -5
- functional_crazy.py +5 -28
- main.py +3 -7
- predict.py +38 -3
- project_self_analysis.md +122 -0
- toolbox.py +36 -4
.gitignore
CHANGED
@@ -138,4 +138,5 @@ ssr_conf
|
|
138 |
config_private.py
|
139 |
gpt_log
|
140 |
private.md
|
141 |
-
private_upload
|
|
|
|
138 |
config_private.py
|
139 |
gpt_log
|
140 |
private.md
|
141 |
+
private_upload
|
142 |
+
other_llms
|
crazy_functions/代码重写为全英文_多线程.py
ADDED
@@ -0,0 +1,75 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import threading
|
2 |
+
from predict import predict_no_ui_long_connection
|
3 |
+
from toolbox import CatchException, write_results_to_file
|
4 |
+
|
5 |
+
|
6 |
+
|
7 |
+
@CatchException
|
8 |
+
def 全项目切换英文(txt, top_p, temperature, chatbot, history, sys_prompt, WEB_PORT):
|
9 |
+
history = [] # 清空历史,以免输入溢出
|
10 |
+
# 集合文件
|
11 |
+
import time, glob, os
|
12 |
+
os.makedirs('gpt_log/generated_english_version', exist_ok=True)
|
13 |
+
os.makedirs('gpt_log/generated_english_version/crazy_functions', exist_ok=True)
|
14 |
+
file_manifest = [f for f in glob.glob('./*.py') if ('test_project' not in f) and ('gpt_log' not in f)] + \
|
15 |
+
[f for f in glob.glob('./crazy_functions/*.py') if ('test_project' not in f) and ('gpt_log' not in f)]
|
16 |
+
i_say_show_user_buffer = []
|
17 |
+
|
18 |
+
# 随便显示点什么防止卡顿的感觉
|
19 |
+
for index, fp in enumerate(file_manifest):
|
20 |
+
# if 'test_project' in fp: continue
|
21 |
+
with open(fp, 'r', encoding='utf-8') as f:
|
22 |
+
file_content = f.read()
|
23 |
+
i_say_show_user =f'[{index}/{len(file_manifest)}] 接下来请将以下代码中包含的所有中文转化为英文,只输出代码: {os.path.abspath(fp)}'
|
24 |
+
i_say_show_user_buffer.append(i_say_show_user)
|
25 |
+
chatbot.append((i_say_show_user, "[Local Message] 等待多线程操作,中间过程不予显示."))
|
26 |
+
yield chatbot, history, '正常'
|
27 |
+
|
28 |
+
# 任务函数
|
29 |
+
mutable_return = [None for _ in file_manifest]
|
30 |
+
def thread_worker(fp,index):
|
31 |
+
with open(fp, 'r', encoding='utf-8') as f:
|
32 |
+
file_content = f.read()
|
33 |
+
i_say = f'接下来请将以下代码中包含的所有中文转化为英文,只输出代码,文件名是{fp},文件代码是 ```{file_content}```'
|
34 |
+
# ** gpt request **
|
35 |
+
gpt_say = predict_no_ui_long_connection(inputs=i_say, top_p=top_p, temperature=temperature, history=history, sys_prompt=sys_prompt)
|
36 |
+
mutable_return[index] = gpt_say
|
37 |
+
|
38 |
+
# 所有线程同时开始执行任务函数
|
39 |
+
handles = [threading.Thread(target=thread_worker, args=(fp,index)) for index, fp in enumerate(file_manifest)]
|
40 |
+
for h in handles:
|
41 |
+
h.daemon = True
|
42 |
+
h.start()
|
43 |
+
chatbot.append(('开始了吗?', f'多线程操作已经开始'))
|
44 |
+
yield chatbot, history, '正常'
|
45 |
+
|
46 |
+
# 循环轮询各个线程是否执行完毕
|
47 |
+
cnt = 0
|
48 |
+
while True:
|
49 |
+
time.sleep(1)
|
50 |
+
th_alive = [h.is_alive() for h in handles]
|
51 |
+
if not any(th_alive): break
|
52 |
+
stat = ['执行中' if alive else '已完成' for alive in th_alive]
|
53 |
+
stat_str = '|'.join(stat)
|
54 |
+
cnt += 1
|
55 |
+
chatbot[-1] = (chatbot[-1][0], f'多线程操作已经开始,完成情况: {stat_str}' + ''.join(['.']*(cnt%4)))
|
56 |
+
yield chatbot, history, '正常'
|
57 |
+
|
58 |
+
# 把结果写入文件
|
59 |
+
for index, h in enumerate(handles):
|
60 |
+
h.join() # 这里其实不需要join了,肯定已经都结束了
|
61 |
+
fp = file_manifest[index]
|
62 |
+
gpt_say = mutable_return[index]
|
63 |
+
i_say_show_user = i_say_show_user_buffer[index]
|
64 |
+
|
65 |
+
where_to_relocate = f'gpt_log/generated_english_version/{fp}'
|
66 |
+
with open(where_to_relocate, 'w+', encoding='utf-8') as f: f.write(gpt_say.lstrip('```').rstrip('```'))
|
67 |
+
chatbot.append((i_say_show_user, f'[Local Message] 已完成{os.path.abspath(fp)}的转化,\n\n存入{os.path.abspath(where_to_relocate)}'))
|
68 |
+
history.append(i_say_show_user); history.append(gpt_say)
|
69 |
+
yield chatbot, history, '正常'
|
70 |
+
time.sleep(1)
|
71 |
+
|
72 |
+
# 备份一个文件
|
73 |
+
res = write_results_to_file(history)
|
74 |
+
chatbot.append(("给爷一份任务执行报告", res))
|
75 |
+
yield chatbot, history, '正常'
|
crazy_functions/高级功能函数模板.py
CHANGED
@@ -1,16 +1,21 @@
|
|
1 |
-
from predict import
|
2 |
-
from toolbox import CatchException, report_execption, write_results_to_file
|
3 |
-
|
4 |
|
5 |
@CatchException
|
6 |
def 高阶功能模板函数(txt, top_p, temperature, chatbot, history, systemPromptTxt, WEB_PORT):
|
7 |
history = [] # 清空历史,以免输入溢出
|
8 |
for i in range(5):
|
9 |
-
|
|
|
|
|
10 |
chatbot.append((i_say, "[Local Message] waiting gpt response."))
|
11 |
yield chatbot, history, '正常' # 由于请求gpt需要一段时间,我们先及时地做一次状态显示
|
12 |
|
13 |
-
|
|
|
|
|
|
|
14 |
|
15 |
chatbot[-1] = (i_say, gpt_say)
|
16 |
history.append(i_say);history.append(gpt_say)
|
|
|
1 |
+
from predict import predict_no_ui_long_connection
|
2 |
+
from toolbox import CatchException, report_execption, write_results_to_file
|
3 |
+
import datetime
|
4 |
|
5 |
@CatchException
|
6 |
def 高阶功能模板函数(txt, top_p, temperature, chatbot, history, systemPromptTxt, WEB_PORT):
|
7 |
history = [] # 清空历史,以免输入溢出
|
8 |
for i in range(5):
|
9 |
+
currentMonth = (datetime.date.today() + datetime.timedelta(days=i)).month
|
10 |
+
currentDay = (datetime.date.today() + datetime.timedelta(days=i)).day
|
11 |
+
i_say = f'历史中哪些事件发生在{currentMonth}月{currentDay}日?列举两条并发送相关图片。发送图片时,请使用Markdown,将Unsplash API中的PUT_YOUR_QUERY_HERE替换成描述改事件的两个最重要的单词。'
|
12 |
chatbot.append((i_say, "[Local Message] waiting gpt response."))
|
13 |
yield chatbot, history, '正常' # 由于请求gpt需要一段时间,我们先及时地做一次状态显示
|
14 |
|
15 |
+
# history = [] 每次询问不携带之前的询问历史
|
16 |
+
gpt_say = predict_no_ui_long_connection(
|
17 |
+
inputs=i_say, top_p=top_p, temperature=temperature, history=[],
|
18 |
+
sys_prompt="当你想发送一张照片时,请使用Markdown, 并且不要有反斜线, 不要用代码块。使用 Unsplash API (https://source.unsplash.com/1280x720/? < PUT_YOUR_QUERY_HERE >)。") # 请求gpt,需要一段时间
|
19 |
|
20 |
chatbot[-1] = (i_say, gpt_say)
|
21 |
history.append(i_say);history.append(gpt_say)
|
functional_crazy.py
CHANGED
@@ -7,6 +7,7 @@ def get_crazy_functionals():
|
|
7 |
from crazy_functions.解析项目源代码 import 解析一个C项目的头文件
|
8 |
from crazy_functions.解析项目源代码 import 解析一个C项目
|
9 |
from crazy_functions.高级功能函数模板 import 高阶功能模板函数
|
|
|
10 |
|
11 |
return {
|
12 |
"[实验] 请解析并解构此项目本身": {
|
@@ -32,37 +33,13 @@ def get_crazy_functionals():
|
|
32 |
"Color": "stop", # 按钮颜色
|
33 |
"Function": 批量生成函数注释
|
34 |
},
|
35 |
-
"[实验]
|
36 |
-
"
|
|
|
|
|
37 |
"Function": 高阶功能模板函数
|
38 |
},
|
39 |
}
|
40 |
|
41 |
-
def on_file_uploaded(files, chatbot, txt):
|
42 |
-
if len(files) == 0: return chatbot, txt
|
43 |
-
import shutil, os, time, glob
|
44 |
-
from toolbox import extract_archive
|
45 |
-
try: shutil.rmtree('./private_upload/')
|
46 |
-
except: pass
|
47 |
-
time_tag = time.strftime("%Y-%m-%d-%H-%M-%S", time.localtime())
|
48 |
-
os.makedirs(f'private_upload/{time_tag}', exist_ok=True)
|
49 |
-
for file in files:
|
50 |
-
file_origin_name = os.path.basename(file.orig_name)
|
51 |
-
shutil.copy(file.name, f'private_upload/{time_tag}/{file_origin_name}')
|
52 |
-
extract_archive(f'private_upload/{time_tag}/{file_origin_name}',
|
53 |
-
dest_dir=f'private_upload/{time_tag}/{file_origin_name}.extract')
|
54 |
-
moved_files = [fp for fp in glob.glob('private_upload/**/*', recursive=True)]
|
55 |
-
txt = f'private_upload/{time_tag}'
|
56 |
-
moved_files_str = '\t\n\n'.join(moved_files)
|
57 |
-
chatbot.append(['我上传了文件,请查收',
|
58 |
-
f'[Local Message] 收到以下文件: \n\n{moved_files_str}\n\n调用路径参数已自动修正到: \n\n{txt}\n\n现在您可以直接选择任意实现性功能'])
|
59 |
-
return chatbot, txt
|
60 |
|
61 |
-
def on_report_generated(files, chatbot):
|
62 |
-
from toolbox import find_recent_files
|
63 |
-
report_files = find_recent_files('gpt_log')
|
64 |
-
if len(report_files) == 0: return report_files, chatbot
|
65 |
-
# files.extend(report_files)
|
66 |
-
chatbot.append(['汇总报告如何远程获取?', '汇总报告已经添加到右侧文件上传区,请查收。'])
|
67 |
-
return report_files, chatbot
|
68 |
|
|
|
7 |
from crazy_functions.解析项目源代码 import 解析一个C项目的头文件
|
8 |
from crazy_functions.解析项目源代码 import 解析一个C项目
|
9 |
from crazy_functions.高级功能函数模板 import 高阶功能模板函数
|
10 |
+
from crazy_functions.代码重写为全英文_多线程 import 全项目切换英文
|
11 |
|
12 |
return {
|
13 |
"[实验] 请解析并解构此项目本身": {
|
|
|
33 |
"Color": "stop", # 按钮颜色
|
34 |
"Function": 批量生成函数注释
|
35 |
},
|
36 |
+
"[实验] 把本项目源代码切换成全英文(多线程demo)": {
|
37 |
+
"Function": 全项目切换英文
|
38 |
+
},
|
39 |
+
"[实验] 历史上的今天(高阶功能模板函数demo)": {
|
40 |
"Function": 高阶功能模板函数
|
41 |
},
|
42 |
}
|
43 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45 |
|
main.py
CHANGED
@@ -1,7 +1,7 @@
|
|
1 |
import os; os.environ['no_proxy'] = '*' # 避免代理网络产生意外污染
|
2 |
import gradio as gr
|
3 |
from predict import predict
|
4 |
-
from toolbox import format_io, find_free_port
|
5 |
|
6 |
# 建议您复制一个config_private.py放自己的秘密, 如API和代理网址, 避免不小心传github被别人看到
|
7 |
try: from config_private import proxies, WEB_PORT, LLM_MODEL, CONCURRENT_COUNT, AUTHENTICATION
|
@@ -26,7 +26,7 @@ from functional import get_functionals
|
|
26 |
functional = get_functionals()
|
27 |
|
28 |
# 对一些丧心病狂的实验性功能模块进行测试
|
29 |
-
from functional_crazy import get_crazy_functionals
|
30 |
crazy_functional = get_crazy_functionals()
|
31 |
|
32 |
# 处理markdown文本格式的转变
|
@@ -44,8 +44,6 @@ with gr.Blocks(theme=set_theme, analytics_enabled=False) as demo:
|
|
44 |
chatbot.style(height=1000)
|
45 |
chatbot.style()
|
46 |
history = gr.State([])
|
47 |
-
TRUE = gr.State(True)
|
48 |
-
FALSE = gr.State(False)
|
49 |
with gr.Column(scale=1):
|
50 |
with gr.Row():
|
51 |
with gr.Column(scale=12):
|
@@ -71,9 +69,7 @@ with gr.Blocks(theme=set_theme, analytics_enabled=False) as demo:
|
|
71 |
gr.Markdown("上传本地文件供上面的实验性功能调用.")
|
72 |
with gr.Row():
|
73 |
file_upload = gr.Files(label='任何文件,但推荐上传压缩文件(zip, tar)', file_count="multiple")
|
74 |
-
|
75 |
-
systemPromptTxt = gr.Textbox(show_label=True, placeholder=f"System Prompt", label="System prompt", value=initial_prompt).style(container=True)
|
76 |
-
#inputs, top_p, temperature, top_k, repetition_penalty
|
77 |
with gr.Accordion("arguments", open=False):
|
78 |
top_p = gr.Slider(minimum=-0, maximum=1.0, value=1.0, step=0.01,interactive=True, label="Top-p (nucleus sampling)",)
|
79 |
temperature = gr.Slider(minimum=-0, maximum=2.0, value=1.0, step=0.01, interactive=True, label="Temperature",)
|
|
|
1 |
import os; os.environ['no_proxy'] = '*' # 避免代理网络产生意外污染
|
2 |
import gradio as gr
|
3 |
from predict import predict
|
4 |
+
from toolbox import format_io, find_free_port, on_file_uploaded, on_report_generated
|
5 |
|
6 |
# 建议您复制一个config_private.py放自己的秘密, 如API和代理网址, 避免不小心传github被别人看到
|
7 |
try: from config_private import proxies, WEB_PORT, LLM_MODEL, CONCURRENT_COUNT, AUTHENTICATION
|
|
|
26 |
functional = get_functionals()
|
27 |
|
28 |
# 对一些丧心病狂的实验性功能模块进行测试
|
29 |
+
from functional_crazy import get_crazy_functionals
|
30 |
crazy_functional = get_crazy_functionals()
|
31 |
|
32 |
# 处理markdown文本格式的转变
|
|
|
44 |
chatbot.style(height=1000)
|
45 |
chatbot.style()
|
46 |
history = gr.State([])
|
|
|
|
|
47 |
with gr.Column(scale=1):
|
48 |
with gr.Row():
|
49 |
with gr.Column(scale=12):
|
|
|
69 |
gr.Markdown("上传本地文件供上面的实验性功能调用.")
|
70 |
with gr.Row():
|
71 |
file_upload = gr.Files(label='任何文件,但推荐上传压缩文件(zip, tar)', file_count="multiple")
|
72 |
+
system_prompt = gr.Textbox(show_label=True, placeholder=f"System Prompt", label="System prompt", value=initial_prompt).style(container=True)
|
|
|
|
|
73 |
with gr.Accordion("arguments", open=False):
|
74 |
top_p = gr.Slider(minimum=-0, maximum=1.0, value=1.0, step=0.01,interactive=True, label="Top-p (nucleus sampling)",)
|
75 |
temperature = gr.Slider(minimum=-0, maximum=2.0, value=1.0, step=0.01, interactive=True, label="Temperature",)
|
predict.py
CHANGED
@@ -25,7 +25,7 @@ def get_full_error(chunk, stream_response):
|
|
25 |
break
|
26 |
return chunk
|
27 |
|
28 |
-
def predict_no_ui(inputs, top_p, temperature, history=[]):
|
29 |
"""
|
30 |
发送至chatGPT,等待回复,一次性完成,不显示中间过程。
|
31 |
predict函数的简化版。
|
@@ -36,7 +36,7 @@ def predict_no_ui(inputs, top_p, temperature, history=[]):
|
|
36 |
history 是之前的对话列表
|
37 |
(注意无论是inputs还是history,内容太长了都会触发token数量溢出的错误,然后raise ConnectionAbortedError)
|
38 |
"""
|
39 |
-
headers, payload = generate_payload(inputs, top_p, temperature, history, system_prompt=
|
40 |
|
41 |
retry = 0
|
42 |
while True:
|
@@ -47,8 +47,8 @@ def predict_no_ui(inputs, top_p, temperature, history=[]):
|
|
47 |
except requests.exceptions.ReadTimeout as e:
|
48 |
retry += 1
|
49 |
traceback.print_exc()
|
50 |
-
if MAX_RETRY!=0: print(f'请求超时,正在重试 ({retry}/{MAX_RETRY}) ……')
|
51 |
if retry > MAX_RETRY: raise TimeoutError
|
|
|
52 |
|
53 |
try:
|
54 |
result = json.loads(response.text)["choices"][0]["message"]["content"]
|
@@ -58,6 +58,41 @@ def predict_no_ui(inputs, top_p, temperature, history=[]):
|
|
58 |
raise ConnectionAbortedError("Json解析不合常规,可能是文本过长" + response.text)
|
59 |
|
60 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
61 |
def predict(inputs, top_p, temperature, chatbot=[], history=[], system_prompt='',
|
62 |
stream = True, additional_fn=None):
|
63 |
"""
|
|
|
25 |
break
|
26 |
return chunk
|
27 |
|
28 |
+
def predict_no_ui(inputs, top_p, temperature, history=[], sys_prompt=""):
|
29 |
"""
|
30 |
发送至chatGPT,等待回复,一次性完成,不显示中间过程。
|
31 |
predict函数的简化版。
|
|
|
36 |
history 是之前的对话列表
|
37 |
(注意无论是inputs还是history,内容太长了都会触发token数量溢出的错误,然后raise ConnectionAbortedError)
|
38 |
"""
|
39 |
+
headers, payload = generate_payload(inputs, top_p, temperature, history, system_prompt=sys_prompt, stream=False)
|
40 |
|
41 |
retry = 0
|
42 |
while True:
|
|
|
47 |
except requests.exceptions.ReadTimeout as e:
|
48 |
retry += 1
|
49 |
traceback.print_exc()
|
|
|
50 |
if retry > MAX_RETRY: raise TimeoutError
|
51 |
+
if MAX_RETRY!=0: print(f'请求超时,正在重试 ({retry}/{MAX_RETRY}) ……')
|
52 |
|
53 |
try:
|
54 |
result = json.loads(response.text)["choices"][0]["message"]["content"]
|
|
|
58 |
raise ConnectionAbortedError("Json解析不合常规,可能是文本过长" + response.text)
|
59 |
|
60 |
|
61 |
+
def predict_no_ui_long_connection(inputs, top_p, temperature, history=[], sys_prompt=""):
|
62 |
+
"""
|
63 |
+
发送至chatGPT,等待回复,一次性完成,不显示中间过程。但内部用stream的方法避免有人中途掐网线。
|
64 |
+
"""
|
65 |
+
headers, payload = generate_payload(inputs, top_p, temperature, history, system_prompt=sys_prompt, stream=True)
|
66 |
+
|
67 |
+
retry = 0
|
68 |
+
while True:
|
69 |
+
try:
|
70 |
+
# make a POST request to the API endpoint, stream=False
|
71 |
+
response = requests.post(API_URL, headers=headers, proxies=proxies,
|
72 |
+
json=payload, stream=True, timeout=TIMEOUT_SECONDS); break
|
73 |
+
except requests.exceptions.ReadTimeout as e:
|
74 |
+
retry += 1
|
75 |
+
traceback.print_exc()
|
76 |
+
if retry > MAX_RETRY: raise TimeoutError
|
77 |
+
if MAX_RETRY!=0: print(f'请求超时,正在重试 ({retry}/{MAX_RETRY}) ……')
|
78 |
+
|
79 |
+
stream_response = response.iter_lines()
|
80 |
+
result = ''
|
81 |
+
while True:
|
82 |
+
try: chunk = next(stream_response).decode()
|
83 |
+
except StopIteration: break
|
84 |
+
if len(chunk)==0: continue
|
85 |
+
if not chunk.startswith('data:'):
|
86 |
+
chunk = get_full_error(chunk.encode('utf8'), stream_response)
|
87 |
+
raise ConnectionAbortedError("OpenAI拒绝了请求:" + chunk.decode())
|
88 |
+
delta = json.loads(chunk.lstrip('data:'))['choices'][0]["delta"]
|
89 |
+
if len(delta) == 0: break
|
90 |
+
if "role" in delta: continue
|
91 |
+
if "content" in delta: result += delta["content"]; print(delta["content"], end='')
|
92 |
+
else: raise RuntimeError("意外Json结构:"+delta)
|
93 |
+
return result
|
94 |
+
|
95 |
+
|
96 |
def predict(inputs, top_p, temperature, chatbot=[], history=[], system_prompt='',
|
97 |
stream = True, additional_fn=None):
|
98 |
"""
|
project_self_analysis.md
ADDED
@@ -0,0 +1,122 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# chatgpt-academic项目分析报告
|
2 |
+
(Author补充:以下分析均由本项目调用ChatGPT一键生成,如果有不准确的地方全怪GPT)
|
3 |
+
|
4 |
+
## [0/10] 程序摘要: check_proxy.py
|
5 |
+
|
6 |
+
这个程序是一个用来检查代理服务器是否有效的 Python 程序代码。程序文件名为 check_proxy.py。其中定义了一个函数 check_proxy,该函数接收一个代理配置信息 proxies,使用 requests 库向一个代理服务器发送请求,获取该代理的所在地信息并返回。如果请求超时或者异常,该函数将返回一个代理无效的结果。
|
7 |
+
|
8 |
+
程序代码分为两个部分,首先是 check_proxy 函数的定义部分,其次是程序文件的入口部分,在该部分代码中,程序从 config_private.py 文件或者 config.py 文件中加载代理配置信息,然后调用 check_proxy 函数来检测代理服务器是否有效。如果配置文件 config_private.py 存在,则会加载其中的代理配置信息,否则会从 config.py 文件中读取。
|
9 |
+
|
10 |
+
## [1/10] 程序摘要: config.py
|
11 |
+
|
12 |
+
本程序文件名为config.py,主要功能是存储应用所需的常量和配置信息。
|
13 |
+
|
14 |
+
其中,包含了应用所需的OpenAI API密钥、API接口地址、网络代理设置、超时设置、网络端口和OpenAI模型选择等信息,在运行应用前需要进行相应的配置。在未配置网络代理时,程序给出了相应的警告提示。
|
15 |
+
|
16 |
+
此外,还包含了一个检查函数,用于检查是否忘记修改API密钥。
|
17 |
+
|
18 |
+
总之,config.py文件是应用中的一个重要配置文件,用来存储应用所需的常量和配置信息,需要在应用运行前进行相应的配置。
|
19 |
+
|
20 |
+
## [2/10] 程序摘要: config_private.py
|
21 |
+
|
22 |
+
该文件是一个配置文件,命名为config_private.py。它是一个Python脚本,用于配置OpenAI的API密钥、模型和其它相关设置。该配置文件还可以设置是否使用代理。如果使用代理,需要设置代理协议、地址和端口。在设置代理之后,该文件还包括一些用于测试代理是否正常工作的代码。该文件还包括超时时间、随机端口、重试次数等设置。在文件末尾,还有一个检查代码,如果没有更改API密钥,则抛出异常。
|
23 |
+
|
24 |
+
## [3/10] 程序摘要: functional.py
|
25 |
+
|
26 |
+
该程序文件名为 functional.py,其中包含一个名为 get_functionals 的函数,该函数返回一个字典,该字典包含了各种翻译、校对等功能的名称、前缀、后缀以及默认按钮颜色等信息。具体功能包括:英语学术润色、中文学术润色、查找语法错误、中英互译、中译英、学术中译英、英译中、解释代码等。该程序的作用为提供各种翻译、校对等功能的模板,以便后续程序可以直接调用。
|
27 |
+
|
28 |
+
(Author补充:这个文件汇总了模块化的Prompt调用,如果发现了新的好用Prompt,别藏着哦^_^速速PR)
|
29 |
+
|
30 |
+
|
31 |
+
## [4/10] 程序摘要: functional_crazy.py
|
32 |
+
|
33 |
+
这个程序文件 functional_crazy.py 导入了一些 python 模块,并提供了一个函数 get_crazy_functionals(),该函数返回不同实验功能的描述和函数。其中,使用的的模块包括:
|
34 |
+
|
35 |
+
- crazy_functions.读文章写摘要 中的 读文章写摘要
|
36 |
+
- crazy_functions.生成函数注释 中的 批量生成函数注释
|
37 |
+
- crazy_functions.解析项目源代码 中的 解析项目本身、解析一个Python项目、解析一个C项目的头文件、解析一个C项目
|
38 |
+
- crazy_functions.高级功能函数模板 中的 高阶功能模板函数
|
39 |
+
|
40 |
+
返回的实验功能函数包括:
|
41 |
+
|
42 |
+
- "[实验] 请解析并解构此项目本身",包含函数:解析项目本身
|
43 |
+
- "[实验] 解析整个py项目(配合input输入框)",包含函数:解析一个Python项目
|
44 |
+
- "[实验] 解析整个C++项目头文件(配合input输入框)",包含函数:解析一个C项目的头文件
|
45 |
+
- "[实验] 解析整个C++项目(配合input输入框)",包含函数:解析一个C项目
|
46 |
+
- "[实验] 读tex论文写摘要(配合input输入框)",包含函数:读文章写摘要
|
47 |
+
- "[实验] 批量生成函数注释(配合input输入框)",包含函数:批量生成函数注释
|
48 |
+
- "[实验] 实验功能函数模板",包含函数:高阶功能模板函数
|
49 |
+
|
50 |
+
这些函数用于系统开发和测试,方便开发者进行特定程序语言后台功能开发的测试和实验,增加系统可靠稳定性和用户友好性。
|
51 |
+
|
52 |
+
(Author补充:这个文件汇总了模块化的函数,如此设计以方便任何新功能的加入)
|
53 |
+
|
54 |
+
## [5/10] 程序摘要: main.py
|
55 |
+
|
56 |
+
该程序是一个基于Gradio框架的聊天机器人应用程序。用户可以通过输入问题来获取答案,并与聊天机器人进行对话。该应用程序还集成了一些实验性功能模块,用户可以通过上传本地文件或点击相关按钮来使用这些模块。程序还可以生成对话日志,并且具有一些外观上的调整。在运行时,它会自动打开一个网页并在本地启动服务器。
|
57 |
+
|
58 |
+
|
59 |
+
## [6/10] 程序摘要: predict.py
|
60 |
+
|
61 |
+
该程序文件名为predict.py,主要是针对一个基于ChatGPT的聊天机器人进行交互和预测。
|
62 |
+
|
63 |
+
第一部分是导入所需的库和配置文件。
|
64 |
+
|
65 |
+
第二部分是一个用于获取Openai返回的完整错误信息的函数。
|
66 |
+
|
67 |
+
第三部分是用于一次性完成向ChatGPT发送请求和等待回复的函数。
|
68 |
+
|
69 |
+
第四部分是用于基础的对话功能的函数,通过stream参数可以选择是否显示中间的过程。
|
70 |
+
|
71 |
+
第五部分是用于整合所需信息和选择LLM模型生成的HTTP请求。
|
72 |
+
|
73 |
+
(Author补充:主要是predict_no_ui和predict两个函数。前者不用stream,方便、高效、易用。后者用stream,展现效果好。)
|
74 |
+
|
75 |
+
## [7/10] 程序摘要: show_math.py
|
76 |
+
|
77 |
+
这是一个名为show_math.py的Python程序文件,主要用于将Markdown-LaTeX混合文本转换为HTML格式,并包括MathML数学公式。程序使用latex2mathml.converter库将LaTeX公式转换为MathML格式,并使用正则表达式递归地翻译输入的Markdown-LaTeX混合文本。程序包括转换成双美元符号($$)形式、转换成单美元符号($)形式、转换成\[\]形式以及转换成\(\)形式的LaTeX数学公式。如果转换中出现错误,程序将返回相应的错误消息。
|
78 |
+
|
79 |
+
## [8/10] 程序摘要: theme.py
|
80 |
+
|
81 |
+
这是一个名为theme.py的程序文件,用于设置Gradio界面的颜色和字体主题。该文件中定义了一个名为adjust_theme()的函数,其作用是返回一个Gradio theme对象,设置了Gradio界面的颜色和字体主题。在该函数里面,使用了Graido可用的颜色列表,主要参数包括primary_hue、neutral_hue、font和font_mono等,用于设置Gradio界面的主题色调、字体等。另外,该函数还实现了一些参数的自定义,如input_background_fill_dark、button_transition、button_shadow_hover等,用于设置Gradio界面的渐变、阴影等特效。如果Gradio版本过于陈旧,该函数会抛出异常并返回None。
|
82 |
+
|
83 |
+
## [9/10] 程序摘要: toolbox.py
|
84 |
+
|
85 |
+
该文件为Python程序文件,文件名为toolbox.py。主要功能包括:
|
86 |
+
|
87 |
+
1. 导入markdown、mdtex2html、threading、functools等模块。
|
88 |
+
2. 定义函数predict_no_ui_but_counting_down,用于生成对话。
|
89 |
+
3. 定义函数write_results_to_file,用于将对话记录生成Markdown文件。
|
90 |
+
4. 定义函数regular_txt_to_markdown,将普通文本转换为Markdown格式的文本。
|
91 |
+
5. 定义装饰器函数CatchException,用于捕获函数执行异常并返回生成器。
|
92 |
+
6. 定义函数report_execption,用于向chatbot中添加错误信息。
|
93 |
+
7. 定义函数text_divide_paragraph,用于将文本按照段落分隔符分割开,生成带有段落标签的HTML代码。
|
94 |
+
8. 定义函数markdown_convertion,用于将Markdown格式的文本转换为HTML格式。
|
95 |
+
9. 定义函数format_io,用于将输入和输出解析为HTML格式。
|
96 |
+
10. 定义函数find_free_port,用于返回当前系统中可用的未使用端口。
|
97 |
+
11. 定义函数extract_archive,用于解压归档文件。
|
98 |
+
12. 定义函数find_recent_files,用于查找最近创建的文件。
|
99 |
+
13. 定义函数on_file_uploaded,用于处理上传文件的操作。
|
100 |
+
14. 定义函数on_report_generated,用于处理生成报告文件的操作。
|
101 |
+
|
102 |
+
## 程序的整体功能和构架做出概括。然后用一张markdown表格整理每个文件的功能。
|
103 |
+
|
104 |
+
这是一个基于Gradio框架的聊天机器人应用,支持通过文本聊天来获取答案,并可以使用一系列实验性功能模块,例如生成函数注释、解析项目源代码、读取Latex论文写摘要等。 程序架构分为前端和后端两个部分。前端使用Gradio实现,包括用户输入区域、应答区域、按钮、调用方式等。后端使用Python实现,包括聊天机器人模型、实验性功能模块、模板模块、管理模块、主程序模块等。
|
105 |
+
|
106 |
+
每个程序文件的功能如下:
|
107 |
+
|
108 |
+
| 文件名 | 功能描述 |
|
109 |
+
|:----:|:----:|
|
110 |
+
| check_proxy.py | 检查代理服务器是否有效 |
|
111 |
+
| config.py | 存储应用所需的常量和配置信息 |
|
112 |
+
| config_private.py | 存储Openai的API密钥、模型和其他相关设置 |
|
113 |
+
| functional.py | 提供各种翻译、校对等实用模板 |
|
114 |
+
| functional_crazy.py | 提供一些实验性质的高级功能 |
|
115 |
+
| main.py | 基于Gradio框架的聊天机器人应用程序的主程序 |
|
116 |
+
| predict.py | 用于chatbot预测方案创建,向ChatGPT发送请求和获取回复 |
|
117 |
+
| show_math.py | 将Markdown-LaTeX混合文本转换为HTML格式,并包括MathML数学公式 |
|
118 |
+
| theme.py | 设置Gradio界面的颜色和字体主题 |
|
119 |
+
| toolbox.py | 定义一系列工具函数,用于对输入输出进行格式转换、文件操作、异常捕捉和处理等 |
|
120 |
+
|
121 |
+
这些程序文件共同组成了一个聊天机器人应用程序的前端和后端实现,使用户可以方便地进行聊天,并可以使用相应的实验功能模块。
|
122 |
+
|
toolbox.py
CHANGED
@@ -2,7 +2,7 @@ import markdown, mdtex2html, threading
|
|
2 |
from show_math import convert as convert_math
|
3 |
from functools import wraps
|
4 |
|
5 |
-
def predict_no_ui_but_counting_down(i_say, i_say_show_user, chatbot, top_p, temperature, history=[]):
|
6 |
"""
|
7 |
调用简单的predict_no_ui接口,但是依然保留了些许界面心跳功能,当对话太长时,会自动采用二分法截断
|
8 |
"""
|
@@ -17,7 +17,7 @@ def predict_no_ui_but_counting_down(i_say, i_say_show_user, chatbot, top_p, temp
|
|
17 |
def mt(i_say, history):
|
18 |
while True:
|
19 |
try:
|
20 |
-
mutable[0] = predict_no_ui(inputs=i_say, top_p=top_p, temperature=temperature, history=history)
|
21 |
break
|
22 |
except ConnectionAbortedError as e:
|
23 |
if len(history) > 0:
|
@@ -27,7 +27,8 @@ def predict_no_ui_but_counting_down(i_say, i_say_show_user, chatbot, top_p, temp
|
|
27 |
i_say = i_say[:len(i_say)//2]
|
28 |
mutable[1] = 'Warning! Input file is too long, cut into half. '
|
29 |
except TimeoutError as e:
|
30 |
-
mutable[0] = '[Local Message] Failed with timeout'
|
|
|
31 |
# 创建新线程发出http请求
|
32 |
thread_name = threading.Thread(target=mt, args=(i_say, history)); thread_name.start()
|
33 |
# 原来的线程则负责持续更新UI,实现一个超时倒计时,并等待新线程的任务完成
|
@@ -39,6 +40,7 @@ def predict_no_ui_but_counting_down(i_say, i_say_show_user, chatbot, top_p, temp
|
|
39 |
time.sleep(1)
|
40 |
# 把gpt的输出从mutable中取出来
|
41 |
gpt_say = mutable[0]
|
|
|
42 |
return gpt_say
|
43 |
|
44 |
def write_results_to_file(history, file_name=None):
|
@@ -184,4 +186,34 @@ def find_recent_files(directory):
|
|
184 |
if created_time >= one_minute_ago:
|
185 |
recent_files.append(file_path)
|
186 |
|
187 |
-
return recent_files
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
from show_math import convert as convert_math
|
3 |
from functools import wraps
|
4 |
|
5 |
+
def predict_no_ui_but_counting_down(i_say, i_say_show_user, chatbot, top_p, temperature, history=[], sys_prompt=''):
|
6 |
"""
|
7 |
调用简单的predict_no_ui接口,但是依然保留了些许界面心跳功能,当对话太长时,会自动采用二分法截断
|
8 |
"""
|
|
|
17 |
def mt(i_say, history):
|
18 |
while True:
|
19 |
try:
|
20 |
+
mutable[0] = predict_no_ui(inputs=i_say, top_p=top_p, temperature=temperature, history=history, sys_prompt=sys_prompt)
|
21 |
break
|
22 |
except ConnectionAbortedError as e:
|
23 |
if len(history) > 0:
|
|
|
27 |
i_say = i_say[:len(i_say)//2]
|
28 |
mutable[1] = 'Warning! Input file is too long, cut into half. '
|
29 |
except TimeoutError as e:
|
30 |
+
mutable[0] = '[Local Message] Failed with timeout.'
|
31 |
+
raise TimeoutError
|
32 |
# 创建新线程发出http请求
|
33 |
thread_name = threading.Thread(target=mt, args=(i_say, history)); thread_name.start()
|
34 |
# 原来的线程则负责持续更新UI,实现一个超时倒计时,并等待新线程的任务完成
|
|
|
40 |
time.sleep(1)
|
41 |
# 把gpt的输出从mutable中取出来
|
42 |
gpt_say = mutable[0]
|
43 |
+
if gpt_say=='[Local Message] Failed with timeout.': raise TimeoutError
|
44 |
return gpt_say
|
45 |
|
46 |
def write_results_to_file(history, file_name=None):
|
|
|
186 |
if created_time >= one_minute_ago:
|
187 |
recent_files.append(file_path)
|
188 |
|
189 |
+
return recent_files
|
190 |
+
|
191 |
+
|
192 |
+
def on_file_uploaded(files, chatbot, txt):
|
193 |
+
if len(files) == 0: return chatbot, txt
|
194 |
+
import shutil, os, time, glob
|
195 |
+
from toolbox import extract_archive
|
196 |
+
try: shutil.rmtree('./private_upload/')
|
197 |
+
except: pass
|
198 |
+
time_tag = time.strftime("%Y-%m-%d-%H-%M-%S", time.localtime())
|
199 |
+
os.makedirs(f'private_upload/{time_tag}', exist_ok=True)
|
200 |
+
for file in files:
|
201 |
+
file_origin_name = os.path.basename(file.orig_name)
|
202 |
+
shutil.copy(file.name, f'private_upload/{time_tag}/{file_origin_name}')
|
203 |
+
extract_archive(f'private_upload/{time_tag}/{file_origin_name}',
|
204 |
+
dest_dir=f'private_upload/{time_tag}/{file_origin_name}.extract')
|
205 |
+
moved_files = [fp for fp in glob.glob('private_upload/**/*', recursive=True)]
|
206 |
+
txt = f'private_upload/{time_tag}'
|
207 |
+
moved_files_str = '\t\n\n'.join(moved_files)
|
208 |
+
chatbot.append(['我上传了文件,请查收',
|
209 |
+
f'[Local Message] 收到以下文件: \n\n{moved_files_str}\n\n调用路径参数已自动修正到: \n\n{txt}\n\n现在您可以直接选择任意实现性功能'])
|
210 |
+
return chatbot, txt
|
211 |
+
|
212 |
+
|
213 |
+
def on_report_generated(files, chatbot):
|
214 |
+
from toolbox import find_recent_files
|
215 |
+
report_files = find_recent_files('gpt_log')
|
216 |
+
if len(report_files) == 0: return report_files, chatbot
|
217 |
+
# files.extend(report_files)
|
218 |
+
chatbot.append(['汇总报告如何远程获取?', '汇总报告已经添加到右侧文件上传区,请查收。'])
|
219 |
+
return report_files, chatbot
|