Update README.md
Browse files
README.md
CHANGED
@@ -9,8 +9,8 @@ text: "新冠肺炎怎么预防。\n答:"
|
|
9 |
--------------------------------------------------------------------------------
|
10 |
# ChatGLM-6B RLHF & LoRA Model
|
11 |
|
12 |
-
ChatGLM-6B
|
13 |
-
##
|
14 |
|
15 |
- 首先,用40万条gpt4数据进行强化训练,以提高模型的基础能力;
|
16 |
- 第二,使用30万条人类反馈数据,构建一个表达方式规范优雅的语言模式(RM模型);
|
|
|
9 |
--------------------------------------------------------------------------------
|
10 |
# ChatGLM-6B RLHF & LoRA Model
|
11 |
|
12 |
+
ChatGLM-6B 是开源中英双语对话模型,本次训练基于ChatGLM-6B 的第一代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上开展训练。
|
13 |
+
## 本次训练使用的方法
|
14 |
|
15 |
- 首先,用40万条gpt4数据进行强化训练,以提高模型的基础能力;
|
16 |
- 第二,使用30万条人类反馈数据,构建一个表达方式规范优雅的语言模式(RM模型);
|