Update README.md
Browse files
README.md
CHANGED
@@ -24,7 +24,7 @@ XuanYuan2-70B系列共包含4个模型,包括基座模型XuanYuan2-70B,chat
|
|
24 |
|
25 |
基于XuanYuan2-70B基座模型,我们重新利用更多高质量的指令微调数据来进行指令对齐,主要提升的方向是通用与金融类型的指令数据质量和多样性。
|
26 |
|
27 |
-
对于指令微调后的模型,我们构建高质量的偏好数据和prompt数据,进行了基于人类反馈的强化训练(Reinforcement learning with human feedback,RLHF
|
28 |
|
29 |
## 性能评测
|
30 |
|
|
|
24 |
|
25 |
基于XuanYuan2-70B基座模型,我们重新利用更多高质量的指令微调数据来进行指令对齐,主要提升的方向是通用与金融类型的指令数据质量和多样性。
|
26 |
|
27 |
+
对于指令微调后的模型,我们构建高质量的偏好数据和prompt数据,进行了基于人类反馈的强化训练(Reinforcement learning with human feedback,RLHF),进一步对齐了模型与人类的偏好,使模型表现能更符合人类需求。模型在通用性、安全性、金融领域内的表现有了较明显的提升。
|
28 |
|
29 |
## 性能评测
|
30 |
|