Update README.md
Browse files
README.md
CHANGED
@@ -22,9 +22,11 @@ loss值收敛到了1以下(大佬说正常,虽然个人觉得有点过拟合
|
|
22 |
![rwkv6-v2.1-1b6-chris-test2.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/hu_zZIYH1EguVNJH2rzsd.jpeg)
|
23 |
![rwkv6-v2.1-1b6-chris-test3.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/1uRk0TtiK-mGFSbgnS-5O.jpeg)
|
24 |
|
25 |
-
## 2、
|
26 |
|
27 |
-
|
|
|
|
|
28 |
|
29 |
由于上一个试水版本个人觉得有点过拟合(部分能力降低甚至丧失),所以这次loss值收敛不多,还在1.0以上,结果自我认知清洗不彻底,每次新的会话它都会胡说八道自己给自己上设定,虽然比上一个版本的输出表现更不稳定,但这种不稳定却是有趣得多,已作为我开发的一个AI聊天机器人后端模型之一
|
30 |
|
@@ -36,5 +38,3 @@ loss值收敛到了1以下(大佬说正常,虽然个人觉得有点过拟合
|
|
36 |
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw1.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/ZhhFG52OnM7QFgIiEHcEM.jpeg)
|
37 |
|
38 |
用来无聊打发时间很有趣。
|
39 |
-
|
40 |
-
## 3、
|
|
|
22 |
![rwkv6-v2.1-1b6-chris-test2.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/hu_zZIYH1EguVNJH2rzsd.jpeg)
|
23 |
![rwkv6-v2.1-1b6-chris-test3.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/1uRk0TtiK-mGFSbgnS-5O.jpeg)
|
24 |
|
25 |
+
## 2、
|
26 |
|
27 |
+
## 3、RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw.pth
|
28 |
+
|
29 |
+
在base模型RWKV-x060-World-1B6-v2.1-20240328-ctx4096的基础上做涩涩小说扩写指令微调后,使用自我认知数据继续微调5轮而成(对比了一下5、6、7轮的,综合来说这个泛化表现更有趣些)。
|
30 |
|
31 |
由于上一个试水版本个人觉得有点过拟合(部分能力降低甚至丧失),所以这次loss值收敛不多,还在1.0以上,结果自我认知清洗不彻底,每次新的会话它都会胡说八道自己给自己上设定,虽然比上一个版本的输出表现更不稳定,但这种不稳定却是有趣得多,已作为我开发的一个AI聊天机器人后端模型之一
|
32 |
|
|
|
38 |
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw1.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/ZhhFG52OnM7QFgIiEHcEM.jpeg)
|
39 |
|
40 |
用来无聊打发时间很有趣。
|
|
|
|