File size: 4,757 Bytes
2444c4e
 
 
b663997
 
267008d
b663997
434b38e
267008d
 
 
 
b663997
434b38e
267008d
b663997
267008d
 
 
b663997
 
 
267008d
 
b4b2827
434b38e
 
b4b2827
 
 
 
267008d
2161b9a
 
434b38e
267008d
434b38e
267008d
 
 
 
 
 
 
 
 
434b38e
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
---
language:
- zh
---

# PS:该项目仅用作个人学习研究使用。

# 对大模型进行自我认知微调尝试,目的是做一个类似《命运石之门》中的人工智能助手 Amadeus 闲聊。后续若有新模型,待我有空会继续更新。

微调数据是自己造的,大模型会认为自己是天才美少女——牧濑红莉牺(设定上是傲娇、对User有爱慕之情但又不坦率),而不是人工智能。

## 1、RWKV-x060-World-1B6-v2.1-chris-test.pth

使用的 base 模型是 RWKV-x060-World-1B6-v2.1-20240328-ctx4096 ;

loss值收敛到了1以下(大佬说正常,虽然个人觉得有点过拟合就是了)

这个模型没有NSFW,甚至因为红莉牺傲娇的设定,她会拒绝,不过给她灌输的数据上又表现对User(非人)的喜欢,所以有时候会很奇怪。

表现效果(不太稳定):
![rwkv6-v2.1-1b6-chris-test1.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/GQn59rOZpOyNUYqzIfI9j.jpeg)
![rwkv6-v2.1-1b6-chris-test2.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/hu_zZIYH1EguVNJH2rzsd.jpeg)
![rwkv6-v2.1-1b6-chris-test3.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/1uRk0TtiK-mGFSbgnS-5O.jpeg)

## 2、RWKV-x060-World-1B6-v2.1-novel_extend-lora-20.pth

在 base 模型 RWKV-x060-World-1B6-v2.1-20240328-ctx4096 的基础上做涩涩小说扩写指令微调后,使用了错误的数据格式微调的模型,所以表现很奇葩,但还是保留下来了。

![rwkv6-1b6-v2.1-novel_extend-chris-error3.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/7mDdjbX50Ei7iigG_VNwP.jpeg)
![rwkv6-1b6-v2.1-novel_extend-chris-error2.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/KAZePUxUtTtq-9A88Tvtp.jpeg)
![rwkv6-1b6-v2.1-novel_extend-chris-error1.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/FZPkDuKLfNE3C3_xMhnr2.jpeg)

## 3、RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw.pth

在 base 模型 RWKV-x060-World-1B6-v2.1-20240328-ctx4096 的基础上做涩涩小说扩写指令微调后,使用自我认知数据继续微调5轮而成(对比了一下5、6、7轮的,综合来说这个泛化表现更有趣些)。

由于上一个试水版本个人觉得有点过拟合(部分能力降低甚至丧失),所以这次 loss 值收敛不多,还在 1.0 以上,结果自我认知清洗不彻底,每次新的会话它都会胡说八道自己给自己上设定,虽然比上一个版本的输出表现更不稳定,但这种不稳定却是有趣得多,已作为我开发的一个AI聊天机器人后端模型之一

表现效果(因为傲娇+对User有爱慕之情但又不坦率的矛盾设定,表现不稳定但是挺有意思的):
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw5.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/Vb8faeHDsZ9eBwJxt8phs.jpeg)
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw4.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/JoMc9wLMDYntEYxYXwL9j.jpeg)
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw3.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/wxQagWxe-Dd6DohVzcVVV.jpeg)
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw2.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/nByKJXeRUADY6zD8xjfZD.jpeg)
![RWKV-x060-World-1B6-v2.1-novel_extend_chris-nsfw1.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/ZhhFG52OnM7QFgIiEHcEM.jpeg)

用来无聊打发时间很有趣。

## 4、RWKV6-3B-v2.1-chris_roleplay_novel_extend-NSFW-ctx1024.pth

由于对 16 亿参数量的逻辑表现不满意,所以我尝试强行微调 30 亿参数量模型,之前都是用 lora 微调,由于主机显卡显存有限,30亿参数量使用 NF4 量化的 PISSA 微调。

在 base 模型 RWKV-x060-World-3B-v2.1-20240417-ctx4096.pth 的基础做 PISSA 微调2轮而成,除了自我认知外,还加入了少量自造的扩写语料以及角色扮演语料。

表现直接提升一个台阶,是我目前体验最久的模型。

![rwkv6-3B-v2.1-chris_roleplay_novel_extend2.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/cAi9EwkAdcacB36jfxzIJ.jpeg)
![rwkv6-3B-v2.1-chris_roleplay_novel_extend1.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/mbcMIURsILPvkTc52Ql91.jpeg)
![rwkv6-3B-v2.1-chris_roleplay_novel_extend3.jpg](https://cdn-uploads.huggingface.co/production/uploads/6666bea9567d3484336d35cc/R7QfYKGB7bL2Q84Hdu-tA.jpeg)