Seikaijyu
/

RWKV-x060-World-3B-v2.1-Claude-nsfw.roleplay

Not-For-All-Audiences

Model card Files Files and versions Community

RWKV-x060-World-3B-v2.1-Claude-nsfw.roleplay / README.md

Seikaijyu's picture

Update README.md

0a69c3f verified 3 months ago

|

history blame contribute delete

No virus

1.76 kB

	---
	license: mit
	language:
	- zh
	tags:
	- not-for-all-audiences
	---
	### 模型说明
	#### 基于RWKV6-v2.1-3B 全新基模微调的nsfw语C模型
	#### 非常感谢<b style="color:red">某不知名的神秘网友</b>提供的784条Claude超长上下文语料（单条长度超过120k），此模型也是基于该语料进行的实验性质微调
	#### 使用7k长上下文微调19epoch后loss为1.7得到的模型
	#### 因为超长上下文，继续微调应该还能提升效果，暂时只做测试，后续我会进行全面微调，敬请期待

	#### 效果如下：
	##### <b style="color:red">注意：使用该模型需要自定义上文，以下演示回复模型输出的第一句到第二句都为手动定义</b>
	![image/png](https://cdn-uploads.huggingface.co/production/uploads/6417b108b03817ada6444bb8/byFq2LX-CwukDjvQ1rhav.png)

	![image/png](https://cdn-uploads.huggingface.co/production/uploads/6417b108b03817ada6444bb8/QhXCmfY00zjaGuv0DcK1t.png)

	#### 神里绫华

	![image/png](https://cdn-uploads.huggingface.co/production/uploads/6417b108b03817ada6444bb8/o3SvTO2_GxDdulhtC1zr1.png)

	![image/png](https://cdn-uploads.huggingface.co/production/uploads/6417b108b03817ada6444bb8/rgVXtBm5gP8ptPlwo3yHO.png)

	### 补充说明
	#### 因为此模型使用纯粹的nsfw多轮对话数据微调，生成会偏向nsfw，这是正常现象
	#### 此模型需要手动设定上文才能有良好表现，模型回复会与上文回复类似
	---
	#### 推荐如下格式使用模型（不需要设置角色名称，因为让模型以第三人称视角回复效果更好）
	```
	System:
	User:
	Assistant:
	```
	### 推荐参数如下：
	#### Temperature=2-3之间
	#### Top_P=0.55-0.65之间
	#### Presence Penalty=0.4-0之间
	#### Frequency Penalty=0.8-1.2之间