Update README.md
Browse files
README.md
CHANGED
@@ -24,9 +24,14 @@ datasets:
|
|
24 |
---
|
25 |
|
26 |
# calm3-22b-RP-v2
|
|
|
|
|
|
|
|
|
|
|
27 |
[cyberagent/calm3-22b-chat](https://huggingface.co/cyberagent/calm3-22b-chat)をベースにロールプレイ用にQLoRAでファインチューニングしたモデルです。
|
28 |
|
29 |
-
|
30 |
元モデルから変更なく、ChatMLのフォーマットでご利用ください。以下は2ターン目の会話を行う際の形式です。
|
31 |
```
|
32 |
<|im_start|>system
|
@@ -55,7 +60,7 @@ messages = [
|
|
55 |
prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
|
56 |
```
|
57 |
|
58 |
-
|
59 |
|
60 |
### 入力
|
61 |
|
@@ -93,7 +98,7 @@ prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tok
|
|
93 |
心の声:「すごい...こんな素敵な人に会えるなんて。早く仲良くなりたいわ」
|
94 |
```
|
95 |
|
96 |
-
|
97 |
本モデルの学習には以下のデータセットを利用しています。
|
98 |
|
99 |
### 日本語データセット
|
@@ -122,11 +127,11 @@ UnslothのQLoRAを用い、Runpod上のA40一枚で学習を行いました。
|
|
122 |
- weight_decay: 0.01
|
123 |
- warmup_ratio: 0.05
|
124 |
|
125 |
-
|
126 |
本モデルの学習データにはOpenAI社のGPT-4o-miniの出力やAnthropic社のClaude 3.5 Sonnetの出力が含まれるため、これらの競合となるサービスには本モデルは利用できません。
|
127 |
そのため、本モデルは[CC-BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja)の元配布します。
|
128 |
|
129 |
-
|
130 |
|
131 |
- **Developed by:** Aratako
|
132 |
- **License:** cc-by-nc-sa-4.0
|
|
|
24 |
---
|
25 |
|
26 |
# calm3-22b-RP-v2
|
27 |
+
[GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/calm3-22b-RP-v2-GGUF)
|
28 |
+
|
29 |
+
また、[こちら](https://huggingface.co/spaces/Aratako/calm3-22b-RP-v2-demo)で本モデルのデモを公開しています。ぜひお試しください。
|
30 |
+
|
31 |
+
## 概要
|
32 |
[cyberagent/calm3-22b-chat](https://huggingface.co/cyberagent/calm3-22b-chat)をベースにロールプレイ用にQLoRAでファインチューニングしたモデルです。
|
33 |
|
34 |
+
## プロンプトフォーマット
|
35 |
元モデルから変更なく、ChatMLのフォーマットでご利用ください。以下は2ターン目の会話を行う際の形式です。
|
36 |
```
|
37 |
<|im_start|>system
|
|
|
60 |
prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
|
61 |
```
|
62 |
|
63 |
+
## プロンプト例
|
64 |
|
65 |
### 入力
|
66 |
|
|
|
98 |
心の声:「すごい...こんな素敵な人に会えるなんて。早く仲良くなりたいわ」
|
99 |
```
|
100 |
|
101 |
+
## 学習データセット
|
102 |
本モデルの学習には以下のデータセットを利用しています。
|
103 |
|
104 |
### 日本語データセット
|
|
|
127 |
- weight_decay: 0.01
|
128 |
- warmup_ratio: 0.05
|
129 |
|
130 |
+
## ライセンス
|
131 |
本モデルの学習データにはOpenAI社のGPT-4o-miniの出力やAnthropic社のClaude 3.5 Sonnetの出力が含まれるため、これらの競合となるサービスには本モデルは利用できません。
|
132 |
そのため、本モデルは[CC-BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja)の元配布します。
|
133 |
|
134 |
+
## Uploaded model
|
135 |
|
136 |
- **Developed by:** Aratako
|
137 |
- **License:** cc-by-nc-sa-4.0
|