Aratako commited on
Commit
52e0d3d
1 Parent(s): c3220d2

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +10 -5
README.md CHANGED
@@ -24,9 +24,14 @@ datasets:
24
  ---
25
 
26
  # calm3-22b-RP-v2
 
 
 
 
 
27
  [cyberagent/calm3-22b-chat](https://huggingface.co/cyberagent/calm3-22b-chat)をベースにロールプレイ用にQLoRAでファインチューニングしたモデルです。
28
 
29
- # プロンプトフォーマット
30
  元モデルから変更なく、ChatMLのフォーマットでご利用ください。以下は2ターン目の会話を行う際の形式です。
31
  ```
32
  <|im_start|>system
@@ -55,7 +60,7 @@ messages = [
55
  prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
56
  ```
57
 
58
- # プロンプト例
59
 
60
  ### 入力
61
 
@@ -93,7 +98,7 @@ prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tok
93
  心の声:「すごい...こんな素敵な人に会えるなんて。早く仲良くなりたいわ」
94
  ```
95
 
96
- # 学習データセット
97
  本モデルの学習には以下のデータセットを利用しています。
98
 
99
  ### 日本語データセット
@@ -122,11 +127,11 @@ UnslothのQLoRAを用い、Runpod上のA40一枚で学習を行いました。
122
  - weight_decay: 0.01
123
  - warmup_ratio: 0.05
124
 
125
- # ライセンス
126
  本モデルの学習データにはOpenAI社のGPT-4o-miniの出力やAnthropic社のClaude 3.5 Sonnetの出力が含まれるため、これらの競合となるサービスには本モデルは利用できません。
127
  そのため、本モデルは[CC-BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja)の元配布します。
128
 
129
- # Uploaded model
130
 
131
  - **Developed by:** Aratako
132
  - **License:** cc-by-nc-sa-4.0
 
24
  ---
25
 
26
  # calm3-22b-RP-v2
27
+ [GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/calm3-22b-RP-v2-GGUF)
28
+
29
+ また、[こちら](https://huggingface.co/spaces/Aratako/calm3-22b-RP-v2-demo)で本モデルのデモを公開しています。ぜひお試しください。
30
+
31
+ ## 概要
32
  [cyberagent/calm3-22b-chat](https://huggingface.co/cyberagent/calm3-22b-chat)をベースにロールプレイ用にQLoRAでファインチューニングしたモデルです。
33
 
34
+ ## プロンプトフォーマット
35
  元モデルから変更なく、ChatMLのフォーマットでご利用ください。以下は2ターン目の会話を行う際の形式です。
36
  ```
37
  <|im_start|>system
 
60
  prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
61
  ```
62
 
63
+ ## プロンプト例
64
 
65
  ### 入力
66
 
 
98
  心の声:「すごい...こんな素敵な人に会えるなんて。早く仲良くなりたいわ」
99
  ```
100
 
101
+ ## 学習データセット
102
  本モデルの学習には以下のデータセットを利用しています。
103
 
104
  ### 日本語データセット
 
127
  - weight_decay: 0.01
128
  - warmup_ratio: 0.05
129
 
130
+ ## ライセンス
131
  本モデルの学習データにはOpenAI社のGPT-4o-miniの出力やAnthropic社のClaude 3.5 Sonnetの出力が含まれるため、これらの競合となるサービスには本モデルは利用できません。
132
  そのため、本モデルは[CC-BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja)の元配布します。
133
 
134
+ ## Uploaded model
135
 
136
  - **Developed by:** Aratako
137
  - **License:** cc-by-nc-sa-4.0