kanhatakeyama
commited on
Commit
•
f4832c3
1
Parent(s):
06442c1
Update README.md
Browse files
README.md
CHANGED
@@ -1,3 +1,84 @@
|
|
1 |
---
|
2 |
license: apache-2.0
|
3 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
---
|
2 |
license: apache-2.0
|
3 |
+
language:
|
4 |
+
- ja
|
5 |
+
- en
|
6 |
+
library_name: transformers
|
7 |
+
tags:
|
8 |
+
- japanese
|
9 |
+
---
|
10 |
+
|
11 |
+
# Tanuki-8x8B-dpo-v1.0
|
12 |
+
|
13 |
+
## モデルについて
|
14 |
+
|
15 |
+
Tanuki-8x8Bは、フルスクラッチで?トークン事前学習された8x8Bパラメータ(総パラメータ約47B、アクティブパラメータ約13B)の大規模言語モデルです。
|
16 |
+
Tanuki-8x8B-dpo-v1.0は、Tanuki-8x8BにSFTおよびDPOを適用し作成された対話用モデルです。
|
17 |
+
|
18 |
+
## 量子化モデル
|
19 |
+
- [AWQ 4bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-AWQ)
|
20 |
+
- [GPTQ 4bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-4bit)
|
21 |
+
- [GPTQ 8bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-8bit)
|
22 |
+
- [GGUF量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GGUF)*
|
23 |
+
|
24 |
+
*GGUF版は性能低下が発生している可能性があり、非推奨
|
25 |
+
|
26 |
+
## 使い方
|
27 |
+
|
28 |
+
```python
|
29 |
+
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
|
30 |
+
|
31 |
+
model = AutoModelForCausalLM.from_pretrained("weblab-GENIAC/Tanuki-8x8B-dpo-v1.0", device_map="auto", torch_dtype="auto", trust_remote_code=True)
|
32 |
+
tokenizer = AutoTokenizer.from_pretrained("weblab-GENIAC/Tanuki-8x8B-dpo-v1.0")
|
33 |
+
streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
|
34 |
+
|
35 |
+
messages = [
|
36 |
+
{"role": "system", "content": "以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。"},
|
37 |
+
{"role": "user", "content": "AIによって私たちの暮らしはどのように変わりますか?"}
|
38 |
+
]
|
39 |
+
|
40 |
+
input_ids = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
|
41 |
+
output_ids = model.generate(input_ids,
|
42 |
+
max_new_tokens=1024,
|
43 |
+
temperature=0.5,
|
44 |
+
streamer=streamer)
|
45 |
+
```
|
46 |
+
|
47 |
+
## プロンプト形式
|
48 |
+
Tanuki-8x8B-dpo-v1.0は日本語版Alpacaのプロンプトフォーマットを利用します。
|
49 |
+
```
|
50 |
+
<s>以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。
|
51 |
+
|
52 |
+
### 指示:
|
53 |
+
AIによって私たちの暮らしはどのように変わりますか?
|
54 |
+
|
55 |
+
### 応答:
|
56 |
+
|
57 |
+
```
|
58 |
+
|
59 |
+
なお、本モデルはデフォルトのシステムプロンプトである`以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。`以外を学習していないため、このシステムプロンプトの使用を推奨します。タスクの詳細はユーザープロンプトに記述してください。
|
60 |
+
|
61 |
+
## ベンチマーク
|
62 |
+
|
63 |
+
**Japanese MT-Bench**
|
64 |
+
GPT-4による評価 (gpt-4-0613、平均スコア算出においてスコア-1は除外)
|
65 |
+
|
66 |
+
| | Tanuki-8B-dpo-v1.0 | Tanuki-8x8B-dpo-v1.0 |
|
67 |
+
| ---- | ---- | ---- |
|
68 |
+
| 平均スコア | 7.24 | 7.96 |
|
69 |
+
| coding | 5.4 | 6.75 |
|
70 |
+
| extraction | 6.65 | 6.90|
|
71 |
+
| humanities | 9.1 | 9.3 |
|
72 |
+
| math | 3.9 | 5.75 |
|
73 |
+
| reasoning | 5.75 | 7.35 |
|
74 |
+
| roleplay | 8.75 | 8.95 |
|
75 |
+
| stem | 9.35 | 9.40 |
|
76 |
+
| writing | 9.05 | 8.85 |
|
77 |
+
|
78 |
+
GPT-4oによる評価
|
79 |
+
![image/png](https://cdn-uploads.huggingface.co/production/uploads/6348501e50fe0799927c3667/TMl4VIoTyUzzdbj5PdVEi.png)
|
80 |
+
|
81 |
+
**人手評価**
|
82 |
+
Chatbot Arena的なシステムを使った人手によるブラインドテストの結果
|
83 |
+
![image/png](https://cdn-uploads.huggingface.co/production/uploads/6348501e50fe0799927c3667/RzPOQfETYD9_AFEjVkwCX.png)
|
84 |
+
|