YukiTomita-CC
commited on
Commit
•
794d819
1
Parent(s):
682bff8
Update README.md
Browse files
README.md
CHANGED
@@ -32,3 +32,9 @@ outputs = model.generate(input_ids, max_new_tokens=128, do_sample=True, top_p=0.
|
|
32 |
for output in outputs:
|
33 |
print(tokenizer.decode(output[input_ids.shape[-1]:], skip_special_tokens=True))
|
34 |
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
32 |
for output in outputs:
|
33 |
print(tokenizer.decode(output[input_ids.shape[-1]:], skip_special_tokens=True))
|
34 |
```
|
35 |
+
|
36 |
+
### Notice
|
37 |
+
- `messages`は5ターン以下(`len(messages)<=10`)を推奨します。
|
38 |
+
- 理由としては最大5ターンでしか学習していないためで、それ以上続く場合は最新の5ターンをスライスしてください。
|
39 |
+
- 学習時にデータを正規化しているため、!と?の半角全角にかなり敏感です。どちらも半角を推奨します。
|
40 |
+
- system promptには対応していません。また、userとassistantが交互となることを前提としています。
|