YukiTomita-CC
/

AKU-d_ms-0.5B-chat-v0.1

Model card Files Files and versions Community

YukiTomita-CC commited on Oct 20

Commit

794d819

•

1 Parent(s): 682bff8

Update README.md

Files changed (1) hide show

README.md +6 -0

README.md CHANGED Viewed

@@ -32,3 +32,9 @@ outputs = model.generate(input_ids, max_new_tokens=128, do_sample=True, top_p=0.
 for output in outputs:
     print(tokenizer.decode(output[input_ids.shape[-1]:], skip_special_tokens=True))
 ```

 for output in outputs:
     print(tokenizer.decode(output[input_ids.shape[-1]:], skip_special_tokens=True))
 ```
+### Notice
+- `messages`は5ターン以下(`len(messages)<=10`)を推奨します。
+  - 理由としては最大5ターンでしか学習していないためで、それ以上続く場合は最新の5ターンをスライスしてください。
+- 学習時にデータを正規化しているため、!と?の半角全角にかなり敏感です。どちらも半角を推奨します。
+- system promptには対応していません。また、userとassistantが交互となることを前提としています。