YukiTomita-CC commited on
Commit
794d819
1 Parent(s): 682bff8

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -0
README.md CHANGED
@@ -32,3 +32,9 @@ outputs = model.generate(input_ids, max_new_tokens=128, do_sample=True, top_p=0.
32
  for output in outputs:
33
  print(tokenizer.decode(output[input_ids.shape[-1]:], skip_special_tokens=True))
34
  ```
 
 
 
 
 
 
 
32
  for output in outputs:
33
  print(tokenizer.decode(output[input_ids.shape[-1]:], skip_special_tokens=True))
34
  ```
35
+
36
+ ### Notice
37
+ - `messages`は5ターン以下(`len(messages)<=10`)を推奨します。
38
+ - 理由としては最大5ターンでしか学習していないためで、それ以上続く場合は最新の5ターンをスライスしてください。
39
+ - 学習時にデータを正規化しているため、!と?の半角全角にかなり敏感です。どちらも半角を推奨します。
40
+ - system promptには対応していません。また、userとassistantが交互となることを前提としています。