aixsatoshi
/

Mixtral-8x7B-ja-Lora-sft-ChatbotArenaJAcalm2

Model card Files Files and versions Community

aixsatoshi commited on Feb 7

Commit

587b5bc

•

1 Parent(s): 170c18b

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -4,9 +4,6 @@ license: cc-by-4.0
 Mixtral8X7B Instructの日本語生成を安定させるためのLoraです。
-注：bf16での使用を想定しています。
-量子化推論する場合は、bf16でモデルを読み込んだ状態でLora適応またはマージ、その後に量子化してください。
 **目的**
 Mixtral-8x7Bは高性能な言語モデルですが、日本語出力に多言語が混入するcode-switchingがよく見られます。
@@ -74,3 +71,6 @@ num_fewshot: 2, batch_size: 1
 **その他**
 Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力も可能です。

 Mixtral8X7B Instructの日本語生成を安定させるためのLoraです。
 **目的**
 Mixtral-8x7Bは高性能な言語モデルですが、日本語出力に多言語が混入するcode-switchingがよく見られます。
 **その他**
 Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力も可能です。
+注：bf16での使用を想定しています。
+量子化推論する場合は、bf16でモデルを読み込んだ状態でLora適応またはマージ、その後に量子化してください。