aixsatoshi
/

Mixtral-8x7B-ja-Lora-sft-ChatbotArenaJAcalm2

Model card Files Files and versions Community

aixsatoshi commited on Feb 2

Commit

328f0b8

•

1 Parent(s): e3fca71

Update README.md

Files changed (1) hide show

README.md +5 -4

README.md CHANGED Viewed

@@ -4,7 +4,8 @@ license: cc-by-4.0
 Mixtral8X7B Instructの日本語生成を安定させるためのLora実験モデルです。
-注：bf16での使用を想定しています。量子化推論する場合は、bf16で読み込んだ状態でLora適応、またはマージ、その後に量子化してください。
 **目的**
@@ -77,6 +78,6 @@ Loraのみでも日本語コードへのバイアスを一定レベル強める
 **その他**
-過度な日本語出力バイアスはなく、他の言語も出力可能でした。
-context長は4096tokenまでの学習ですが、4k token以上の出力も可能です。
-一定以上の出力後、日本語出力のバイアスが安定するのかもしれないです。

 Mixtral8X7B Instructの日本語生成を安定させるためのLora実験モデルです。
+注：bf16での使用を想定しています。
+量子化推論する場合は、bf16で読み込んだ状態でLora適応、またはマージ、その後に量子化してください。
 **目的**
 **その他**
+他の言語も出力可能でした。
+学習時のcontext長は4096tokenまでですが、4k token以上の出力も可能です。
+一定以上の出力すると、その後のtokenの日本語バイアスが安定するのかもしれないです。