YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
Style-Bert-VITS2 小春音アミ(CV: あみたろ)モデル
- あみたろの声素材工房で公開されているコーパス音源を利用して学習した、Style-Bert-VITS2のモデルです(ver 2.5.0で学習)
- スタイルは次の6スタイル: Neutral(デフォルト、平均スタイル)・るんるん・ささやきA(無声ささやき)・ささやきB(有声ささやき)・よふかし・ノーマル
- スタイルの強さに関して敏感なモデルなので、強さは1くらいがよく、大きくしすぎると声が崩壊するので注意ください
注: このモデルはlitagin個人が提供するものであり、あみたろの声素材工房公式・あみたろ様本人によって学習されたモデルではありません。
利用規約
あみたろの声素材工房様の規約 と あみたろのライブ配信音声・利用規約 を全て守らなければなりません。特に、以下の事項を遵守してください(規約を守れば商用非商用問わず利用できます)。
禁止事項
- 年齢制限のある作品・用途への使用
- 新興宗教・政治・マルチ購などに深く関係する作品・用途
- 特定の団体や個人や国家を誹謗中傷する作品・用途
- 生成された音声を、あみたろ本人の声として扱うこと
- 生成された音声を、あみたろ以外の人の声として扱うこと
クレジット表記
生成音声を公開する際は(媒体は問わない)、必ず分かりやすい場所に あみたろの声素材工房 (https://amitaro.net/)
の声を元にした音声モデルを使用していることが分かるようなクレジット表記を記載してください。
クレジット表記例:
Style-BertVITS2モデル: 小春音アミ、あみたろの声素材工房 (https://amitaro.net/)
モデルマージ
モデルマージに関しては、あみたろの声素材工房のよくある質問への回答を遵守してください:
- 本モデルを別モデルとマージできるのは、その別モデル作成の際に学習に使われた声の権利者が許諾している場合に限る
- あみたろの声の特徴が残っている場合(マージの割合が25%以上の場合)は、その利用はあみたろの声素材工房様の規約の範囲内に限定され、そのモデルに関してもこの規約が適応される
学習詳細
- あみたろのコーパス読み上げ音声一覧にて配布されている以下の音声ファイルとそのコーパス文を利用
- ITAコーパス(ノーマル・るんるん・よふかし・ささやきA・ささやきB)
- MANAコーパス(ノーマル・るんるん・よふかし・ささやきA・ささやきB)
- あみたろコーパス(ノーマルスタイルへ使用)
- 合計約2700ファイル2時間半
- バッチサイズ3にて100エポック学習し、比較して良さげな途中の60エポック54kステップのものを使用