Style-Bert-VITS2向けの事前学習モデル
Style-Bert-VITS2で使用できる事前学習データになります
学習データセット
- つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)
- みんなで作るJSUTコーパスbasic5000 BASIC5000_0001~BASIC5000_0600 (夢前黎担当部分を許可を得て使用)
学習パラメータ
- 最終ステップ数 : 375k step
- 学習時間 100 ~ 200時間程度
- bfloat16 : false
学習済みモデル
学習済みモデルには、pthとsafetensorsの二つをアップロードしています。
pthからsafetensorsへの変換には、学習したpthファイルから事前学習モデルsafetensorsを作るやつを参考にこちらで改変したものを使用しました
SpeechMOSによる自然性評価
loss
ライセンス
- ライセンスは、つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)に準じます