--- language: - jp tags: - つくよみちゃん - StyleBertVITS2 license: "other" --- # StyleBertVITS2向けの事前学習モデル [StyleBertVITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります * [StyleBertVITS2向けの事前学習モデル](#stylebertvits2向けの事前学習モデル) * [学習データセット](#学習データセット) * [学習パラメータ](#学習パラメータ) * [SpeechMOSによる自然性評価](#speechmosによる自然性評価) * [loss](#loss) * [ライセンス](#ライセンス) ## 学習データセット * [つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/) * [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001~BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) (夢前黎担当部分を許可を得て使用) ## 学習パラメータ * 最終ステップ数 : 375k step * 学習時間 100 ~ 200時間程度 * bfloat16 : false ## 学習済みモデル 学習済みモデルには、pthとsafetensorsの二つをアップロードしています。 pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました ## SpeechMOSによる自然性評価 ![](mos_pretraing.png) ## loss ![](image.png) # ライセンス ライセンスは、[つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/)に準じます