|
--- |
|
language: |
|
- jp |
|
tags: |
|
- つくよみちゃん |
|
- StyleBertVITS2 |
|
license: "other" |
|
--- |
|
|
|
# Style-Bert-VITS2向けの事前学習モデル |
|
|
|
[Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります |
|
|
|
## 学習データセット |
|
* [つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/) |
|
* [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001~BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) (夢前黎担当部分を許可を得て使用) |
|
|
|
## 学習パラメータ |
|
* 最終ステップ数 : 375k step |
|
* 学習時間 100 ~ 200時間程度 |
|
* bfloat16 : false |
|
|
|
## 学習済みモデル |
|
|
|
学習済みモデルには、pthとsafetensorsの二つをアップロードしています。 |
|
|
|
pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました |
|
|
|
## SpeechMOSによる自然性評価 |
|
|
|
![](mos_pretraing.png) |
|
|
|
## loss |
|
|
|
![](image.png) |
|
|
|
|
|
# ライセンス |
|
* ライセンスは、[つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/)に準じます |