---
language: 
  - jp
tags:
- つくよみちゃん
- StyleBertVITS2
license: "other"
---

# StyleBertVITS2向けの事前学習モデル

[StyleBertVITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります

<!-- TOC -->
* [StyleBertVITS2向けの事前学習モデル](#stylebertvits2向けの事前学習モデル)
  * [学習データセット](#学習データセット)
  * [学習パラメータ](#学習パラメータ)
  * [SpeechMOSによる自然性評価](#speechmosによる自然性評価)
  * [loss](#loss)
* [ライセンス](#ライセンス)
<!-- TOC -->

## 学習データセット
* [つくよみちゃんコーパス│声優統計コーパス（JVSコーパス準拠）](https://tyc.rei-yumesaki.net/material/corpus/) 
* [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001～BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) （夢前黎担当部分を許可を得て使用）

## 学習パラメータ
* 最終ステップ数 : 375k step
* 学習時間 100 ~ 200時間程度
* bfloat16 : false

## 学習済みモデル

学習済みモデルには、pthとsafetensorsの二つをアップロードしています。

pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました

## SpeechMOSによる自然性評価

![](mos_pretraing.png)

## loss

![](image.png)


# ライセンス
ライセンスは、[つくよみちゃんコーパス│声優統計コーパス（JVSコーパス準拠）](https://tyc.rei-yumesaki.net/material/corpus/)に準じます