Spaces:

Flux9665
/

MassivelyMultilingualTTS

Running on T4

Flux9665 commited on Jun 7

Commit

68a11d5

•

1 Parent(s): e016f9c

initial code release

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,13 +1,11 @@
 ---
 title: MassivelyMultilingualTTS
-emoji: 👁
 colorFrom: indigo
 colorTo: purple
 sdk: gradio
-sdk_version: 4.19.2
 app_file: app.py
-pinned: false
 license: mit
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
 title: MassivelyMultilingualTTS
+emoji: 🌍🦜
 colorFrom: indigo
 colorTo: purple
 sdk: gradio
+sdk_version: 4.32.2
 app_file: app.py
+pinned: true
 license: mit
+---

app.py ADDED Viewed

+import os
+import torch
+os.system("git clone --branch v3.1 https://github.com/DigitalPhonetics/IMS-Toucan.git toucan_codebase")
+os.system("mv toucan_codebase/* .")
+from run_model_downloader import download_models
+from run_GUI_demo import TTSWebUI
+download_models()
+TTSWebUI(gpu_id="cuda" if torch.cuda.is_available() else "cpu")

packages.txt ADDED Viewed

+libsndfile1
+espeak-ng
+ffmpeg
+libasound-dev
+libportaudio2

requirements.txt ADDED Viewed

+torch_complex~=0.4.3
+tqdm~=4.64.1
+scipy~=1.9.3
+librosa~=0.9.2
+scikit-learn~=1.1.3
+praat-parselmouth~=0.4.2
+torch~=2.3.0
+numpy~=1.23.4
+torchaudio~=2.3.0
+soundfile~=0.12.0
+pypinyin~=0.47.1
+pyloudnorm~=0.1.0
+numba~=0.56.4
+cvxopt~=1.3.0
+sounddevice~=0.4.5
+matplotlib~=3.6.2
+phonemizer~=3.2.1
+wandb~=0.13.5
+speechbrain~=0.5.13
+dragonmapper~=0.2.6
+auraloss~=0.2.2
+alias_free_torch~=0.0.6
+dotwiz==0.4.0
+transphone==1.5.3
+phonepiece==1.4.2
+geopy==2.4.1
+einops==0.7.0
+torchvision~=0.18.0
+sklearn~=0.0
+datasets~=2.10.1
+pandas~=1.5.0
+rich~=13.4.2
+PyYAML~=6.0
+imageio~=2.34.0
+pykakasi~=2.2.1