voices
/

VCTK_European_English_Females

Transformers

Inference Endpoints

Model card Files Files and versions Community

jvision commited on May 21, 2023

Commit

c961b37

•

1 Parent(s): 46583ee

cleanup config.json

Browse files

Files changed (1) hide show

config.json +11 -48

config.json CHANGED Viewed

@@ -1,9 +1,6 @@
 {
-    "output_path": "/home/iguana/projects/java/tts-voicetrain/projects/art/output",
     "logger_uri": null,
-    "run_name": "VCTK_European_English_Females",
-    "project_name": "YourTTS",
-    "run_description": "\n            - Original YourTTS trained using VCTK dataset\n        ",
     "print_step": 50,
     "plot_step": 100,
     "model_param_stats": false,
@@ -68,7 +65,6 @@
     "text_cleaner": "multilingual_cleaners",
     "enable_eos_bos_chars": false,
     "test_sentences_file": "",
-    "phoneme_cache_path": "projects/art/phoneme_cache",
     "characters": {
         "characters_class": "TTS.tts.models.vits.VitsCharacters",
         "vocab_dict": null,
@@ -99,42 +95,9 @@
     "datasets": [
         {
             "formatter": "vctk",
-            "dataset_name": "",
-            "path": "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females",
-            "meta_file_train": "",
-            "ignored_speakers": [],
             "language": "en",
-            "phonemizer": "",
-            "meta_file_val": "",
-            "meta_file_attn_mask": ""
         }
     ],
-    "test_sentences": [
-        [
-            "This is an example of a sentence to be synthesized.",
-            "VCTK_p234",
-            null,
-            "en"
-        ],
-        [
-            "This is an example of a sentence to be synthesized.",
-            "VCTK_p238",
-            null,
-            "en"
-        ],
-        [
-            "This is an example of a sentence to be synthesized.",
-            "VCTK_p249",
-            null,
-            "en"
-        ],
-        [
-            "This is an example of a sentence to be synthesized.",
-            "VCTK_p253",
-            null,
-            "en"
-        ]
-    ],
     "eval_split_max_size": 256,
     "eval_split_size": 0.01,
     "use_speaker_weighted_sampler": false,
@@ -214,10 +177,10 @@
         "use_spectral_norm_disriminator": false,
         "use_speaker_embedding": false,
         "num_speakers": 24,
-        "speakers_file": "/home/iguana/projects/java/tts-voicetrain/projects/art/output/VCTK_European_English_Females-May-21-2023_12+41AM-0000000/speakers.pth",
         "d_vector_file": [
-            "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females/supplemental/speakers-base.json",
-            "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females/supplemental/speakers-dataset.pth"
         ],
         "speaker_embedding_channels": 256,
         "use_d_vector_file": true,
@@ -226,10 +189,10 @@
         "use_language_embedding": true,
         "embedded_language_dim": 4,
         "num_languages": 3,
-        "language_ids_file": "/home/iguana/projects/java/tts-voicetrain/projects/art/output/VCTK_European_English_Females-May-21-2023_12+41AM-0000000/language_ids.json",
         "use_speaker_encoder_as_loss": true,
-        "speaker_encoder_config_path": "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females/supplemental/config_se.json",
-        "speaker_encoder_model_path": "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females/supplemental/model_se.pth.tar",
         "condition_dp_on_speaker": true,
         "freeze_encoder": false,
         "freeze_DP": false,
@@ -267,14 +230,14 @@
     "r": 1,
     "num_speakers": 24,
     "use_speaker_embedding": false,
-    "speakers_file": "/home/iguana/projects/java/tts-voicetrain/projects/art/output/VCTK_European_English_Females-May-21-2023_12+41AM-0000000/speakers.pth",
     "speaker_embedding_channels": 256,
-    "language_ids_file": "/home/iguana/projects/java/tts-voicetrain/projects/art/output/VCTK_European_English_Females-May-21-2023_12+41AM-0000000/language_ids.json",
     "use_language_embedding": true,
     "use_d_vector_file": true,
     "d_vector_file": [
-        "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females/supplemental/speakers-base.json",
-        "/home/iguana/projects/java/tts-voicetrain/dataset-library/VCTK_European_English_Females/supplemental/speakers-dataset.pth"
     ],
     "d_vector_dim": 512
 }

 {
     "logger_uri": null,
+    "project_name": "VCTK_European_English_Females", "run_description": "",
     "print_step": 50,
     "plot_step": 100,
     "model_param_stats": false,
     "text_cleaner": "multilingual_cleaners",
     "enable_eos_bos_chars": false,
     "test_sentences_file": "",
     "characters": {
         "characters_class": "TTS.tts.models.vits.VitsCharacters",
         "vocab_dict": null,
     "datasets": [
         {
             "formatter": "vctk",
             "language": "en",
         }
     ],
     "eval_split_max_size": 256,
     "eval_split_size": 0.01,
     "use_speaker_weighted_sampler": false,
         "use_spectral_norm_disriminator": false,
         "use_speaker_embedding": false,
         "num_speakers": 24,
+        "speakers_file": "supplemental/speakers.pth",
         "d_vector_file": [
+            "supplemental/speakers-base.json",
+            "supplemental/speakers-dataset.pth"
         ],
         "speaker_embedding_channels": 256,
         "use_d_vector_file": true,
         "use_language_embedding": true,
         "embedded_language_dim": 4,
         "num_languages": 3,
+        "language_ids_file": "supplemental/language_ids.json",
         "use_speaker_encoder_as_loss": true,
+        "speaker_encoder_config_path": "supplemental/config_se.json",
+        "speaker_encoder_model_path": "supplemental/model_se.pth.tar",
         "condition_dp_on_speaker": true,
         "freeze_encoder": false,
         "freeze_DP": false,
     "r": 1,
     "num_speakers": 24,
     "use_speaker_embedding": false,
+    "speakers_file": "supplemental/speakers.pth",
     "speaker_embedding_channels": 256,
+    "language_ids_file": "supplemental/language_ids.json",
     "use_language_embedding": true,
     "use_d_vector_file": true,
     "d_vector_file": [
+        "supplemental/speakers-base.json",
+        "supplemental/speakers-dataset.pth"
     ],
     "d_vector_dim": 512
 }