Spaces:

teticio
/

audio-diffusion

Runtime error

teticio commited on Oct 14, 2022

Commit

399a445

•

1 Parent(s): f15cb42

fix progress bar

Files changed (4) hide show

.gitignore CHANGED Viewed

@@ -10,3 +10,4 @@ lightning_logs
 taming
 checkpoints
 vae_model

 taming
 checkpoints
 vae_model
+latent-audio-diffusion-*

notebooks/test_vae.ipynb CHANGED Viewed

The diff for this file is too large to render. See raw diff

scripts/train_unconditional.py CHANGED Viewed

@@ -48,7 +48,8 @@ def main(args):
         model = DDPMPipeline.from_pretrained(args.from_pretrained).unet
     else:
         model = UNet2DModel(
-            sample_size=args.resolution if args.vae is None else 64,
             in_channels=1 if args.vae is None else 3,
             out_channels=1 if args.vae is None else 3,
             layers_per_block=2,
@@ -211,9 +212,8 @@ def main(args):
                     ema_model.step(model)
                 optimizer.zero_grad()
-            if accelerator.sync_gradients:
-                progress_bar.update(1)
-                global_step += 1
             logs = {
                 "loss": loss.detach().item(),
@@ -304,7 +304,8 @@ if __name__ == "__main__":
     parser.add_argument("--output_dir", type=str, default="ddpm-model-64")
     parser.add_argument("--overwrite_output_dir", type=bool, default=False)
     parser.add_argument("--cache_dir", type=str, default=None)
-    parser.add_argument("--resolution", type=int, default=64)
     parser.add_argument("--train_batch_size", type=int, default=16)
     parser.add_argument("--eval_batch_size", type=int, default=16)
     parser.add_argument("--num_epochs", type=int, default=100)

         model = DDPMPipeline.from_pretrained(args.from_pretrained).unet
     else:
         model = UNet2DModel(
+            sample_size=args.resolution
+            if args.vae is None else args.latent_resolution,
             in_channels=1 if args.vae is None else 3,
             out_channels=1 if args.vae is None else 3,
             layers_per_block=2,
                     ema_model.step(model)
                 optimizer.zero_grad()
+            progress_bar.update(1)
+            global_step += 1
             logs = {
                 "loss": loss.detach().item(),
     parser.add_argument("--output_dir", type=str, default="ddpm-model-64")
     parser.add_argument("--overwrite_output_dir", type=bool, default=False)
     parser.add_argument("--cache_dir", type=str, default=None)
+    parser.add_argument("--resolution", type=int, default=256)
+    parser.add_argument("--latent_resolution", type=int, default=64)
     parser.add_argument("--train_batch_size", type=int, default=16)
     parser.add_argument("--eval_batch_size", type=int, default=16)
     parser.add_argument("--num_epochs", type=int, default=100)

scripts/train_vae.py CHANGED Viewed

@@ -3,7 +3,6 @@
 # convert_original_stable_diffusion_to_diffusers.py
 # TODO
-# add latent resolution as parameter
 # grayscale
 # update README

 # convert_original_stable_diffusion_to_diffusers.py
 # TODO
 # grayscale
 # update README