Spaces:

RamAnanth1
/

videocrafter

Runtime error

App Files Files Community

RamAnanth1 commited on Apr 6, 2023

Commit

b6320af

•

1 Parent(s): 4997010

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -2

app.py CHANGED Viewed

@@ -29,8 +29,54 @@ model, _, _ = load_model(config, ckpt_path,
                          )
 ddim_sampler = DDIMSampler(model)
-def greet(name):
     return "Hello " + name + "!!"
-iface = gr.Interface(fn=greet, inputs="text", outputs="text")
 iface.launch()

                          )
 ddim_sampler = DDIMSampler(model)
+@torch.no_grad()
+def sample_text2video(model, prompt, n_samples, batch_size,
+                      sample_type="ddim", sampler=None,
+                      ddim_steps=50, eta=1.0, cfg_scale=15.0,
+                      decode_frame_bs=1,
+                      ddp=False, all_gather=True,
+                      batch_progress=True, show_denoising_progress=False,
+                      ):
+    # get cond vector
+    assert(model.cond_stage_model is not None)
+    cond_embd = get_conditions(prompt, model, batch_size)
+    uncond_embd = get_conditions("", model, batch_size) if cfg_scale != 1.0 else None
+    # sample batches
+    all_videos = []
+    n_iter = math.ceil(n_samples / batch_size)
+    iterator  = trange(n_iter, desc="Sampling Batches (text-to-video)") if batch_progress else range(n_iter)
+    for _ in iterator:
+        noise_shape = make_model_input_shape(model, batch_size)
+        samples_latent = sample_denoising_batch(model, noise_shape, cond_embd,
+                                            sample_type=sample_type,
+                                            sampler=sampler,
+                                            ddim_steps=ddim_steps,
+                                            eta=eta,
+                                            unconditional_guidance_scale=cfg_scale,
+                                            uc=uncond_embd,
+                                            denoising_progress=show_denoising_progress,
+                                            )
+        samples = model.decode_first_stage(samples_latent, decode_bs=decode_frame_bs, return_cpu=False)
+        # gather samples from multiple gpus
+        if ddp and all_gather:
+            data_list = gather_data(samples, return_np=False)
+            all_videos.extend([torch_to_np(data) for data in data_list])
+        else:
+            all_videos.append(torch_to_np(samples))
+    all_videos = np.concatenate(all_videos, axis=0)
+    assert(all_videos.shape[0] >= n_samples)
+    return all_videos
+def get_video(prompt):
+    samples = sample_text2video(model, prompt, n_samples = 2, batch_size = 1,
+                          sampler=ddim_sampler,
+                          )
     return "Hello " + name + "!!"
+prompt_inp = gr.Textbox(label = "Prompt")
+iface = gr.Interface(fn=get_video, [prompt_inp], outputs="text")
 iface.launch()