long's picture

1 18 8

long

kevinlong

·

AI & ML interests

None yet

Organizations

None yet

kevinlong's activity

upvoted a paper 9 days ago

MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling

Paper • 2409.16160 • Published 12 days ago • 30

upvoted a paper 13 days ago

Portrait Video Editing Empowered by Multimodal Generative Priors

Paper • 2409.13591 • Published 16 days ago • 15

upvoted a paper 17 days ago

OmniGen: Unified Image Generation

Paper • 2409.11340 • Published 18 days ago • 81

upvoted an article 19 days ago

Article

Design choices for Vision Language Models in 2024

By

•

Apr 16

• 24

upvoted a paper 21 days ago

IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation

Paper • 2409.08240 • Published 23 days ago • 15

upvoted a paper 3 months ago

AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks

Paper • 2403.14468 • Published Mar 21 • 21

upvoted a collection 3 months ago

H2O Danube3

6 items • Updated Jul 16 • 52

upvoted a paper 3 months ago

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

Paper • 2407.09025 • Published Jul 12 • 125

upvoted 2 papers 5 months ago

Hunyuan-DiT: A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding

Paper • 2405.08748 • Published May 14 • 19

DreamTuner: Single Image is Enough for Subject-Driven Generation

Paper • 2312.13691 • Published Dec 21, 2023 • 26

upvoted a paper 6 months ago

Long-form music generation with latent diffusion

Paper • 2404.10301 • Published Apr 16 • 24

upvoted 5 papers 7 months ago

OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on

Paper • 2403.01779 • Published Mar 4 • 27

VisionLLaMA: A Unified LLaMA Interface for Vision Tasks

Paper • 2403.00522 • Published Mar 1 • 44

Humanoid Locomotion as Next Token Prediction

Paper • 2402.19469 • Published Feb 29 • 26

Retrieval-Augmented Generation for Large Language Models: A Survey

Paper • 2312.10997 • Published Dec 18, 2023 • 9

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

Paper • 2402.17177 • Published Feb 27 • 88

upvoted a paper 10 months ago

ImageDream: Image-Prompt Multi-view Diffusion for 3D Generation

Paper • 2312.02201 • Published Dec 2, 2023 • 30

upvoted a paper 12 months ago

MVDream: Multi-view Diffusion for 3D Generation

Paper • 2308.16512 • Published Aug 31, 2023 • 101