Yufan Zhou's picture

2

Yufan Zhou

YfZ

·

AI & ML interests

multimodal generative models

Recent Activity

authored a paper about 2 months ago

Grounded-VideoLLM: Sharpening Fine-grained Temporal Grounding in Video Large Language Models

View all activity

Organizations

YfZ's activity

authored a paper about 2 months ago

Grounded-VideoLLM: Sharpening Fine-grained Temporal Grounding in Video Large Language Models

Paper • 2410.03290 • Published Oct 4 • 6

authored a paper 5 months ago

Toffee: Efficient Million-Scale Dataset Construction for Subject-Driven Text-to-Image Generation

Paper • 2406.09305 • Published Jun 13 • 4

commented a paper 5 months ago

Toffee: Efficient Million-Scale Dataset Construction for Subject-Driven Text-to-Image Generation

Paper • 2406.09305 • Published Jun 13 • 4 •

authored 3 papers 12 months ago

Shifted Diffusion for Text-to-image Generation

Paper • 2211.15388 • Published Nov 24, 2022

Customization Assistant for Text-to-image Generation

Paper • 2312.03045 • Published Dec 5, 2023

LAFITE: Towards Language-Free Training for Text-to-Image Generation

Paper • 2111.13792 • Published Nov 27, 2021

authored 2 papers over 1 year ago

LLaVAR: Enhanced Visual Instruction Tuning for Text-Rich Image Understanding

Paper • 2306.17107 • Published Jun 29, 2023 • 11

Enhancing Detail Preservation for Customized Text-to-Image Generation: A Regularization-Free Approach

Paper • 2305.13579 • Published May 23, 2023 • 3