Tong Wu's picture

7 4

Tong Wu

wutong16

wutong16

AI & ML interests

None yet

Recent Activity

upvoted a paper about 14 hours ago

InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio Interactions

authored a paper 2 days ago

V3Det: Vast Vocabulary Visual Detection Dataset

authored a paper 2 days ago

GPT4Point: A Unified Framework for Point-Language Understanding and Generation

View all activity

Organizations

None yet

wutong16's activity

upvoted a paper about 14 hours ago

InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio Interactions

Paper • 2412.09596 • Published about 24 hours ago • 58

upvoted a paper 3 days ago

FiVA: Fine-grained Visual Attribute Dataset for Text-to-Image Diffusion Models

Paper • 2412.07674 • Published 3 days ago • 19

upvoted a paper 9 days ago

Imagine360: Immersive 360 Video Generation from Perspective Anchor

Paper • 2412.03552 • Published 9 days ago • 26

upvoted a paper about 2 months ago

SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree

Paper • 2410.16268 • Published Oct 21 • 65

upvoted a paper 11 months ago

InternLM-XComposer2: Mastering Free-form Text-Image Composition and Comprehension in Vision-Language Large Model

Paper • 2401.16420 • Published Jan 29 • 55

upvoted 2 papers about 1 year ago

Alpha-CLIP: A CLIP Model Focusing on Wherever You Want

Paper • 2312.03818 • Published Dec 6, 2023 • 32

HyperDreamer: Hyper-Realistic 3D Content Generation and Editing from a Single Image

Paper • 2312.04543 • Published Dec 7, 2023 • 21