Sirui Zhang's picture

4 12

Sirui Zhang

zsr200901

AI & ML interests

None yet

Organizations

zsr200901's activity

upvoted a paper about 1 month ago

Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate

Paper • 2410.07167 • Published Oct 9 • 37

upvoted a paper 4 months ago

RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models

Paper • 2407.06938 • Published Jul 9 • 21

upvoted 2 papers 8 months ago

When Do We Not Need Larger Vision Models?

Paper • 2403.13043 • Published Mar 19 • 25

Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering

Paper • 2403.09622 • Published Mar 14 • 16