13 13 6

Weihao Yu

whyu

https://scholar.google.com/citations?user=LYxjt1QAAAAJ

AI & ML interests

Computer Vision, NLP and AI

Recent Activity

New activity 21 days ago

whyu/MM-Vet_Evaluator:Inquiry About Model API for Answer Post-Processing

upvoted an article about 1 month ago

Mamba Out

upvoted a paper about 1 month ago

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

View all activity

Organizations

whyu's activity

New activity in whyu/MM-Vet_Evaluator 21 days ago

Inquiry About Model API for Answer Post-Processing

#4 opened 21 days ago by

victories

upvoted an article about 1 month ago

Article

Mamba Out

•

Oct 18

• 8

upvoted a paper about 1 month ago

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

Paper • 2410.10818 • Published Oct 14 • 14

upvoted 2 papers about 2 months ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7 • 166

Attention Prompting on Image for Large Vision-Language Models

Paper • 2409.17143 • Published Sep 25 • 7

upvoted 2 papers 2 months ago

FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally

Paper • 2409.08270 • Published Sep 12 • 9

Gated Slot Attention for Efficient Linear-Time Sequence Modeling

Paper • 2409.07146 • Published Sep 11 • 19

liked a Space 3 months ago

Running on Zero

🖼

LinFusion SD V1.5

authored a paper 3 months ago

LinFusion: 1 GPU, 1 Minute, 16K Image

Paper • 2409.02097 • Published Sep 3 • 32

commented a paper 3 months ago

LinFusion: 1 GPU, 1 Minute, 16K Image

Paper • 2409.02097 • Published Sep 3 • 32 •

upvoted a paper 3 months ago

LinFusion: 1 GPU, 1 Minute, 16K Image

Paper • 2409.02097 • Published Sep 3 • 32

New activity in whyu/mm-vet-v2 3 months ago

Librarian Bot: Add language metadata for dataset

#1 opened 3 months ago by

librarian-bot

updated 2 datasets 3 months ago

whyu/mm-vet-v2

Viewer • Updated Aug 31 • 517 • 43

whyu/mm-vet

Viewer • Updated Aug 29 • 218 • 273

New activity in whyu/mm-vet 3 months ago

Librarian Bot: Add language metadata for dataset

#3 opened 3 months ago by

librarian-bot

Link dataset to paper

#2 opened 3 months ago by

nielsr

updated a Space 4 months ago

Running

🏆

MM-Vet v2 Evaluator

liked a Space 4 months ago

Running

🏆

MM-Vet v2 Evaluator

commented 2 papers 4 months ago

MM-Vet v2: A Challenging Benchmark to Evaluate Large Multimodal Models for Integrated Capabilities

Paper • 2408.00765 • Published Aug 1 • 12 •

MM-Vet v2: A Challenging Benchmark to Evaluate Large Multimodal Models for Integrated Capabilities

Paper • 2408.00765 • Published Aug 1 • 12 •