zhiliang's picture

zhiliang

zzliang

·

pengzhiliang

AI & ML interests

multimodal

Organizations

None yet

zzliang's activity

upvoted an article 7 months ago

Article

Vision Language Models Explained

Apr 11

• 214

upvoted 6 papers 10 months ago

Efficient Exploration for LLMs

Paper • 2402.00396 • Published Feb 1 • 21

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1 • 81

Deconstructing Denoising Diffusion Models for Self-Supervised Learning

Paper • 2401.14404 • Published Jan 25 • 17

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 144

Scalable Pre-training of Large Autoregressive Image Models

Paper • 2401.08541 • Published Jan 16 • 36

Mixtral of Experts

Paper • 2401.04088 • Published Jan 8 • 159

upvoted 4 papers 11 months ago

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

Paper • 2401.02954 • Published Jan 5 • 41

Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision, Language, Audio, and Action

Paper • 2312.17172 • Published Dec 28, 2023 • 26

VideoPoet: A Large Language Model for Zero-Shot Video Generation

Paper • 2312.14125 • Published Dec 21, 2023 • 44

Generative Multimodal Models are In-Context Learners

Paper • 2312.13286 • Published Dec 20, 2023 • 34

upvoted 9 papers about 1 year ago

TEAL: Tokenize and Embed ALL for Multi-modal Large Language Models

Paper • 2311.04589 • Published Nov 8, 2023 • 18

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

Paper • 2310.09199 • Published Oct 13, 2023 • 24

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 96

Aligning Large Multimodal Models with Factually Augmented RLHF

Paper • 2309.14525 • Published Sep 25, 2023 • 30

RMT: Retentive Networks Meet Vision Transformers

Paper • 2309.11523 • Published Sep 20, 2023 • 33

Kosmos-2.5: A Multimodal Literate Model

Paper • 2309.11419 • Published Sep 20, 2023 • 50

Language Modeling Is Compression

Paper • 2309.10668 • Published Sep 19, 2023 • 82

Multimodal Foundation Models: From Specialists to General-Purpose Assistants

Paper • 2309.10020 • Published Sep 18, 2023 • 40

Large Language Models as Optimizers

Paper • 2309.03409 • Published Sep 7, 2023 • 75