Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2409.12186

Code-specific model series based on Qwen2.5

about 12 hours ago

Running

127

🥸

Qwen2.5-Coder-7B-Instruct
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Qwen/Qwen2.5-Coder-7B

Text Generation • Updated 1 day ago • 27.4k • 47
Qwen/Qwen2.5-Coder-7B-Instruct

Text Generation • Updated 1 day ago • 73.3k • 237

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 144
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20 • 12
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24 • 51
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24 • 45

Papers I want to read

Papers in my to-read list

RLHF Workflow: From Reward Modeling to Online RLHF

Paper • 2405.07863 • Published May 13 • 67
Chameleon: Mixed-Modal Early-Fusion Foundation Models

Paper • 2405.09818 • Published May 16 • 126
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models

Paper • 2405.15574 • Published May 24 • 53
An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 85

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 107
Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 155
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Mistral 7B

Paper • 2310.06825 • Published Oct 10, 2023 • 47

big yay for open the sauce day

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Qwen/Qwen2.5-Coder-1.5B-Instruct-GGUF

Text Generation • Updated Sep 25 • 8.02k • 13
Qwen/Qwen2-0.5B-Instruct-GGUF

Text Generation • Updated Aug 21 • 13.9k • 60

📑Trending Papers - September 9⃣️

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Attention Heads of Large Language Models: A Survey

Paper • 2409.03752 • Published Sep 5 • 87
Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency

Paper • 2409.02634 • Published Sep 4 • 89
OmniGen: Unified Image Generation

Paper • 2409.11340 • Published Sep 17 • 106

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125

LLM Technical Report

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18 • 125
Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement

Paper • 2409.12122 • Published Sep 18 • 1
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

Paper • 2405.04434 • Published May 7 • 13
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5 • 69

Agent Workflow Memory

Paper • 2409.07429 • Published Sep 11 • 27
MVLLaVA: An Intelligent Agent for Unified and Flexible Novel View Synthesis

Paper • 2409.07129 • Published Sep 11 • 6
Paper Copilot: A Self-Evolving and Efficient LLM System for Personalized Academic Assistance

Paper • 2409.04593 • Published Sep 6 • 22
Imagine yourself: Tuning-Free Personalized Image Generation

Paper • 2409.13346 • Published Sep 20 • 67

Law of Vision Representation in MLLMs

Paper • 2408.16357 • Published Aug 29 • 92
CogVLM2: Visual Language Models for Image and Video Understanding

Paper • 2408.16500 • Published Aug 29 • 56
Learning to Move Like Professional Counter-Strike Players

Paper • 2408.13934 • Published Aug 25 • 21
Building and better understanding vision-language models: insights and future directions

Paper • 2408.12637 • Published Aug 22 • 117

Previous
1
2
3
Next

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs