Junxiong Wang's picture

2 2 2

Junxiong Wang

JunxiongWang

·

https://www.cs.cornell.edu/~junxiong/

jxiw

AI & ML interests

Attention Free Model / Subquadratic Language Models

Recent Activity

updated a model 5 days ago

JunxiongWang/Llama3.2-Mamba-3B-dpo

updated a model 5 days ago

JunxiongWang/Llama3.2-Mamba-3B-distill

updated a model 5 days ago

JunxiongWang/Llama3.2-Mamba2-3B-distill

View all activity

Organizations

Collections 7

Papers 3

arxiv:2408.15237

arxiv:2401.13660

arxiv:2212.10544

models 36

JunxiongWang/Llama3.2-Mamba-3B-dpo

Updated 5 days ago • 2

JunxiongWang/Llama3.2-Mamba-3B-distill

Updated 5 days ago • 11

JunxiongWang/Llama3.2-Mamba2-3B-distill

Updated 5 days ago • 384

JunxiongWang/Llama3.2-Mamba2-3B-dpo

Updated 5 days ago • 51

JunxiongWang/Llama3.1-Mamba2-8B-dpo

Updated 6 days ago • 8

JunxiongWang/Llama3.1-Mamba-8B-dpo

Updated 6 days ago • 6

JunxiongWang/Llama3.1-Mamba2-8B-distill

Updated 6 days ago • 24

JunxiongWang/Llama3.1-Mamba-8B-distill

Updated 6 days ago • 23

JunxiongWang/MambaByte_Stories

Text Generation • Updated Sep 9 • 19 • 1

JunxiongWang/MambaByte_Arxiv

Text Generation • Updated Sep 9 • 9 • 3

datasets 4

JunxiongWang/sftdatasetv3

Viewer • Updated Oct 7 • 12.4M • 126

JunxiongWang/sftdataset

Viewer • Updated Aug 28 • 11M • 193 • 1

JunxiongWang/llama3-ultrafeedback-armorm

Viewer • Updated Aug 27 • 61.8k • 83 • 1

JunxiongWang/testdataset

Viewer • Updated Jun 23 • 1M • 189