38 32 186

Dongfu Jiang

DongfuJiang

https://jdf-prog.github.io/

AI & ML interests

NLP, common sense reasoning

Recent Activity

upvoted a paper about 5 hours ago

updated a Space about 22 hours ago

TIGER-Lab/GenAI-Arena

updated a model about 23 hours ago

DongfuJiang/prm_version3_subsample_no_ref_hf

Organizations

WildFeedback data demo

models 20

DongfuJiang/prm_version3_subsample_no_ref_hf

Text Generation • Updated about 23 hours ago

DongfuJiang/prm_version3_subsample_hf

Text Generation • Updated 1 day ago • 4

DongfuJiang/prm_version3_full_hf

Updated 1 day ago

DongfuJiang/prm_version2_subsample_no_ref_hf

Text Generation • Updated 3 days ago • 49

DongfuJiang/Qwen2.5-0.5B-Instruct

Text Generation • Updated 4 days ago • 151

DongfuJiang/prm_version2_subsample_hf

Text Generation • Updated 5 days ago • 1.22k

DongfuJiang/prm_version2_hf

Updated 5 days ago

DongfuJiang/PairRM-V2-phi-3-4k-mini-all

Updated Aug 5 • 5

DongfuJiang/vapo_lora_all_data_iter_2

Updated Aug 1 • 6

DongfuJiang/vapo_lora_all_data_iter_1

Updated Jul 31 • 7

datasets 11

DongfuJiang/PRM_SFT

Viewer • Updated 3 days ago • 3.26M • 62

DongfuJiang/PRM_prepared

Viewer • Updated 3 days ago • 25k • 36

DongfuJiang/PRM_train

Viewer • Updated 3 days ago • 25.2k • 104

DongfuJiang/PRM_eval

Viewer • Updated 5 days ago • 3.54k • 18

DongfuJiang/zeroeval

Viewer • Updated 8 days ago • 13.5k • 99

DongfuJiang/MATH-500

Viewer • Updated 15 days ago • 500 • 23

DongfuJiang/simpo_v2_ultrafeedback

Viewer • Updated Aug 2 • 59.9k • 36

DongfuJiang/VAPO

Viewer • Updated Jul 31 • 72.5k • 34

DongfuJiang/PairRM-data

Viewer • Updated Jul 30 • 586k • 33

DongfuJiang/WildFeedback

Viewer • Updated Jul 26 • 26.5k • 34

Dongfu Jiang

AI & ML interests

Recent Activity

Organizations

Papers 10

spaces 2 Sort: Recently updated

VAPO data demo

WildFeedback data demo

models 20 Sort: Recently updated

datasets 11 Sort: Recently updated

spaces 2

models 20

datasets 11