Kaiwen Wang's picture

1

Kaiwen Wang

kaiwenw

https://kaiwenw.github.io/

AI & ML interests

Reinforcement Learning

Organizations

None yet

Papers 3

arxiv:2407.15762

arxiv:2403.05385

arxiv:2302.03201

models

None public yet

datasets 18

kaiwenw/nov2_aft_gpt4o_1.1

Viewer • Updated 1 day ago • 3.59k • 1

kaiwenw/nov2_aft_gpt4o_1.0

Viewer • Updated 1 day ago • 3.38k

kaiwenw/nov2_aft_gpt4o_0.9

Viewer • Updated 1 day ago • 3.05k • 4

kaiwenw/nov2_aft_llama70b_1.1

Viewer • Updated 2 days ago • 3.63k • 5

kaiwenw/nov2_aft_llama70b_1.0

Viewer • Updated 2 days ago • 3.5k • 19

kaiwenw/nov2_aft_llama70b_0.9

Viewer • Updated 2 days ago • 3.37k • 9

kaiwenw/oasst_mini

Viewer • Updated 2 days ago • 200 • 12

kaiwenw/old_aft_data

Viewer • Updated 2 days ago • 3k • 1

kaiwenw/sep19_eft_gpt4o

Viewer • Updated 4 days ago • 6.28k • 21

kaiwenw/oct30_oasst_gpt4o_jft_strict

Viewer • Updated 5 days ago • 3.87k • 6