Evaluation datasets

community

AI & ML interests

None defined yet.

models

None public yet

datasets 72

lighteval/QazUNTv2

Viewer • Updated 2 days ago • 1.82k • 22

lighteval/HAWP

Viewer • Updated 2 days ago • 2.34k • 15

lighteval/MWP-TR

Viewer • Updated 2 days ago • 4.16k • 13

lighteval/MathQA-TR

Viewer • Updated 2 days ago • 19.6k • 14

lighteval/elkarhizketak

Viewer • Updated Oct 8 • 1.63k • 41

lighteval/hellaswag_thai

Viewer • Updated Sep 25 • 25.6k • 69

lighteval/ChineseSquad

Viewer • Updated Aug 3 • 76.4k • 73

lighteval/thaiqa_squad_fixed

Viewer • Updated Aug 1 • 4.07k • 62

lighteval/KenSwQuAD

Viewer • Updated Aug 1 • 7.5k • 58

lighteval/MATH-Hard

Viewer • Updated Jun 12 • 7.26k • 9.29k • 17