prometheus-eval

university

AI & ML interests

None defined yet.

Organization Card

Community About org cards

We train language models specialized in evaluating other language models and optimize evaluation pipelines!

spaces 1

Running on CPU Upgrade

BiGGen Bench Leaderboard

models 8

prometheus-eval/prometheus-7b-v2.0

Text2Text Generation • Updated Aug 14 • 20.7k • 81

prometheus-eval/prometheus-7b-v2.0-GGUF

Text2Text Generation • Updated Jul 12 • 116 • 4

prometheus-eval/prometheus-8x7b-v2.0

Text2Text Generation • Updated May 3 • 10.7k • 44

prometheus-eval/prometheus-bgb-8x7b-v2.0

Text Generation • Updated Apr 11 • 7.59k • 5

prometheus-eval/prometheus-vision-13b-v1.0

Image-to-Text • Updated Jan 15 • 288 • 11

prometheus-eval/prometheus-vision-7b-v1.0

Image-to-Text • Updated Jan 15 • 53 • 9

prometheus-eval/prometheus-13b-v1.0

Text2Text Generation • Updated Oct 14, 2023 • 4.01k • 127

prometheus-eval/prometheus-7b-v1.0

Text2Text Generation • Updated Oct 14, 2023 • 234 • 30

datasets 10

prometheus-eval/MMQA

Viewer • Updated 3 days ago • 330 • 63 • 3

prometheus-eval/MM-Eval

Viewer • Updated 26 days ago • 11.1k • 174 • 5

prometheus-eval/BiGGen-Bench

Viewer • Updated Oct 16 • 765 • 163 • 11

prometheus-eval/BiGGen-Bench-Results

Viewer • Updated Aug 12 • 76.6k • 277 • 6

prometheus-eval/Preference-Collection

Viewer • Updated May 3 • 200k • 552 • 33

prometheus-eval/Preference-Bench

Viewer • Updated Apr 6 • 2k • 52 • 2

prometheus-eval/Feedback-Bench

Viewer • Updated Apr 6 • 1k • 59 • 4

prometheus-eval/Perception-Bench

Viewer • Updated Jan 15 • 500 • 99 • 4

prometheus-eval/Perception-Collection

Viewer • Updated Jan 15 • 150k • 142 • 8

prometheus-eval/Feedback-Collection

Viewer • Updated Oct 14, 2023 • 100k • 726 • 107