Preference Datasets for KTO - a argilla Collection

argilla 's Collections

Open Image Generation Models

Argilla v2.0 compatible datasets

Datasets built with ⚗️ distilabel

DIBT Prompt collective SPIN

Preference Datasets for DPO

Preference Datasets for KTO

Domain Specific Data

Preference Datasets for KTO

updated Jul 30

This collection contains a list of curated preference datasets for KTO fine-tuning for intent alignment of LLMs through signals.

argilla/ultrafeedback-binarized-preferences-cleaned-kto

Viewer • Updated Mar 19 • 231k • 129 • 8

Note KTO transformed version of "argilla/ultrafeedback-binarized-preferences-cleaned".
argilla/distilabel-intel-orca-kto

Viewer • Updated Mar 19 • 23.1k • 37 • 5

Note KTO transformed version of "argilla/distilabel-intel-orca-dpo-pairs"
argilla/distilabel-capybara-kto-15k-binarized

Viewer • Updated Mar 19 • 15.1k • 51 • 4

Note KTO transformed version of "argilla/distilabel-capybara-dpo-7k-binarized".
argilla/kto-mix-15k

Viewer • Updated Apr 19 • 15.3k • 99 • 13

Note KTO transformed version of "argilla/dpo-mix-7k".
KTO: Model Alignment as Prospect Theoretic Optimization

Paper • 2402.01306 • Published Feb 2 • 15