shirwu
/

content

Generated from Trainer

Model card Files Files and versions Community

content / sample_data

1 contributor

History: 1 commit

shirwu's picture

shirwu/dpo-personal-preference-llama3.2-1b-trainer

e0257e3 verified 12 days ago

README.md

962 Bytes

shirwu/dpo-personal-preference-llama3.2-1b-trainer 12 days ago
anscombe.json

1.7 kB

shirwu/dpo-personal-preference-llama3.2-1b-trainer 12 days ago
california_housing_test.csv

301 kB

shirwu/dpo-personal-preference-llama3.2-1b-trainer 12 days ago
california_housing_train.csv

1.71 MB

shirwu/dpo-personal-preference-llama3.2-1b-trainer 12 days ago
mnist_test.csv

18.3 MB
LFS

shirwu/dpo-personal-preference-llama3.2-1b-trainer 12 days ago
mnist_train_small.csv

36.5 MB
LFS

shirwu/dpo-personal-preference-llama3.2-1b-trainer 12 days ago