VAGOsolutions
/

SauerkrautLM-v2-14b-DPO

Model card Files Files and versions Community

DavidGF commited on 24 days ago

Commit

6db07c0

•

1 Parent(s): b828644

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -76,8 +76,8 @@ This model extends our two-phase SFT model with an additional DPO phase, creatin
 **Dataset Composition for DPO**:
 - Extended previous DPO dataset
-- New SauerkrautLM-Fermented-GER-DPO dataset
-- SauerkrautLM-Fermented-Irrelevance-GER-DPO dataset
 - Carefully balanced to maintain German language capabilities
 ## Released Datasets
@@ -105,6 +105,7 @@ This DPO-enhanced version aims to:
 - Provide valuable training resources to the community
 ## Evaluation
 **AGIEVAL**
 ![SauerkrautLM-v2-14b-DPO-AGIEVAL](https://vago-solutions.ai/wp-content/uploads/2024/11/SauerkrautLM-v2-14b-DPO-AGIEVAL.png "SauerkrautLM-v2-14b-DPO-AGIEVAL")

 **Dataset Composition for DPO**:
 - Extended previous DPO dataset
+- New SauerkrautLM-Fermented-GER-DPO dataset (release soon)
+- SauerkrautLM-Fermented-Irrelevance-GER-DPO dataset (release soon)
 - Carefully balanced to maintain German language capabilities
 ## Released Datasets
 - Provide valuable training resources to the community
 ## Evaluation
+(same diagrams as in SauerkrautLM-v2-14b-SFT model card)
 **AGIEVAL**
 ![SauerkrautLM-v2-14b-DPO-AGIEVAL](https://vago-solutions.ai/wp-content/uploads/2024/11/SauerkrautLM-v2-14b-DPO-AGIEVAL.png "SauerkrautLM-v2-14b-DPO-AGIEVAL")