sail
/

data-mixture-pile-cc-1b

Text Generation

Inference Endpoints

Model card Files Files and versions Community

SivilTaram commited on Jul 8

Commit

5ed15fa

•

1 Parent(s): a6fce4e

Update README.md

Files changed (1) hide show

README.md +3 -4

README.md CHANGED Viewed

@@ -17,8 +17,7 @@ This is a collection of the language models trained using Pile-CC, each with app
 ## Key Features
 - **Model Size**: 5 separate models trained with different seeds, each with ~1B parameters
-- **Training Data**: Human selection (from The Pile paper) data mixtures on the [RegMix-Data](https://huggingface.co/datasets/sail/regmix-data) dataset
-- **Purpose**: The Human selection is a strong baseline for our method RegMix
 ## Dataset
@@ -42,8 +41,8 @@ You can load any model using the corresponding branch with the Hugging Face Tran
 ```python
 from transformers import AutoModel, AutoTokenizer
-model = AutoModel.from_pretrained("sail/data-mixture-human-1b", revision="seed-1")
-tokenizer = AutoTokenizer.from_pretrained("sail/data-mixture-human-1b", revision="seed-1")
 ```
 ## Data Mixture

 ## Key Features
 - **Model Size**: 5 separate models trained with different seeds, each with ~1B parameters
+- **Training Data**: The pile-cc only data mixture on the [RegMix-Data](https://huggingface.co/datasets/sail/regmix-data) dataset
 ## Dataset
 ```python
 from transformers import AutoModel, AutoTokenizer
+model = AutoModel.from_pretrained("sail/data-mixture-pile-cc-1b", revision="seed-1")
+tokenizer = AutoTokenizer.from_pretrained("sail/data-mixture-pile-cc-1b", revision="seed-1")
 ```
 ## Data Mixture