instruction-pretrain
/

InstructLM-500M

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

instruction-pretrain commited on Jun 25

Commit

935d41e

•

1 Parent(s): cd3fa9c

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -26,6 +26,8 @@ We explore supervised multitask pre-training by proposing ***Instruction Pre-Tra
 - Domain-Specific Models Pre-Trained from Llama3-8B:
   - [Finance-Llama3-8B](https://huggingface.co/instruction-pretrain/finance-Llama3-8B)
   - [Biomedicine-Llama3-8B](https://huggingface.co/instruction-pretrain/medicine-Llama3-8B)
 ## General Pre-Training From Scratch
 We augment the [RefinedWeb corproa](https://huggingface.co/datasets/tiiuae/falcon-refinedweb) with instruction-response pairs generated by our [context-based instruction synthesizer](https://huggingface.co/instruction-pretrain/instruction-synthesizer) to pre-train general langauge models from scratch.

 - Domain-Specific Models Pre-Trained from Llama3-8B:
   - [Finance-Llama3-8B](https://huggingface.co/instruction-pretrain/finance-Llama3-8B)
   - [Biomedicine-Llama3-8B](https://huggingface.co/instruction-pretrain/medicine-Llama3-8B)
+- General Instruction-Augmented Corpora: [general-instruction-augmented-corpora](https://huggingface.co/datasets/instruction-pretrain/general-instruction-augmented-corpora)
+- Domain-Specific Instruction-Augmented Corpora (no finance data to avoid ethical issues): [medicine-instruction-augmented-corpora](https://huggingface.co/datasets/instruction-pretrain/medicine-instruction-augmented-corpora)
 ## General Pre-Training From Scratch
 We augment the [RefinedWeb corproa](https://huggingface.co/datasets/tiiuae/falcon-refinedweb) with instruction-response pairs generated by our [context-based instruction synthesizer](https://huggingface.co/instruction-pretrain/instruction-synthesizer) to pre-train general langauge models from scratch.