File size: 179 Bytes
96e482f |
1 2 |
- 關閉自動添加`<s>`,方便產生megatron-deepspeed訓練用檔案
- 指定pad token為`<unk>`,訓練時token數才會正確,以及finetune_t0.py才能正確pack_sample |
96e482f |
1 2 |
- 關閉自動添加`<s>`,方便產生megatron-deepspeed訓練用檔案
- 指定pad token為`<unk>`,訓練時token數才會正確,以及finetune_t0.py才能正確pack_sample |