shisa-ai
/

shisa-v1-llama3-70b

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

leonardlin commited on May 26

Commit

d8391e8

•

1 Parent(s): 853e9cb

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -101,7 +101,7 @@ micro_batch_size: 2
 num_epochs: 3
 optimizer: paged_adamw_8bit
 lr_scheduler: linear
-learning_rate: 2e-5
 train_on_inputs: false
 group_by_length: false
@@ -157,7 +157,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 2
 - eval_batch_size: 2
 - seed: 42

 num_epochs: 3
 optimizer: paged_adamw_8bit
 lr_scheduler: linear
+learning_rate: 8e-6
 train_on_inputs: false
 group_by_length: false
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 8e-6
 - train_batch_size: 2
 - eval_batch_size: 2
 - seed: 42