ArashAhmadian
/

rloo_tldr

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ArashAhmadian commited on Jun 9

Commit

849a7e2

•

1 Parent(s): 8a3e7e2

End of training

Files changed (3) hide show

README.md +5 -5
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -30,17 +30,17 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-06
-- train_batch_size: 64
 - eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
 - num_devices: 8
-- total_train_batch_size: 512
 - total_eval_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: constant_with_warmup
-- lr_scheduler_warmup_steps: 150
 - num_epochs: 3.0
 ### Framework versions

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-06
+- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
 - num_devices: 8
+- gradient_accumulation_steps: 16
+- total_train_batch_size: 2048
 - total_eval_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
 - num_epochs: 3.0
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c4194f7ac0bae457bfdd6d172f8eb8c9a9841a86e6e36ea971834380ef7c6691
 size 2023586384

 version https://git-lfs.github.com/spec/v1
+oid sha256:879b3d157fe3ed6c1d47d51603e831ab02be600ef12072d23296b9b936faf10a
 size 2023586384

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:898882942cc73fc20746ab64b411235277dc22dfc0c8704e420bff750f797fa0
 size 6968

 version https://git-lfs.github.com/spec/v1
+oid sha256:1ae5630f8a489ec0177dd3081cf830182ce592dbe870d4cf63eef6e08155620f
 size 6968