End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -33,15 +33,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 4
-- eval_batch_size: 4
 - seed: 42
 - gradient_accumulation_steps: 16
-- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
-- num_epochs: 1
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - gradient_accumulation_steps: 16
+- total_train_batch_size: 256
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
+- num_epochs: 2
 ### Training results

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a08d8d2b26c4a0f31282f1250edff61b08247e37bdd01ee7d548f96e58fb388d
 size 557912620

 version https://git-lfs.github.com/spec/v1
+oid sha256:78321fa868fccb392391fa068d71fa651b89d1db01c684308a67393231ff79d1
 size 557912620

runs/Jan08_14-17-54_ae1aa5774ef2/events.out.tfevents.1704723478.ae1aa5774ef2.302.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f2e6597b82e28cab55465c4defc6765c2b6ec6941e81a32dc9bde5f765da91a7
+size 5785

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a28a7c0d7392528cbc05d07c8e9ed8ada6f87f96b2ca60558cf13e2c578d9b4c
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:31a97c4c10f74ea0ccca2a04ecc0f1ba7dba9bd661c7bd36a9a06f9efddd7db7
 size 4664