dwb2023
/

paligemma-cnmc-ft

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

dwb2023 commited on Jul 2

Commit

2a078e2

•

1 Parent(s): c7a83df

dwb2023/paligemma-cnmc-ft

Files changed (2) hide show

README.md +9 -3
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -15,6 +15,8 @@ should probably proofread and complete it, then remove this comment. -->
 # paligemma-cnmc-ft
 This model is a fine-tuned version of [google/paligemma-3b-pt-224](https://huggingface.co/google/paligemma-3b-pt-224) on an unknown dataset.
 ## Model description
@@ -34,18 +36,22 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 4
 - total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- num_epochs: 10
 ### Training results
 ### Framework versions

 # paligemma-cnmc-ft
 This model is a fine-tuned version of [google/paligemma-3b-pt-224](https://huggingface.co/google/paligemma-3b-pt-224) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.3801
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 8
 - total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- num_epochs: 100
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss |
+|:-------------:|:------:|:----:|:---------------:|
+| No log        | 0.9645 | 17   | 0.3739          |
+| No log        | 1.9858 | 35   | 0.3801          |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ffddafc30f333c6cc44705b4f6777821083de030d741348ec255a91149549c47
 size 45258384

 version https://git-lfs.github.com/spec/v1
+oid sha256:335871f214989fe29d3cdb80b7fc5b0603795ec19c4e53f62197909425843705
 size 45258384