End of training

Browse files

Files changed (5) hide show

README.md +5 -3
all_results.json +10 -10
eval_results.json +5 -5
train_results.json +5 -5
trainer_state.json +84 -84

README.md CHANGED Viewed

@@ -5,6 +5,8 @@ license: apache-2.0
 metrics:
 - accuracy
 tags:
 - generated_from_trainer
 model-index:
 - name: only-lora-beans-vit-base-patch16-224-in21k
@@ -16,10 +18,10 @@ should probably proofread and complete it, then remove this comment. -->
 # only-lora-beans-vit-base-patch16-224-in21k
-This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7640
-- Accuracy: 0.6917
 ## Model description

 metrics:
 - accuracy
 tags:
+- image-classification
+- vision
 - generated_from_trainer
 model-index:
 - name: only-lora-beans-vit-base-patch16-224-in21k
 # only-lora-beans-vit-base-patch16-224-in21k
+This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the beans dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5106
+- Accuracy: 0.7970
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 10.0,
-    "eval_accuracy": 0.8045112781954887,
-    "eval_loss": 0.518923282623291,
-    "eval_runtime": 1.1582,
-    "eval_samples_per_second": 114.83,
-    "eval_steps_per_second": 14.677,
-    "total_flos": 8.400578669044531e+17,
-    "train_loss": 0.7230858435997596,
-    "train_runtime": 200.7702,
-    "train_samples_per_second": 51.502,
-    "train_steps_per_second": 6.475
 }

 {
     "epoch": 10.0,
+    "eval_accuracy": 0.7969924812030075,
+    "eval_loss": 0.5105542540550232,
+    "eval_runtime": 1.1639,
+    "eval_samples_per_second": 114.269,
+    "eval_steps_per_second": 14.606,
+    "total_flos": 8.772706474360013e+17,
+    "train_loss": 0.7277990575937124,
+    "train_runtime": 205.3588,
+    "train_samples_per_second": 50.351,
+    "train_steps_per_second": 6.33
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 10.0,
-    "eval_accuracy": 0.8045112781954887,
-    "eval_loss": 0.518923282623291,
-    "eval_runtime": 1.1582,
-    "eval_samples_per_second": 114.83,
-    "eval_steps_per_second": 14.677
 }

 {
     "epoch": 10.0,
+    "eval_accuracy": 0.7969924812030075,
+    "eval_loss": 0.5105542540550232,
+    "eval_runtime": 1.1639,
+    "eval_samples_per_second": 114.269,
+    "eval_steps_per_second": 14.606
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 10.0,
-    "total_flos": 8.400578669044531e+17,
-    "train_loss": 0.7230858435997596,
-    "train_runtime": 200.7702,
-    "train_samples_per_second": 51.502,
-    "train_steps_per_second": 6.475
 }

 {
     "epoch": 10.0,
+    "total_flos": 8.772706474360013e+17,
+    "train_loss": 0.7277990575937124,
+    "train_runtime": 205.3588,
+    "train_samples_per_second": 50.351,
+    "train_steps_per_second": 6.33
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.518923282623291,
-  "best_model_checkpoint": "./beans_outputs/checkpoint-1300",
   "epoch": 10.0,
   "eval_steps": 500,
   "global_step": 1300,
@@ -10,193 +10,193 @@
   "log_history": [
     {
       "epoch": 0.7692307692307693,
-      "grad_norm": 5.921261310577393,
       "learning_rate": 5e-05,
-      "loss": 1.1031,
       "step": 100
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5037593984962406,
-      "eval_loss": 1.031303882598877,
-      "eval_runtime": 1.1329,
-      "eval_samples_per_second": 117.399,
-      "eval_steps_per_second": 15.006,
       "step": 130
     },
     {
       "epoch": 1.5384615384615383,
-      "grad_norm": 2.5376038551330566,
       "learning_rate": 5e-05,
-      "loss": 1.0087,
       "step": 200
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.5789473684210527,
-      "eval_loss": 0.9253108501434326,
-      "eval_runtime": 0.9794,
-      "eval_samples_per_second": 135.804,
-      "eval_steps_per_second": 17.358,
       "step": 260
     },
     {
       "epoch": 2.3076923076923075,
-      "grad_norm": 4.594298839569092,
       "learning_rate": 5e-05,
-      "loss": 0.8781,
       "step": 300
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.6616541353383458,
-      "eval_loss": 0.8822579979896545,
-      "eval_runtime": 0.9528,
-      "eval_samples_per_second": 139.584,
-      "eval_steps_per_second": 17.842,
       "step": 390
     },
     {
       "epoch": 3.076923076923077,
-      "grad_norm": 9.547410011291504,
       "learning_rate": 5e-05,
-      "loss": 0.7773,
       "step": 400
     },
     {
       "epoch": 3.8461538461538463,
-      "grad_norm": 2.8391215801239014,
       "learning_rate": 5e-05,
-      "loss": 0.7127,
       "step": 500
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.706766917293233,
-      "eval_loss": 0.6853336691856384,
-      "eval_runtime": 1.1565,
-      "eval_samples_per_second": 114.999,
-      "eval_steps_per_second": 14.699,
       "step": 520
     },
     {
       "epoch": 4.615384615384615,
-      "grad_norm": 4.75039005279541,
       "learning_rate": 5e-05,
-      "loss": 0.6784,
       "step": 600
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.7142857142857143,
-      "eval_loss": 0.7131139039993286,
-      "eval_runtime": 1.1416,
-      "eval_samples_per_second": 116.5,
-      "eval_steps_per_second": 14.891,
       "step": 650
     },
     {
       "epoch": 5.384615384615385,
-      "grad_norm": 6.33519983291626,
       "learning_rate": 5e-05,
-      "loss": 0.6864,
       "step": 700
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.6992481203007519,
-      "eval_loss": 0.7313814759254456,
-      "eval_runtime": 1.0995,
-      "eval_samples_per_second": 120.962,
-      "eval_steps_per_second": 15.461,
       "step": 780
     },
     {
       "epoch": 6.153846153846154,
-      "grad_norm": 5.234774589538574,
       "learning_rate": 5e-05,
-      "loss": 0.6133,
       "step": 800
     },
     {
       "epoch": 6.923076923076923,
-      "grad_norm": 17.76725196838379,
       "learning_rate": 5e-05,
-      "loss": 0.5986,
       "step": 900
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 0.7218045112781954,
-      "eval_loss": 0.6223586201667786,
-      "eval_runtime": 0.9687,
-      "eval_samples_per_second": 137.298,
-      "eval_steps_per_second": 17.549,
       "step": 910
     },
     {
       "epoch": 7.6923076923076925,
-      "grad_norm": 4.8591203689575195,
       "learning_rate": 5e-05,
-      "loss": 0.5956,
       "step": 1000
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.7744360902255639,
-      "eval_loss": 0.526090145111084,
-      "eval_runtime": 1.1771,
-      "eval_samples_per_second": 112.993,
-      "eval_steps_per_second": 14.443,
       "step": 1040
     },
     {
       "epoch": 8.461538461538462,
-      "grad_norm": 8.905884742736816,
       "learning_rate": 5e-05,
-      "loss": 0.6009,
       "step": 1100
     },
     {
       "epoch": 9.0,
-      "eval_accuracy": 0.8120300751879699,
-      "eval_loss": 0.5274345874786377,
-      "eval_runtime": 1.0432,
-      "eval_samples_per_second": 127.497,
-      "eval_steps_per_second": 16.297,
       "step": 1170
     },
     {
       "epoch": 9.23076923076923,
-      "grad_norm": 7.226690292358398,
       "learning_rate": 5e-05,
-      "loss": 0.6035,
       "step": 1200
     },
     {
       "epoch": 10.0,
-      "grad_norm": 51.65995407104492,
       "learning_rate": 5e-05,
-      "loss": 0.5433,
       "step": 1300
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.8045112781954887,
-      "eval_loss": 0.518923282623291,
-      "eval_runtime": 1.0446,
-      "eval_samples_per_second": 127.324,
-      "eval_steps_per_second": 16.275,
       "step": 1300
     },
     {
       "epoch": 10.0,
       "step": 1300,
-      "total_flos": 8.400578669044531e+17,
-      "train_loss": 0.7230858435997596,
-      "train_runtime": 200.7702,
-      "train_samples_per_second": 51.502,
-      "train_steps_per_second": 6.475
     }
   ],
   "logging_steps": 100,
@@ -216,7 +216,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 8.400578669044531e+17,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.5105542540550232,
+  "best_model_checkpoint": "./beans_outputs/checkpoint-1170",
   "epoch": 10.0,
   "eval_steps": 500,
   "global_step": 1300,
   "log_history": [
     {
       "epoch": 0.7692307692307693,
+      "grad_norm": 7.213888168334961,
       "learning_rate": 5e-05,
+      "loss": 1.094,
       "step": 100
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.518796992481203,
+      "eval_loss": 1.0090891122817993,
+      "eval_runtime": 1.1391,
+      "eval_samples_per_second": 116.756,
+      "eval_steps_per_second": 14.924,
       "step": 130
     },
     {
       "epoch": 1.5384615384615383,
+      "grad_norm": 2.6927850246429443,
       "learning_rate": 5e-05,
+      "loss": 1.0,
       "step": 200
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.6090225563909775,
+      "eval_loss": 0.880857527256012,
+      "eval_runtime": 1.158,
+      "eval_samples_per_second": 114.856,
+      "eval_steps_per_second": 14.681,
       "step": 260
     },
     {
       "epoch": 2.3076923076923075,
+      "grad_norm": 6.594575881958008,
       "learning_rate": 5e-05,
+      "loss": 0.8928,
       "step": 300
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.6390977443609023,
+      "eval_loss": 0.8694148063659668,
+      "eval_runtime": 1.1236,
+      "eval_samples_per_second": 118.367,
+      "eval_steps_per_second": 15.13,
       "step": 390
     },
     {
       "epoch": 3.076923076923077,
+      "grad_norm": 7.34794807434082,
       "learning_rate": 5e-05,
+      "loss": 0.7855,
       "step": 400
     },
     {
       "epoch": 3.8461538461538463,
+      "grad_norm": 4.2354817390441895,
       "learning_rate": 5e-05,
+      "loss": 0.7179,
       "step": 500
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.7142857142857143,
+      "eval_loss": 0.6974284052848816,
+      "eval_runtime": 1.1571,
+      "eval_samples_per_second": 114.947,
+      "eval_steps_per_second": 14.692,
       "step": 520
     },
     {
       "epoch": 4.615384615384615,
+      "grad_norm": 5.142866611480713,
       "learning_rate": 5e-05,
+      "loss": 0.6783,
       "step": 600
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.7518796992481203,
+      "eval_loss": 0.669804573059082,
+      "eval_runtime": 1.0102,
+      "eval_samples_per_second": 131.662,
+      "eval_steps_per_second": 16.829,
       "step": 650
     },
     {
       "epoch": 5.384615384615385,
+      "grad_norm": 6.277930736541748,
       "learning_rate": 5e-05,
+      "loss": 0.7052,
       "step": 700
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.7518796992481203,
+      "eval_loss": 0.6211526989936829,
+      "eval_runtime": 1.1627,
+      "eval_samples_per_second": 114.39,
+      "eval_steps_per_second": 14.621,
       "step": 780
     },
     {
       "epoch": 6.153846153846154,
+      "grad_norm": 7.9038262367248535,
       "learning_rate": 5e-05,
+      "loss": 0.636,
       "step": 800
     },
     {
       "epoch": 6.923076923076923,
+      "grad_norm": 15.989542007446289,
       "learning_rate": 5e-05,
+      "loss": 0.608,
       "step": 900
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.706766917293233,
+      "eval_loss": 0.7636638283729553,
+      "eval_runtime": 1.1935,
+      "eval_samples_per_second": 111.438,
+      "eval_steps_per_second": 14.244,
       "step": 910
     },
     {
       "epoch": 7.6923076923076925,
+      "grad_norm": 5.844383716583252,
       "learning_rate": 5e-05,
+      "loss": 0.6457,
       "step": 1000
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.8195488721804511,
+      "eval_loss": 0.5296058654785156,
+      "eval_runtime": 1.1689,
+      "eval_samples_per_second": 113.785,
+      "eval_steps_per_second": 14.544,
       "step": 1040
     },
     {
       "epoch": 8.461538461538462,
+      "grad_norm": 21.204557418823242,
       "learning_rate": 5e-05,
+      "loss": 0.5747,
       "step": 1100
     },
     {
       "epoch": 9.0,
+      "eval_accuracy": 0.7969924812030075,
+      "eval_loss": 0.5105542540550232,
+      "eval_runtime": 1.037,
+      "eval_samples_per_second": 128.258,
+      "eval_steps_per_second": 16.394,
       "step": 1170
     },
     {
       "epoch": 9.23076923076923,
+      "grad_norm": 15.454485893249512,
       "learning_rate": 5e-05,
+      "loss": 0.5939,
       "step": 1200
     },
     {
       "epoch": 10.0,
+      "grad_norm": 12.411216735839844,
       "learning_rate": 5e-05,
+      "loss": 0.5294,
       "step": 1300
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.6917293233082706,
+      "eval_loss": 0.7639761567115784,
+      "eval_runtime": 1.0303,
+      "eval_samples_per_second": 129.085,
+      "eval_steps_per_second": 16.5,
       "step": 1300
     },
     {
       "epoch": 10.0,
       "step": 1300,
+      "total_flos": 8.772706474360013e+17,
+      "train_loss": 0.7277990575937124,
+      "train_runtime": 205.3588,
+      "train_samples_per_second": 50.351,
+      "train_steps_per_second": 6.33
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 8.772706474360013e+17,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null