End of training

Browse files

Files changed (5) hide show

README.md +2 -2
all_results.json +11 -11
eval_results.json +6 -6
train_results.json +6 -6
trainer_state.json +73 -37

README.md CHANGED Viewed

@@ -17,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1200
-- Accuracy: 0.94
 ## Model description

 This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1422
+- Accuracy: 0.945
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 2.88,
-    "eval_accuracy": 0.935,
-    "eval_loss": 0.16219760477542877,
-    "eval_runtime": 1.4297,
-    "eval_samples_per_second": 139.893,
-    "eval_steps_per_second": 4.896,
-    "total_flos": 1.1453639724682445e+17,
-    "train_loss": 0.36294511291715836,
-    "train_runtime": 78.1498,
-    "train_samples_per_second": 61.421,
-    "train_steps_per_second": 0.461
 }

 {
+    "epoch": 4.8,
+    "eval_accuracy": 0.945,
+    "eval_loss": 0.14223907887935638,
+    "eval_runtime": 1.3933,
+    "eval_samples_per_second": 143.541,
+    "eval_steps_per_second": 5.024,
+    "total_flos": 1.9089399541137408e+17,
+    "train_loss": 0.15618273814519246,
+    "train_runtime": 137.8616,
+    "train_samples_per_second": 58.029,
+    "train_steps_per_second": 0.435
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 2.88,
-    "eval_accuracy": 0.935,
-    "eval_loss": 0.16219760477542877,
-    "eval_runtime": 1.4297,
-    "eval_samples_per_second": 139.893,
-    "eval_steps_per_second": 4.896
 }

 {
+    "epoch": 4.8,
+    "eval_accuracy": 0.945,
+    "eval_loss": 0.14223907887935638,
+    "eval_runtime": 1.3933,
+    "eval_samples_per_second": 143.541,
+    "eval_steps_per_second": 5.024
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 2.88,
-    "total_flos": 1.1453639724682445e+17,
-    "train_loss": 0.36294511291715836,
-    "train_runtime": 78.1498,
-    "train_samples_per_second": 61.421,
-    "train_steps_per_second": 0.461
 }

 {
+    "epoch": 4.8,
+    "total_flos": 1.9089399541137408e+17,
+    "train_loss": 0.15618273814519246,
+    "train_runtime": 137.8616,
+    "train_samples_per_second": 58.029,
+    "train_steps_per_second": 0.435
 }

trainer_state.json CHANGED Viewed

@@ -1,73 +1,109 @@
 {
-  "best_metric": 0.935,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-black_widow/checkpoint-36",
-  "epoch": 2.88,
   "eval_steps": 500,
-  "global_step": 36,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.8,
-      "learning_rate": 4.0625000000000005e-05,
-      "loss": 0.6082,
       "step": 10
     },
     {
       "epoch": 0.96,
-      "eval_accuracy": 0.905,
-      "eval_loss": 0.2832430899143219,
-      "eval_runtime": 1.4544,
-      "eval_samples_per_second": 137.514,
-      "eval_steps_per_second": 4.813,
       "step": 12
     },
     {
       "epoch": 1.6,
-      "learning_rate": 2.5e-05,
-      "loss": 0.3152,
       "step": 20
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.93,
-      "eval_loss": 0.17664100229740143,
-      "eval_runtime": 1.322,
-      "eval_samples_per_second": 151.29,
-      "eval_steps_per_second": 5.295,
       "step": 25
     },
     {
       "epoch": 2.4,
-      "learning_rate": 9.375000000000001e-06,
-      "loss": 0.257,
       "step": 30
     },
     {
-      "epoch": 2.88,
-      "eval_accuracy": 0.935,
-      "eval_loss": 0.16219760477542877,
-      "eval_runtime": 1.3254,
-      "eval_samples_per_second": 150.898,
-      "eval_steps_per_second": 5.281,
-      "step": 36
     },
     {
-      "epoch": 2.88,
-      "step": 36,
-      "total_flos": 1.1453639724682445e+17,
-      "train_loss": 0.36294511291715836,
-      "train_runtime": 78.1498,
-      "train_samples_per_second": 61.421,
-      "train_steps_per_second": 0.461
     }
   ],
   "logging_steps": 10,
-  "max_steps": 36,
-  "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 1.1453639724682445e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.945,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-black_widow/checkpoint-25",
+  "epoch": 4.8,
   "eval_steps": 500,
+  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.8,
+      "learning_rate": 4.62962962962963e-05,
+      "loss": 0.1728,
       "step": 10
     },
     {
       "epoch": 0.96,
+      "eval_accuracy": 0.935,
+      "eval_loss": 0.1506199985742569,
+      "eval_runtime": 1.3637,
+      "eval_samples_per_second": 146.66,
+      "eval_steps_per_second": 5.133,
       "step": 12
     },
     {
       "epoch": 1.6,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.1408,
       "step": 20
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.945,
+      "eval_loss": 0.14223907887935638,
+      "eval_runtime": 1.5442,
+      "eval_samples_per_second": 129.518,
+      "eval_steps_per_second": 4.533,
       "step": 25
     },
     {
       "epoch": 2.4,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.1669,
       "step": 30
     },
     {
+      "epoch": 2.96,
+      "eval_accuracy": 0.945,
+      "eval_loss": 0.12894277274608612,
+      "eval_runtime": 1.3472,
+      "eval_samples_per_second": 148.458,
+      "eval_steps_per_second": 5.196,
+      "step": 37
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.1566,
+      "step": 40
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 9.259259259259259e-06,
+      "loss": 0.1618,
+      "step": 50
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.945,
+      "eval_loss": 0.11264882981777191,
+      "eval_runtime": 1.4202,
+      "eval_samples_per_second": 140.823,
+      "eval_steps_per_second": 4.929,
+      "step": 50
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 0.0,
+      "loss": 0.1383,
+      "step": 60
+    },
+    {
+      "epoch": 4.8,
+      "eval_accuracy": 0.94,
+      "eval_loss": 0.12001946568489075,
+      "eval_runtime": 1.3382,
+      "eval_samples_per_second": 149.459,
+      "eval_steps_per_second": 5.231,
+      "step": 60
     },
     {
+      "epoch": 4.8,
+      "step": 60,
+      "total_flos": 1.9089399541137408e+17,
+      "train_loss": 0.15618273814519246,
+      "train_runtime": 137.8616,
+      "train_samples_per_second": 58.029,
+      "train_steps_per_second": 0.435
     }
   ],
   "logging_steps": 10,
+  "max_steps": 60,
+  "num_train_epochs": 5,
   "save_steps": 500,
+  "total_flos": 1.9089399541137408e+17,
   "trial_name": null,
   "trial_params": null
 }