hyeongjin99
/

vit-base-aihub_model-v2

@@ -1,8 +1,8 @@
 {
-    "epoch": 5.0,
-    "total_flos": 5.757861244520448e+17,
-    "train_loss": 1.4401942888895671,
-    "train_runtime": 84.6609,
-    "train_samples_per_second": 87.762,
-    "train_steps_per_second": 0.177
 }

 {
+    "epoch": 20.0,
+    "total_flos": 2.3031444978081792e+18,
+    "train_loss": 0.5514378428459168,
+    "train_runtime": 353.1964,
+    "train_samples_per_second": 84.146,
+    "train_steps_per_second": 0.17
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 5.0,
-    "total_flos": 5.757861244520448e+17,
-    "train_loss": 1.4401942888895671,
-    "train_runtime": 84.6609,
-    "train_samples_per_second": 87.762,
-    "train_steps_per_second": 0.177
 }

 {
+    "epoch": 20.0,
+    "total_flos": 2.3031444978081792e+18,
+    "train_loss": 0.5514378428459168,
+    "train_runtime": 353.1964,
+    "train_samples_per_second": 84.146,
+    "train_steps_per_second": 0.17
 }

trainer_state.json CHANGED Viewed

@@ -1,91 +1,301 @@
 {
-  "best_metric": 0.8373493975903614,
-  "best_model_checkpoint": "vit-base-aihub_model-v2/checkpoint-9",
-  "epoch": 5.0,
-  "global_step": 15,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6746987951807228,
-      "eval_f1": 0.5943616223134295,
-      "eval_loss": 1.6293878555297852,
-      "eval_precision": 0.6434404116256432,
-      "eval_recall": 0.6238199585809991,
-      "eval_runtime": 6.3604,
-      "eval_samples_per_second": 26.099,
-      "eval_steps_per_second": 0.314,
       "step": 3
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.7530120481927711,
-      "eval_f1": 0.6875213018670031,
-      "eval_loss": 1.4494768381118774,
-      "eval_precision": 0.7775814126820318,
-      "eval_recall": 0.701835255443846,
-      "eval_runtime": 5.6618,
-      "eval_samples_per_second": 29.319,
-      "eval_steps_per_second": 0.353,
       "step": 6
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.8373493975903614,
-      "eval_f1": 0.8021719960125756,
-      "eval_loss": 1.3162782192230225,
-      "eval_precision": 0.8562555276264954,
-      "eval_recall": 0.7993336310123969,
-      "eval_runtime": 5.0768,
-      "eval_samples_per_second": 32.698,
-      "eval_steps_per_second": 0.394,
       "step": 9
     },
     {
       "epoch": 3.33,
-      "learning_rate": 1.923076923076923e-05,
-      "loss": 1.5378,
       "step": 10
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.8373493975903614,
-      "eval_f1": 0.8035411001594577,
-      "eval_loss": 1.232733964920044,
-      "eval_precision": 0.8735820318716042,
-      "eval_recall": 0.7993336310123969,
-      "eval_runtime": 5.2569,
-      "eval_samples_per_second": 31.578,
-      "eval_steps_per_second": 0.38,
       "step": 12
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.8373493975903614,
-      "eval_f1": 0.8036849674785987,
-      "eval_loss": 1.1992783546447754,
-      "eval_precision": 0.8745971666076694,
-      "eval_recall": 0.7993336310123969,
-      "eval_runtime": 5.464,
-      "eval_samples_per_second": 30.381,
-      "eval_steps_per_second": 0.366,
       "step": 15
     },
     {
-      "epoch": 5.0,
-      "step": 15,
-      "total_flos": 5.757861244520448e+17,
-      "train_loss": 1.4401942888895671,
-      "train_runtime": 84.6609,
-      "train_samples_per_second": 87.762,
-      "train_steps_per_second": 0.177
     }
   ],
-  "max_steps": 15,
-  "num_train_epochs": 5,
-  "total_flos": 5.757861244520448e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9759036144578314,
+  "best_model_checkpoint": "vit-base-aihub_model-v2/checkpoint-21",
+  "epoch": 20.0,
+  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.8373493975903614,
+      "eval_f1": 0.8021719960125756,
+      "eval_loss": 1.275346279144287,
+      "eval_precision": 0.8562555276264954,
+      "eval_recall": 0.7993336310123969,
+      "eval_runtime": 5.1244,
+      "eval_samples_per_second": 32.394,
+      "eval_steps_per_second": 0.39,
       "step": 3
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.8674698795180723,
+      "eval_f1": 0.8332850826867517,
+      "eval_loss": 1.12519371509552,
+      "eval_precision": 0.8895164063267512,
+      "eval_recall": 0.8299773699894692,
+      "eval_runtime": 5.8768,
+      "eval_samples_per_second": 28.246,
+      "eval_steps_per_second": 0.34,
       "step": 6
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.8975903614457831,
+      "eval_f1": 0.8759773182856855,
+      "eval_loss": 0.9427085518836975,
+      "eval_precision": 0.9184748178650618,
+      "eval_recall": 0.8695583787053841,
+      "eval_runtime": 5.0377,
+      "eval_samples_per_second": 32.952,
+      "eval_steps_per_second": 0.397,
       "step": 9
     },
     {
       "epoch": 3.33,
+      "learning_rate": 4.62962962962963e-05,
+      "loss": 1.1721,
       "step": 10
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.9397590361445783,
+      "eval_f1": 0.9245832269900981,
+      "eval_loss": 0.7995439171791077,
+      "eval_precision": 0.9474358974358973,
+      "eval_recall": 0.9195160314579552,
+      "eval_runtime": 4.7832,
+      "eval_samples_per_second": 34.705,
+      "eval_steps_per_second": 0.418,
       "step": 12
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.9698795180722891,
+      "eval_f1": 0.9642226698488042,
+      "eval_loss": 0.6819571256637573,
+      "eval_precision": 0.9703703703703704,
+      "eval_recall": 0.9612704174228676,
+      "eval_runtime": 5.722,
+      "eval_samples_per_second": 29.011,
+      "eval_steps_per_second": 0.35,
       "step": 15
     },
     {
+      "epoch": 6.0,
+      "eval_accuracy": 0.963855421686747,
+      "eval_f1": 0.9587309087309088,
+      "eval_loss": 0.5926513671875,
+      "eval_precision": 0.9603174603174603,
+      "eval_recall": 0.9583428398582664,
+      "eval_runtime": 4.9473,
+      "eval_samples_per_second": 33.554,
+      "eval_steps_per_second": 0.404,
+      "step": 18
+    },
+    {
+      "epoch": 6.67,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.7084,
+      "step": 20
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9759036144578314,
+      "eval_f1": 0.9725477910462431,
+      "eval_loss": 0.5238566398620605,
+      "eval_precision": 0.9724551764025448,
+      "eval_recall": 0.9728618961196093,
+      "eval_runtime": 4.8707,
+      "eval_samples_per_second": 34.081,
+      "eval_steps_per_second": 0.411,
+      "step": 21
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9698795180722891,
+      "eval_f1": 0.9664890836717462,
+      "eval_loss": 0.47428616881370544,
+      "eval_precision": 0.9665027954501638,
+      "eval_recall": 0.9671147696828277,
+      "eval_runtime": 5.4877,
+      "eval_samples_per_second": 30.249,
+      "eval_steps_per_second": 0.364,
+      "step": 24
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.9578313253012049,
+      "eval_f1": 0.9543541588175232,
+      "eval_loss": 0.4436134994029999,
+      "eval_precision": 0.9557885097358781,
+      "eval_recall": 0.9556205168092645,
+      "eval_runtime": 5.8287,
+      "eval_samples_per_second": 28.48,
+      "eval_steps_per_second": 0.343,
+      "step": 27
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.4668,
+      "step": 30
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.963855421686747,
+      "eval_f1": 0.9604284776111401,
+      "eval_loss": 0.4069555699825287,
+      "eval_precision": 0.9609609235289817,
+      "eval_recall": 0.9613676432460462,
+      "eval_runtime": 5.1247,
+      "eval_samples_per_second": 32.392,
+      "eval_steps_per_second": 0.39,
+      "step": 30
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.9698795180722891,
+      "eval_f1": 0.9664890836717462,
+      "eval_loss": 0.3817099928855896,
+      "eval_precision": 0.9665027954501638,
+      "eval_recall": 0.9671147696828277,
+      "eval_runtime": 5.2147,
+      "eval_samples_per_second": 31.833,
+      "eval_steps_per_second": 0.384,
+      "step": 33
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.9698795180722891,
+      "eval_f1": 0.9664890836717462,
+      "eval_loss": 0.36248189210891724,
+      "eval_precision": 0.9665027954501638,
+      "eval_recall": 0.9671147696828277,
+      "eval_runtime": 5.5147,
+      "eval_samples_per_second": 30.101,
+      "eval_steps_per_second": 0.363,
+      "step": 36
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.9578313253012049,
+      "eval_f1": 0.9543541588175232,
+      "eval_loss": 0.35361266136169434,
+      "eval_precision": 0.9557885097358781,
+      "eval_recall": 0.9556205168092645,
+      "eval_runtime": 5.2314,
+      "eval_samples_per_second": 31.731,
+      "eval_steps_per_second": 0.382,
+      "step": 39
+    },
+    {
+      "epoch": 13.33,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.3611,
+      "step": 40
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.9578313253012049,
+      "eval_f1": 0.9543541588175232,
+      "eval_loss": 0.338364839553833,
+      "eval_precision": 0.9557885097358781,
+      "eval_recall": 0.9556205168092645,
+      "eval_runtime": 4.9478,
+      "eval_samples_per_second": 33.551,
+      "eval_steps_per_second": 0.404,
+      "step": 42
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.9698795180722891,
+      "eval_f1": 0.9664890836717462,
+      "eval_loss": 0.32493022084236145,
+      "eval_precision": 0.9665027954501638,
+      "eval_recall": 0.9671147696828277,
+      "eval_runtime": 5.2287,
+      "eval_samples_per_second": 31.748,
+      "eval_steps_per_second": 0.383,
+      "step": 45
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.9698795180722891,
+      "eval_f1": 0.9664890836717462,
+      "eval_loss": 0.3163941204547882,
+      "eval_precision": 0.9665027954501638,
+      "eval_recall": 0.9671147696828277,
+      "eval_runtime": 5.5155,
+      "eval_samples_per_second": 30.097,
+      "eval_steps_per_second": 0.363,
+      "step": 48
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 9.259259259259259e-06,
+      "loss": 0.3063,
+      "step": 50
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.963855421686747,
+      "eval_f1": 0.9604284776111401,
+      "eval_loss": 0.3141733705997467,
+      "eval_precision": 0.9609609235289817,
+      "eval_recall": 0.9613676432460462,
+      "eval_runtime": 5.4681,
+      "eval_samples_per_second": 30.358,
+      "eval_steps_per_second": 0.366,
+      "step": 51
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.963855421686747,
+      "eval_f1": 0.9604284776111401,
+      "eval_loss": 0.3122059106826782,
+      "eval_precision": 0.9609609235289817,
+      "eval_recall": 0.9613676432460462,
+      "eval_runtime": 4.8313,
+      "eval_samples_per_second": 34.36,
+      "eval_steps_per_second": 0.414,
+      "step": 54
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.963855421686747,
+      "eval_f1": 0.9604284776111401,
+      "eval_loss": 0.30928835272789,
+      "eval_precision": 0.9609609235289817,
+      "eval_recall": 0.9613676432460462,
+      "eval_runtime": 5.3566,
+      "eval_samples_per_second": 30.99,
+      "eval_steps_per_second": 0.373,
+      "step": 57
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 0.0,
+      "loss": 0.294,
+      "step": 60
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.963855421686747,
+      "eval_f1": 0.9604284776111401,
+      "eval_loss": 0.3075591027736664,
+      "eval_precision": 0.9609609235289817,
+      "eval_recall": 0.9613676432460462,
+      "eval_runtime": 5.6855,
+      "eval_samples_per_second": 29.197,
+      "eval_steps_per_second": 0.352,
+      "step": 60
+    },
+    {
+      "epoch": 20.0,
+      "step": 60,
+      "total_flos": 2.3031444978081792e+18,
+      "train_loss": 0.5514378428459168,
+      "train_runtime": 353.1964,
+      "train_samples_per_second": 84.146,
+      "train_steps_per_second": 0.17
     }
   ],
+  "max_steps": 60,
+  "num_train_epochs": 20,
+  "total_flos": 2.3031444978081792e+18,
   "trial_name": null,
   "trial_params": null
 }