Upload 8 files

Browse files

Files changed (5) hide show

optimizer.pt +1 -1
pytorch_model.bin +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +144 -3

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd5def78fcf35ce8197a0a89b2cddd0d0ab2a7e652f880a0f267e8082c15dcc1
 size 189555589

 version https://git-lfs.github.com/spec/v1
+oid sha256:c59972c95dfd9d8dc8d4fe2c4f4cb7ce5fb39537b0161254edca65df091d549b
 size 189555589

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:213bef9ea1cb8c00dc924977331618ea4ae9823f2d2b164e92ee138a1a71b505
 size 94783376

 version https://git-lfs.github.com/spec/v1
+oid sha256:d20449f5387f2e89e2efd4d20957f6763c7f3da6f64fba387947779cacb8f725
 size 94783376

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:98fe4e41e502c92480c84ccee907b3ce52b631e614a8ed347276406cc29ef887
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f01bdf15074da8661bd2dbcdc6ebeeb9fde104f9841dc471c800d924b1ff1e8
 size 14575

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27fb51ce21283dcc0c99fed0d74cb955b323f5a3c1836121af7be1af641d3763
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:a51857a10a112633f3a3bb87a57dcd7db82d34b311ca38f2a90efd0475a73f59
 size 627

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.87,
   "best_model_checkpoint": "distilhubert-finetuned-gtzan/checkpoint-1356",
-  "epoch": 12.0,
-  "global_step": 1356,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1740,11 +1740,152 @@
       "eval_samples_per_second": 2.675,
       "eval_steps_per_second": 0.348,
       "step": 1356
     }
   ],
   "max_steps": 2260,
   "num_train_epochs": 20,
-  "total_flos": 3.6803929647744e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.87,
   "best_model_checkpoint": "distilhubert-finetuned-gtzan/checkpoint-1356",
+  "epoch": 13.0,
+  "global_step": 1469,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 2.675,
       "eval_steps_per_second": 0.348,
       "step": 1356
+    },
+    {
+      "epoch": 12.04,
+      "learning_rate": 2.227138643067847e-05,
+      "loss": 0.0058,
+      "step": 1360
+    },
+    {
+      "epoch": 12.08,
+      "learning_rate": 2.2148475909537858e-05,
+      "loss": 0.0076,
+      "step": 1365
+    },
+    {
+      "epoch": 12.12,
+      "learning_rate": 2.202556538839725e-05,
+      "loss": 0.0085,
+      "step": 1370
+    },
+    {
+      "epoch": 12.17,
+      "learning_rate": 2.190265486725664e-05,
+      "loss": 0.0068,
+      "step": 1375
+    },
+    {
+      "epoch": 12.21,
+      "learning_rate": 2.177974434611603e-05,
+      "loss": 0.0058,
+      "step": 1380
+    },
+    {
+      "epoch": 12.26,
+      "learning_rate": 2.165683382497542e-05,
+      "loss": 0.0058,
+      "step": 1385
+    },
+    {
+      "epoch": 12.3,
+      "learning_rate": 2.153392330383481e-05,
+      "loss": 0.0059,
+      "step": 1390
+    },
+    {
+      "epoch": 12.35,
+      "learning_rate": 2.14110127826942e-05,
+      "loss": 0.006,
+      "step": 1395
+    },
+    {
+      "epoch": 12.39,
+      "learning_rate": 2.1288102261553592e-05,
+      "loss": 0.0053,
+      "step": 1400
+    },
+    {
+      "epoch": 12.43,
+      "learning_rate": 2.116519174041298e-05,
+      "loss": 0.0064,
+      "step": 1405
+    },
+    {
+      "epoch": 12.48,
+      "learning_rate": 2.104228121927237e-05,
+      "loss": 0.0054,
+      "step": 1410
+    },
+    {
+      "epoch": 12.52,
+      "learning_rate": 2.091937069813176e-05,
+      "loss": 0.0979,
+      "step": 1415
+    },
+    {
+      "epoch": 12.57,
+      "learning_rate": 2.079646017699115e-05,
+      "loss": 0.0052,
+      "step": 1420
+    },
+    {
+      "epoch": 12.61,
+      "learning_rate": 2.0673549655850542e-05,
+      "loss": 0.0049,
+      "step": 1425
+    },
+    {
+      "epoch": 12.65,
+      "learning_rate": 2.055063913470993e-05,
+      "loss": 0.0051,
+      "step": 1430
+    },
+    {
+      "epoch": 12.7,
+      "learning_rate": 2.0427728613569323e-05,
+      "loss": 0.0053,
+      "step": 1435
+    },
+    {
+      "epoch": 12.74,
+      "learning_rate": 2.030481809242871e-05,
+      "loss": 0.0095,
+      "step": 1440
+    },
+    {
+      "epoch": 12.79,
+      "learning_rate": 2.0181907571288103e-05,
+      "loss": 0.005,
+      "step": 1445
+    },
+    {
+      "epoch": 12.83,
+      "learning_rate": 2.0058997050147492e-05,
+      "loss": 0.0048,
+      "step": 1450
+    },
+    {
+      "epoch": 12.88,
+      "learning_rate": 1.9936086529006884e-05,
+      "loss": 0.0045,
+      "step": 1455
+    },
+    {
+      "epoch": 12.92,
+      "learning_rate": 1.9813176007866273e-05,
+      "loss": 0.0048,
+      "step": 1460
+    },
+    {
+      "epoch": 12.96,
+      "learning_rate": 1.9690265486725665e-05,
+      "loss": 0.005,
+      "step": 1465
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.87,
+      "eval_loss": 0.7023229002952576,
+      "eval_runtime": 37.9815,
+      "eval_samples_per_second": 2.633,
+      "eval_steps_per_second": 0.342,
+      "step": 1469
     }
   ],
   "max_steps": 2260,
   "num_train_epochs": 20,
+  "total_flos": 3.9870923785056e+17,
   "trial_name": null,
   "trial_params": null
 }