Training in progress, step 100

Browse files

Files changed (10) hide show

all_results.json +15 -15
eval_results.json +6 -6
pytorch_model.bin +1 -1
runs/May13_08-53-35_node1/events.out.tfevents.1652403398.node1.2643622.2 +3 -0
runs/May13_09-01-04_node1/1652403708.8985012/events.out.tfevents.1652403708.node1.2647054.1 +3 -0
runs/May13_09-01-04_node1/events.out.tfevents.1652403708.node1.2647054.0 +3 -0
test_results.json +6 -6
train_results.json +5 -5
trainer_state.json +28 -337
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,18 +1,18 @@
 {
-    "epoch": 20.0,
-    "eval_accuracy": 80.30581039755351,
-    "eval_average_metrics": 80.30581039755351,
-    "eval_loss": 0.19154316186904907,
-    "eval_runtime": 17.148,
-    "eval_samples_per_second": 95.346,
-    "test_accuracy": 79.7553516819572,
-    "test_average_metrics": 79.7553516819572,
-    "test_loss": 0.195680171251297,
-    "test_runtime": 16.947,
-    "test_samples_per_second": 96.477,
-    "train_loss": 0.20100380073159427,
-    "train_runtime": 3071.6757,
     "train_samples": 9427,
-    "train_samples_per_second": 61.38,
-    "train_steps_per_second": 1.921
 }

 {
+    "epoch": 1.0,
+    "eval_accuracy": 76.75840978593273,
+    "eval_average_metrics": 76.75840978593273,
+    "eval_loss": 0.20979416370391846,
+    "eval_runtime": 6.9844,
+    "eval_samples_per_second": 234.094,
+    "test_accuracy": 75.77981651376146,
+    "test_average_metrics": 75.77981651376146,
+    "test_loss": 0.21779079735279083,
+    "test_runtime": 7.071,
+    "test_samples_per_second": 231.226,
+    "train_loss": 0.6385218733448094,
+    "train_runtime": 73.7325,
     "train_samples": 9427,
+    "train_samples_per_second": 127.854,
+    "train_steps_per_second": 4.001
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 20.0,
-    "eval_accuracy": 80.30581039755351,
-    "eval_average_metrics": 80.30581039755351,
-    "eval_loss": 0.19154316186904907,
-    "eval_runtime": 17.148,
-    "eval_samples_per_second": 95.346
 }

 {
+    "epoch": 1.0,
+    "eval_accuracy": 76.75840978593273,
+    "eval_average_metrics": 76.75840978593273,
+    "eval_loss": 0.20979416370391846,
+    "eval_runtime": 6.9844,
+    "eval_samples_per_second": 234.094
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d01703b0e5945e998181595a54904d84f19c30fcde9c48bd6d3311f9cd8babf
 size 2602117

 version https://git-lfs.github.com/spec/v1
+oid sha256:9bf941da0becc1082c240f9292c525d37e4bf345ae4c3a4ed24e85b953d86370
 size 2602117

runs/May13_08-53-35_node1/events.out.tfevents.1652403398.node1.2643622.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b7cd2ff90e199bc10c9439ec248e4178f8bbf99e124fff5289c104c37d70841
+size 684

runs/May13_09-01-04_node1/1652403708.8985012/events.out.tfevents.1652403708.node1.2647054.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b398091cc1ada54c78722afbd7f57ba9e99d70b811605b3054363edc7e3be973
+size 5392

runs/May13_09-01-04_node1/events.out.tfevents.1652403708.node1.2647054.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:467422c02e850a86481450e8b4475f3293c05f36cd2c14c38237c35f6d3dc0a6
+size 4720

test_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 20.0,
-    "test_accuracy": 79.7553516819572,
-    "test_average_metrics": 79.7553516819572,
-    "test_loss": 0.195680171251297,
-    "test_runtime": 16.947,
-    "test_samples_per_second": 96.477
 }

 {
+    "epoch": 1.0,
+    "test_accuracy": 75.77981651376146,
+    "test_average_metrics": 75.77981651376146,
+    "test_loss": 0.21779079735279083,
+    "test_runtime": 7.071,
+    "test_samples_per_second": 231.226
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 20.0,
-    "train_loss": 0.20100380073159427,
-    "train_runtime": 3071.6757,
     "train_samples": 9427,
-    "train_samples_per_second": 61.38,
-    "train_steps_per_second": 1.921
 }

 {
+    "epoch": 1.0,
+    "train_loss": 0.6385218733448094,
+    "train_runtime": 73.7325,
     "train_samples": 9427,
+    "train_samples_per_second": 127.854,
+    "train_steps_per_second": 4.001
 }

trainer_state.json CHANGED Viewed

@@ -1,352 +1,43 @@
 {
-  "best_metric": 80.30581039755351,
-  "best_model_checkpoint": "outputs/bitfit/t5-base/superglue-boolq/checkpoint-2600",
-  "epoch": 20.0,
-  "global_step": 5900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.68,
-      "eval_accuracy": 74.6788990825688,
-      "eval_average_metrics": 74.6788990825688,
-      "eval_loss": 0.21743574738502502,
-      "eval_runtime": 16.9831,
-      "eval_samples_per_second": 96.272,
-      "step": 200
-    },
-    {
-      "epoch": 1.36,
-      "eval_accuracy": 75.71865443425077,
-      "eval_average_metrics": 75.71865443425077,
-      "eval_loss": 0.21506452560424805,
-      "eval_runtime": 14.6109,
-      "eval_samples_per_second": 111.903,
-      "step": 400
-    },
-    {
-      "epoch": 1.69,
-      "learning_rate": 0.00027457627118644066,
-      "loss": 0.374,
-      "step": 500
-    },
-    {
-      "epoch": 2.03,
-      "eval_accuracy": 77.18654434250764,
-      "eval_average_metrics": 77.18654434250764,
-      "eval_loss": 0.20255930721759796,
-      "eval_runtime": 17.1645,
-      "eval_samples_per_second": 95.254,
-      "step": 600
-    },
-    {
-      "epoch": 2.71,
-      "eval_accuracy": 76.5137614678899,
-      "eval_average_metrics": 76.5137614678899,
-      "eval_loss": 0.220754012465477,
-      "eval_runtime": 17.1929,
-      "eval_samples_per_second": 95.097,
-      "step": 800
-    },
-    {
-      "epoch": 3.39,
-      "learning_rate": 0.00024915254237288135,
-      "loss": 0.2114,
-      "step": 1000
-    },
-    {
-      "epoch": 3.39,
-      "eval_accuracy": 78.1651376146789,
-      "eval_average_metrics": 78.1651376146789,
-      "eval_loss": 0.19822736084461212,
-      "eval_runtime": 14.5865,
-      "eval_samples_per_second": 112.09,
-      "step": 1000
-    },
-    {
-      "epoch": 4.07,
-      "eval_accuracy": 78.71559633027523,
-      "eval_average_metrics": 78.71559633027523,
-      "eval_loss": 0.19769148528575897,
-      "eval_runtime": 17.1866,
-      "eval_samples_per_second": 95.132,
-      "step": 1200
-    },
-    {
-      "epoch": 4.75,
-      "eval_accuracy": 78.2262996941896,
-      "eval_average_metrics": 78.2262996941896,
-      "eval_loss": 0.1974276602268219,
-      "eval_runtime": 17.1722,
-      "eval_samples_per_second": 95.212,
-      "step": 1400
-    },
-    {
-      "epoch": 5.08,
-      "learning_rate": 0.000223728813559322,
-      "loss": 0.1997,
-      "step": 1500
-    },
-    {
-      "epoch": 5.42,
-      "eval_accuracy": 78.71559633027523,
-      "eval_average_metrics": 78.71559633027523,
-      "eval_loss": 0.19954562187194824,
-      "eval_runtime": 14.5679,
-      "eval_samples_per_second": 112.233,
-      "step": 1600
-    },
-    {
-      "epoch": 6.1,
-      "eval_accuracy": 78.2262996941896,
-      "eval_average_metrics": 78.2262996941896,
-      "eval_loss": 0.20299072563648224,
-      "eval_runtime": 17.2624,
-      "eval_samples_per_second": 94.714,
-      "step": 1800
-    },
-    {
-      "epoch": 6.78,
-      "learning_rate": 0.0001983050847457627,
-      "loss": 0.1934,
-      "step": 2000
-    },
-    {
-      "epoch": 6.78,
-      "eval_accuracy": 79.63302752293579,
-      "eval_average_metrics": 79.63302752293579,
-      "eval_loss": 0.19578830897808075,
-      "eval_runtime": 17.2808,
-      "eval_samples_per_second": 94.614,
-      "step": 2000
-    },
-    {
-      "epoch": 7.46,
-      "eval_accuracy": 79.26605504587157,
-      "eval_average_metrics": 79.26605504587157,
-      "eval_loss": 0.1937599629163742,
-      "eval_runtime": 15.3794,
-      "eval_samples_per_second": 106.311,
-      "step": 2200
-    },
-    {
-      "epoch": 8.14,
-      "eval_accuracy": 77.92048929663609,
-      "eval_average_metrics": 77.92048929663609,
-      "eval_loss": 0.2019716054201126,
-      "eval_runtime": 17.5057,
-      "eval_samples_per_second": 93.398,
-      "step": 2400
-    },
-    {
-      "epoch": 8.47,
-      "learning_rate": 0.0001728813559322034,
-      "loss": 0.1907,
-      "step": 2500
-    },
-    {
-      "epoch": 8.81,
-      "eval_accuracy": 80.30581039755351,
-      "eval_average_metrics": 80.30581039755351,
-      "eval_loss": 0.19154316186904907,
-      "eval_runtime": 17.3782,
-      "eval_samples_per_second": 94.083,
-      "step": 2600
-    },
-    {
-      "epoch": 9.49,
-      "eval_accuracy": 79.93883792048929,
-      "eval_average_metrics": 79.93883792048929,
-      "eval_loss": 0.19677455723285675,
-      "eval_runtime": 15.9661,
-      "eval_samples_per_second": 102.404,
-      "step": 2800
-    },
-    {
-      "epoch": 10.17,
-      "learning_rate": 0.00014745762711864405,
-      "loss": 0.183,
-      "step": 3000
     },
     {
-      "epoch": 10.17,
-      "eval_accuracy": 79.44954128440367,
-      "eval_average_metrics": 79.44954128440367,
-      "eval_loss": 0.19117017090320587,
-      "eval_runtime": 17.2749,
-      "eval_samples_per_second": 94.646,
-      "step": 3000
-    },
-    {
-      "epoch": 10.85,
-      "eval_accuracy": 78.10397553516819,
-      "eval_average_metrics": 78.10397553516819,
-      "eval_loss": 0.20411182940006256,
-      "eval_runtime": 17.1181,
-      "eval_samples_per_second": 95.513,
-      "step": 3200
-    },
-    {
-      "epoch": 11.53,
-      "eval_accuracy": 79.02140672782875,
-      "eval_average_metrics": 79.02140672782875,
-      "eval_loss": 0.194900244474411,
-      "eval_runtime": 17.1955,
-      "eval_samples_per_second": 95.083,
-      "step": 3400
-    },
-    {
-      "epoch": 11.86,
-      "learning_rate": 0.00012203389830508474,
-      "loss": 0.181,
-      "step": 3500
-    },
-    {
-      "epoch": 12.2,
-      "eval_accuracy": 79.38837920489297,
-      "eval_average_metrics": 79.38837920489297,
-      "eval_loss": 0.20091596245765686,
-      "eval_runtime": 16.9905,
-      "eval_samples_per_second": 96.23,
-      "step": 3600
-    },
-    {
-      "epoch": 12.88,
-      "eval_accuracy": 79.81651376146789,
-      "eval_average_metrics": 79.81651376146789,
-      "eval_loss": 0.18894420564174652,
-      "eval_runtime": 17.2706,
-      "eval_samples_per_second": 94.669,
-      "step": 3800
-    },
-    {
-      "epoch": 13.56,
-      "learning_rate": 9.661016949152541e-05,
-      "loss": 0.1786,
-      "step": 4000
-    },
-    {
-      "epoch": 13.56,
-      "eval_accuracy": 78.77675840978593,
-      "eval_average_metrics": 78.77675840978593,
-      "eval_loss": 0.20160046219825745,
-      "eval_runtime": 17.0941,
-      "eval_samples_per_second": 95.647,
-      "step": 4000
-    },
-    {
-      "epoch": 14.24,
-      "eval_accuracy": 79.57186544342507,
-      "eval_average_metrics": 79.57186544342507,
-      "eval_loss": 0.19864365458488464,
-      "eval_runtime": 17.0536,
-      "eval_samples_per_second": 95.874,
-      "step": 4200
-    },
-    {
-      "epoch": 14.92,
-      "eval_accuracy": 79.51070336391437,
-      "eval_average_metrics": 79.51070336391437,
-      "eval_loss": 0.19150203466415405,
-      "eval_runtime": 17.2063,
-      "eval_samples_per_second": 95.024,
-      "step": 4400
-    },
-    {
-      "epoch": 15.25,
-      "learning_rate": 7.11864406779661e-05,
-      "loss": 0.1769,
-      "step": 4500
-    },
-    {
-      "epoch": 15.59,
-      "eval_accuracy": 78.77675840978593,
-      "eval_average_metrics": 78.77675840978593,
-      "eval_loss": 0.19904659688472748,
-      "eval_runtime": 17.1806,
-      "eval_samples_per_second": 95.165,
-      "step": 4600
-    },
-    {
-      "epoch": 16.27,
-      "eval_accuracy": 79.20489296636084,
-      "eval_average_metrics": 79.20489296636084,
-      "eval_loss": 0.19741013646125793,
-      "eval_runtime": 17.2538,
-      "eval_samples_per_second": 94.762,
-      "step": 4800
-    },
-    {
-      "epoch": 16.95,
-      "learning_rate": 4.576271186440678e-05,
-      "loss": 0.1741,
-      "step": 5000
-    },
-    {
-      "epoch": 16.95,
-      "eval_accuracy": 79.51070336391437,
-      "eval_average_metrics": 79.51070336391437,
-      "eval_loss": 0.19429509341716766,
-      "eval_runtime": 17.4899,
-      "eval_samples_per_second": 93.483,
-      "step": 5000
-    },
-    {
-      "epoch": 17.63,
-      "eval_accuracy": 78.89908256880734,
-      "eval_average_metrics": 78.89908256880734,
-      "eval_loss": 0.20053960382938385,
-      "eval_runtime": 17.2615,
-      "eval_samples_per_second": 94.719,
-      "step": 5200
-    },
-    {
-      "epoch": 18.31,
-      "eval_accuracy": 79.32721712538226,
-      "eval_average_metrics": 79.32721712538226,
-      "eval_loss": 0.1975349634885788,
-      "eval_runtime": 17.2849,
-      "eval_samples_per_second": 94.591,
-      "step": 5400
-    },
-    {
-      "epoch": 18.64,
-      "learning_rate": 2.0338983050847455e-05,
-      "loss": 0.1717,
-      "step": 5500
-    },
-    {
-      "epoch": 18.98,
-      "eval_accuracy": 78.77675840978593,
-      "eval_average_metrics": 78.77675840978593,
-      "eval_loss": 0.20098499953746796,
-      "eval_runtime": 17.3626,
-      "eval_samples_per_second": 94.168,
-      "step": 5600
-    },
-    {
-      "epoch": 19.66,
-      "eval_accuracy": 79.20489296636084,
-      "eval_average_metrics": 79.20489296636084,
-      "eval_loss": 0.19755637645721436,
-      "eval_runtime": 17.3825,
-      "eval_samples_per_second": 94.06,
-      "step": 5800
     },
     {
-      "epoch": 20.0,
-      "step": 5900,
-      "total_flos": 5.74047486286578e+16,
-      "train_loss": 0.20100380073159427,
-      "train_runtime": 3071.6757,
-      "train_samples_per_second": 61.38,
-      "train_steps_per_second": 1.921
     }
   ],
-  "max_steps": 5900,
-  "num_train_epochs": 20,
-  "total_flos": 5.74047486286578e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 76.75840978593273,
+  "best_model_checkpoint": "outputs/lora/t5-base/superglue-boolq/checkpoint-200",
+  "epoch": 1.0,
+  "global_step": 295,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.34,
+      "eval_accuracy": 73.27217125382262,
+      "eval_average_metrics": 73.27217125382262,
+      "eval_loss": 0.22932085394859314,
+      "eval_runtime": 6.9808,
+      "eval_samples_per_second": 234.214,
+      "step": 100
     },
     {
+      "epoch": 0.68,
+      "eval_accuracy": 76.75840978593273,
+      "eval_average_metrics": 76.75840978593273,
+      "eval_loss": 0.20979416370391846,
+      "eval_runtime": 7.0533,
+      "eval_samples_per_second": 231.807,
+      "step": 200
     },
     {
+      "epoch": 1.0,
+      "step": 295,
+      "total_flos": 2875122627969024.0,
+      "train_loss": 0.6385218733448094,
+      "train_runtime": 73.7325,
+      "train_samples_per_second": 127.854,
+      "train_steps_per_second": 4.001
     }
   ],
+  "max_steps": 295,
+  "num_train_epochs": 1,
+  "total_flos": 2875122627969024.0,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88b31f564a16ff14e33b57eb5d36963b70b4c507029230e10268f329a5bf8ce5
 size 3311

 version https://git-lfs.github.com/spec/v1
+oid sha256:a78b1a8b87a3c5ea8fc6661c07621a881dfa3ca8419a2b5df765b5a7a81b73c7
 size 3311