End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 31.18,
-    "eval_accuracy": 0.1376987935196624,
-    "eval_loss": 6.486697196960449,
-    "eval_runtime": 169.2274,
     "eval_samples": 24055,
-    "eval_samples_per_second": 142.146,
-    "eval_steps_per_second": 2.222,
-    "perplexity": 656.351978052217,
-    "train_loss": 6.89371246590102,
-    "train_runtime": 29548.4223,
     "train_samples": 24910,
-    "train_samples_per_second": 33.721,
-    "train_steps_per_second": 0.263
 }

 {
+    "epoch": 89.58,
+    "eval_accuracy": 0.5148013040185571,
+    "eval_loss": 2.73911714553833,
+    "eval_runtime": 145.896,
     "eval_samples": 24055,
+    "eval_samples_per_second": 164.878,
+    "eval_steps_per_second": 5.154,
+    "perplexity": 15.47331837619993,
+    "train_loss": 3.7431876293448516,
+    "train_runtime": 42244.2763,
     "train_samples": 24910,
+    "train_samples_per_second": 58.967,
+    "train_steps_per_second": 0.114
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 31.18,
-    "eval_accuracy": 0.1376987935196624,
-    "eval_loss": 6.486697196960449,
-    "eval_runtime": 169.2274,
     "eval_samples": 24055,
-    "eval_samples_per_second": 142.146,
-    "eval_steps_per_second": 2.222,
-    "perplexity": 656.351978052217
 }

 {
+    "epoch": 89.58,
+    "eval_accuracy": 0.5148013040185571,
+    "eval_loss": 2.73911714553833,
+    "eval_runtime": 145.896,
     "eval_samples": 24055,
+    "eval_samples_per_second": 164.878,
+    "eval_steps_per_second": 5.154,
+    "perplexity": 15.47331837619993
 }

runs/Feb14_00-12-10_monica.sm.unibocconi.it/events.out.tfevents.1676372443.monica.sm.unibocconi.it.4164817.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:26625321fb87508e6806a980245d911e5f14945900233a180200a73b51d5fcc8
+size 363

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 31.18,
-    "train_loss": 6.89371246590102,
-    "train_runtime": 29548.4223,
     "train_samples": 24910,
-    "train_samples_per_second": 33.721,
-    "train_steps_per_second": 0.263
 }

 {
+    "epoch": 89.58,
+    "train_loss": 3.7431876293448516,
+    "train_runtime": 42244.2763,
     "train_samples": 24910,
+    "train_samples_per_second": 58.967,
+    "train_steps_per_second": 0.114
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff