Training in progress, step 107, checkpoint

Browse files

Files changed (7) hide show

checkpoint-107/README.md +273 -93
checkpoint-107/optimizer.pt +1 -1
checkpoint-107/pytorch_model.bin +1 -1
checkpoint-107/rng_state.pth +1 -1
checkpoint-107/scheduler.pt +1 -1
checkpoint-107/trainer_state.json +455 -455
checkpoint-107/training_args.bin +1 -1

checkpoint-107/README.md CHANGED Viewed

@@ -164,34 +164,34 @@ model-index:
       type: sts-test
     metrics:
     - type: pearson_cosine
-      value: 0.45494716382349193
       name: Pearson Cosine
     - type: spearman_cosine
-      value: 0.48921418507251446
       name: Spearman Cosine
     - type: pearson_manhattan
-      value: 0.4417008219313264
       name: Pearson Manhattan
     - type: spearman_manhattan
-      value: 0.46068648052845956
       name: Spearman Manhattan
     - type: pearson_euclidean
-      value: 0.4480861256491879
       name: Pearson Euclidean
     - type: spearman_euclidean
-      value: 0.4610824798409968
       name: Spearman Euclidean
     - type: pearson_dot
-      value: 0.44837123659858896
       name: Pearson Dot
     - type: spearman_dot
-      value: 0.46707725062744593
       name: Spearman Dot
     - type: pearson_max
-      value: 0.45494716382349193
       name: Pearson Max
     - type: spearman_max
-      value: 0.48921418507251446
       name: Spearman Max
   - task:
       type: triplet
@@ -223,109 +223,109 @@ model-index:
       type: VitaminC
     metrics:
     - type: cosine_accuracy
-      value: 0.5546875
       name: Cosine Accuracy
     - type: cosine_accuracy_threshold
-      value: 0.9041332006454468
       name: Cosine Accuracy Threshold
     - type: cosine_f1
-      value: 0.6542553191489362
       name: Cosine F1
     - type: cosine_f1_threshold
-      value: 0.452939510345459
       name: Cosine F1 Threshold
     - type: cosine_precision
-      value: 0.48616600790513836
       name: Cosine Precision
     - type: cosine_recall
       value: 1.0
       name: Cosine Recall
     - type: cosine_ap
-      value: 0.5292859731465609
       name: Cosine Ap
     - type: dot_accuracy
-      value: 0.5546875
       name: Dot Accuracy
     - type: dot_accuracy_threshold
-      value: 414.42559814453125
       name: Dot Accuracy Threshold
     - type: dot_f1
-      value: 0.6542553191489362
       name: Dot F1
     - type: dot_f1_threshold
-      value: 212.6934814453125
       name: Dot F1 Threshold
     - type: dot_precision
-      value: 0.48616600790513836
       name: Dot Precision
     - type: dot_recall
       value: 1.0
       name: Dot Recall
     - type: dot_ap
-      value: 0.5222732504955002
       name: Dot Ap
     - type: manhattan_accuracy
-      value: 0.55859375
       name: Manhattan Accuracy
     - type: manhattan_accuracy_threshold
-      value: 173.8212127685547
       name: Manhattan Accuracy Threshold
     - type: manhattan_f1
-      value: 0.6542553191489362
       name: Manhattan F1
     - type: manhattan_f1_threshold
-      value: 415.5366516113281
       name: Manhattan F1 Threshold
     - type: manhattan_precision
-      value: 0.48616600790513836
       name: Manhattan Precision
     - type: manhattan_recall
-      value: 1.0
       name: Manhattan Recall
     - type: manhattan_ap
-      value: 0.5305698453165033
       name: Manhattan Ap
     - type: euclidean_accuracy
-      value: 0.5546875
       name: Euclidean Accuracy
     - type: euclidean_accuracy_threshold
-      value: 9.18377685546875
       name: Euclidean Accuracy Threshold
     - type: euclidean_f1
-      value: 0.6542553191489362
       name: Euclidean F1
     - type: euclidean_f1_threshold
-      value: 22.683509826660156
       name: Euclidean F1 Threshold
     - type: euclidean_precision
-      value: 0.48616600790513836
       name: Euclidean Precision
     - type: euclidean_recall
       value: 1.0
       name: Euclidean Recall
     - type: euclidean_ap
-      value: 0.5291787221346742
       name: Euclidean Ap
     - type: max_accuracy
-      value: 0.55859375
       name: Max Accuracy
     - type: max_accuracy_threshold
-      value: 414.42559814453125
       name: Max Accuracy Threshold
     - type: max_f1
-      value: 0.6542553191489362
       name: Max F1
     - type: max_f1_threshold
-      value: 415.5366516113281
       name: Max F1 Threshold
     - type: max_precision
-      value: 0.48616600790513836
       name: Max Precision
     - type: max_recall
       value: 1.0
       name: Max Recall
     - type: max_ap
-      value: 0.5305698453165033
       name: Max Ap
 ---
@@ -388,7 +388,7 @@ Then you can load this model and run inference.
 from sentence_transformers import SentenceTransformer
 # Download from the 🤗 Hub
-model = SentenceTransformer("bobox/DeBERTa-small-ST-v1-toytest-checkpoints-tmp")
 # Run inference
 sentences = [
     'who did ben assault in home and away',
@@ -439,16 +439,16 @@ You can finetune this model on your own dataset.
 | Metric              | Value      |
 |:--------------------|:-----------|
-| pearson_cosine      | 0.4549     |
-| **spearman_cosine** | **0.4892** |
-| pearson_manhattan   | 0.4417     |
-| spearman_manhattan  | 0.4607     |
-| pearson_euclidean   | 0.4481     |
-| spearman_euclidean  | 0.4611     |
-| pearson_dot         | 0.4484     |
-| spearman_dot        | 0.4671     |
-| pearson_max         | 0.4549     |
-| spearman_max        | 0.4892     |
 #### Triplet
 * Dataset: `NLI-v2`
@@ -468,41 +468,41 @@ You can finetune this model on your own dataset.
 | Metric                       | Value      |
 |:-----------------------------|:-----------|
-| cosine_accuracy              | 0.5547     |
-| cosine_accuracy_threshold    | 0.9041     |
-| cosine_f1                    | 0.6543     |
-| cosine_f1_threshold          | 0.4529     |
-| cosine_precision             | 0.4862     |
 | cosine_recall                | 1.0        |
-| cosine_ap                    | 0.5293     |
-| dot_accuracy                 | 0.5547     |
-| dot_accuracy_threshold       | 414.4256   |
-| dot_f1                       | 0.6543     |
-| dot_f1_threshold             | 212.6935   |
-| dot_precision                | 0.4862     |
 | dot_recall                   | 1.0        |
-| dot_ap                       | 0.5223     |
-| manhattan_accuracy           | 0.5586     |
-| manhattan_accuracy_threshold | 173.8212   |
-| manhattan_f1                 | 0.6543     |
-| manhattan_f1_threshold       | 415.5367   |
-| manhattan_precision          | 0.4862     |
-| manhattan_recall             | 1.0        |
-| manhattan_ap                 | 0.5306     |
-| euclidean_accuracy           | 0.5547     |
-| euclidean_accuracy_threshold | 9.1838     |
-| euclidean_f1                 | 0.6543     |
-| euclidean_f1_threshold       | 22.6835    |
-| euclidean_precision          | 0.4862     |
 | euclidean_recall             | 1.0        |
-| euclidean_ap                 | 0.5292     |
-| max_accuracy                 | 0.5586     |
-| max_accuracy_threshold       | 414.4256   |
-| max_f1                       | 0.6543     |
-| max_f1_threshold             | 415.5367   |
-| max_precision                | 0.4862     |
 | max_recall                   | 1.0        |
-| **max_ap**                   | **0.5306** |
 <!--
 ## Bias, Risks and Limitations
@@ -1151,14 +1151,14 @@ You can finetune this model on your own dataset.
 #### Non-Default Hyperparameters
 - `eval_strategy`: steps
-- `per_device_train_batch_size`: 160
 - `per_device_eval_batch_size`: 64
-- `gradient_accumulation_steps`: 8
 - `learning_rate`: 4e-05
-- `weight_decay`: 0.0001
 - `lr_scheduler_type`: cosine_with_min_lr
-- `lr_scheduler_kwargs`: {'num_cycles': 0.5, 'min_lr': 1.3333333333333335e-05}
-- `warmup_ratio`: 0.33
 - `save_safetensors`: False
 - `fp16`: True
 - `push_to_hub`: True
@@ -1173,14 +1173,14 @@ You can finetune this model on your own dataset.
 - `do_predict`: False
 - `eval_strategy`: steps
 - `prediction_loss_only`: True
-- `per_device_train_batch_size`: 160
 - `per_device_eval_batch_size`: 64
 - `per_gpu_train_batch_size`: None
 - `per_gpu_eval_batch_size`: None
-- `gradient_accumulation_steps`: 8
 - `eval_accumulation_steps`: None
 - `learning_rate`: 4e-05
-- `weight_decay`: 0.0001
 - `adam_beta1`: 0.9
 - `adam_beta2`: 0.999
 - `adam_epsilon`: 1e-08
@@ -1188,8 +1188,8 @@ You can finetune this model on your own dataset.
 - `num_train_epochs`: 3
 - `max_steps`: -1
 - `lr_scheduler_type`: cosine_with_min_lr
-- `lr_scheduler_kwargs`: {'num_cycles': 0.5, 'min_lr': 1.3333333333333335e-05}
-- `warmup_ratio`: 0.33
 - `warmup_steps`: 0
 - `log_level`: passive
 - `log_level_replica`: warning
@@ -1282,6 +1282,8 @@ You can finetune this model on your own dataset.
 </details>
 ### Training Logs
 | Epoch  | Step | Training Loss | vitaminc-pairs loss | trivia pairs loss | xsum-pairs loss | paws-pos loss | sciq pairs loss | msmarco pairs loss | openbookqa pairs loss | gooaq pairs loss | nq pairs loss | scitail-pairs-pos loss | qasc pairs loss | negation-triplets loss | NLI-v2_max_accuracy | VitaminC_max_ap | sts-test_spearman_cosine |
 |:------:|:----:|:-------------:|:-------------------:|:-----------------:|:---------------:|:-------------:|:---------------:|:------------------:|:---------------------:|:----------------:|:-------------:|:----------------------:|:---------------:|:----------------------:|:-------------------:|:---------------:|:------------------------:|
 | 0.0169 | 3    | 7.2372        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
@@ -1319,7 +1321,185 @@ You can finetune this model on your own dataset.
 | 0.5589 | 99   | 2.1857        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
 | 0.5759 | 102  | 1.8881        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
 | 0.5928 | 105  | 2.2699        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
 ### Framework Versions
 - Python: 3.10.13

       type: sts-test
     metrics:
     - type: pearson_cosine
+      value: 0.8483316632682467
       name: Pearson Cosine
     - type: spearman_cosine
+      value: 0.8903503892346
       name: Spearman Cosine
     - type: pearson_manhattan
+      value: 0.8815226866327923
       name: Pearson Manhattan
     - type: spearman_manhattan
+      value: 0.8865568876827619
       name: Spearman Manhattan
     - type: pearson_euclidean
+      value: 0.8814283057813619
       name: Pearson Euclidean
     - type: spearman_euclidean
+      value: 0.8851830636663006
       name: Spearman Euclidean
     - type: pearson_dot
+      value: 0.8392403098680445
       name: Pearson Dot
     - type: spearman_dot
+      value: 0.857844431199042
       name: Spearman Dot
     - type: pearson_max
+      value: 0.8815226866327923
       name: Pearson Max
     - type: spearman_max
+      value: 0.8903503892346
       name: Spearman Max
   - task:
       type: triplet
       type: VitaminC
     metrics:
     - type: cosine_accuracy
+      value: 0.578125
       name: Cosine Accuracy
     - type: cosine_accuracy_threshold
+      value: 0.7859437465667725
       name: Cosine Accuracy Threshold
     - type: cosine_f1
+      value: 0.6595174262734584
       name: Cosine F1
     - type: cosine_f1_threshold
+      value: 0.3211573362350464
       name: Cosine F1 Threshold
     - type: cosine_precision
+      value: 0.492
       name: Cosine Precision
     - type: cosine_recall
       value: 1.0
       name: Cosine Recall
     - type: cosine_ap
+      value: 0.5557444337961499
       name: Cosine Ap
     - type: dot_accuracy
+      value: 0.578125
       name: Dot Accuracy
     - type: dot_accuracy_threshold
+      value: 315.9444580078125
       name: Dot Accuracy Threshold
     - type: dot_f1
+      value: 0.6595174262734584
       name: Dot F1
     - type: dot_f1_threshold
+      value: 129.88558959960938
       name: Dot F1 Threshold
     - type: dot_precision
+      value: 0.492
       name: Dot Precision
     - type: dot_recall
       value: 1.0
       name: Dot Recall
     - type: dot_ap
+      value: 0.5539524528858992
       name: Dot Ap
     - type: manhattan_accuracy
+      value: 0.578125
       name: Manhattan Accuracy
     - type: manhattan_accuracy_threshold
+      value: 276.40142822265625
       name: Manhattan Accuracy Threshold
     - type: manhattan_f1
+      value: 0.6576819407008085
       name: Manhattan F1
     - type: manhattan_f1_threshold
+      value: 469.7353515625
       name: Manhattan F1 Threshold
     - type: manhattan_precision
+      value: 0.49193548387096775
       name: Manhattan Precision
     - type: manhattan_recall
+      value: 0.991869918699187
       name: Manhattan Recall
     - type: manhattan_ap
+      value: 0.5429240708188645
       name: Manhattan Ap
     - type: euclidean_accuracy
+      value: 0.58203125
       name: Euclidean Accuracy
     - type: euclidean_accuracy_threshold
+      value: 13.113249778747559
       name: Euclidean Accuracy Threshold
     - type: euclidean_f1
+      value: 0.6577540106951871
       name: Euclidean F1
     - type: euclidean_f1_threshold
+      value: 23.90462303161621
       name: Euclidean F1 Threshold
     - type: euclidean_precision
+      value: 0.4900398406374502
       name: Euclidean Precision
     - type: euclidean_recall
       value: 1.0
       name: Euclidean Recall
     - type: euclidean_ap
+      value: 0.5510190217865811
       name: Euclidean Ap
     - type: max_accuracy
+      value: 0.58203125
       name: Max Accuracy
     - type: max_accuracy_threshold
+      value: 315.9444580078125
       name: Max Accuracy Threshold
     - type: max_f1
+      value: 0.6595174262734584
       name: Max F1
     - type: max_f1_threshold
+      value: 469.7353515625
       name: Max F1 Threshold
     - type: max_precision
+      value: 0.492
       name: Max Precision
     - type: max_recall
       value: 1.0
       name: Max Recall
     - type: max_ap
+      value: 0.5557444337961499
       name: Max Ap
 ---
 from sentence_transformers import SentenceTransformer
 # Download from the 🤗 Hub
+model = SentenceTransformer("bobox/DeBERTa-small-ST-v1-toytest")
 # Run inference
 sentences = [
     'who did ben assault in home and away',
 | Metric              | Value      |
 |:--------------------|:-----------|
+| pearson_cosine      | 0.8483     |
+| **spearman_cosine** | **0.8904** |
+| pearson_manhattan   | 0.8815     |
+| spearman_manhattan  | 0.8866     |
+| pearson_euclidean   | 0.8814     |
+| spearman_euclidean  | 0.8852     |
+| pearson_dot         | 0.8392     |
+| spearman_dot        | 0.8578     |
+| pearson_max         | 0.8815     |
+| spearman_max        | 0.8904     |
 #### Triplet
 * Dataset: `NLI-v2`
 | Metric                       | Value      |
 |:-----------------------------|:-----------|
+| cosine_accuracy              | 0.5781     |
+| cosine_accuracy_threshold    | 0.7859     |
+| cosine_f1                    | 0.6595     |
+| cosine_f1_threshold          | 0.3212     |
+| cosine_precision             | 0.492      |
 | cosine_recall                | 1.0        |
+| cosine_ap                    | 0.5557     |
+| dot_accuracy                 | 0.5781     |
+| dot_accuracy_threshold       | 315.9445   |
+| dot_f1                       | 0.6595     |
+| dot_f1_threshold             | 129.8856   |
+| dot_precision                | 0.492      |
 | dot_recall                   | 1.0        |
+| dot_ap                       | 0.554      |
+| manhattan_accuracy           | 0.5781     |
+| manhattan_accuracy_threshold | 276.4014   |
+| manhattan_f1                 | 0.6577     |
+| manhattan_f1_threshold       | 469.7354   |
+| manhattan_precision          | 0.4919     |
+| manhattan_recall             | 0.9919     |
+| manhattan_ap                 | 0.5429     |
+| euclidean_accuracy           | 0.582      |
+| euclidean_accuracy_threshold | 13.1132    |
+| euclidean_f1                 | 0.6578     |
+| euclidean_f1_threshold       | 23.9046    |
+| euclidean_precision          | 0.49       |
 | euclidean_recall             | 1.0        |
+| euclidean_ap                 | 0.551      |
+| max_accuracy                 | 0.582      |
+| max_accuracy_threshold       | 315.9445   |
+| max_f1                       | 0.6595     |
+| max_f1_threshold             | 469.7354   |
+| max_precision                | 0.492      |
 | max_recall                   | 1.0        |
+| **max_ap**                   | **0.5557** |
 <!--
 ## Bias, Risks and Limitations
 #### Non-Default Hyperparameters
 - `eval_strategy`: steps
+- `per_device_train_batch_size`: 320
 - `per_device_eval_batch_size`: 64
+- `gradient_accumulation_steps`: 4
 - `learning_rate`: 4e-05
+- `weight_decay`: 5e-05
 - `lr_scheduler_type`: cosine_with_min_lr
+- `lr_scheduler_kwargs`: {'num_cycles': 0.5, 'min_lr': 1e-05}
+- `warmup_ratio`: 0.15
 - `save_safetensors`: False
 - `fp16`: True
 - `push_to_hub`: True
 - `do_predict`: False
 - `eval_strategy`: steps
 - `prediction_loss_only`: True
+- `per_device_train_batch_size`: 320
 - `per_device_eval_batch_size`: 64
 - `per_gpu_train_batch_size`: None
 - `per_gpu_eval_batch_size`: None
+- `gradient_accumulation_steps`: 4
 - `eval_accumulation_steps`: None
 - `learning_rate`: 4e-05
+- `weight_decay`: 5e-05
 - `adam_beta1`: 0.9
 - `adam_beta2`: 0.999
 - `adam_epsilon`: 1e-08
 - `num_train_epochs`: 3
 - `max_steps`: -1
 - `lr_scheduler_type`: cosine_with_min_lr
+- `lr_scheduler_kwargs`: {'num_cycles': 0.5, 'min_lr': 1e-05}
+- `warmup_ratio`: 0.15
 - `warmup_steps`: 0
 - `log_level`: passive
 - `log_level_replica`: warning
 </details>
 ### Training Logs
+<details><summary>Click to expand</summary>
 | Epoch  | Step | Training Loss | vitaminc-pairs loss | trivia pairs loss | xsum-pairs loss | paws-pos loss | sciq pairs loss | msmarco pairs loss | openbookqa pairs loss | gooaq pairs loss | nq pairs loss | scitail-pairs-pos loss | qasc pairs loss | negation-triplets loss | NLI-v2_max_accuracy | VitaminC_max_ap | sts-test_spearman_cosine |
 |:------:|:----:|:-------------:|:-------------------:|:-----------------:|:---------------:|:-------------:|:---------------:|:------------------:|:---------------------:|:----------------:|:-------------:|:----------------------:|:---------------:|:----------------------:|:-------------------:|:---------------:|:------------------------:|
 | 0.0169 | 3    | 7.2372        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
 | 0.5589 | 99   | 2.1857        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
 | 0.5759 | 102  | 1.8881        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
 | 0.5928 | 105  | 2.2699        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.6097 | 108  | 2.1425        | 2.7217              | 1.7080            | 1.2066          | 0.0800        | 0.0949          | 1.6446             | 1.5739                | 1.7924           | 2.3649        | 0.2329                 | 0.8462          | 2.3389                 | 1.0                 | 0.5323          | 0.7806                   |
+| 0.6267 | 111  | 2.1276        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.6436 | 114  | 1.7531        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.6606 | 117  | 2.0179        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.6775 | 120  | 1.5305        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.6944 | 123  | 1.6925        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.7114 | 126  | 1.5248        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.7283 | 129  | 1.523         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.7452 | 132  | 1.5474        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.7622 | 135  | 1.7221        | 2.8521              | 1.4495            | 0.7707          | 0.0601        | 0.0751          | 1.1524             | 1.4015                | 1.3955           | 1.7769        | 0.2150                 | 0.6356          | 2.0742                 | 1.0                 | 0.5327          | 0.8315                   |
+| 0.7791 | 138  | 1.5366        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.7960 | 141  | 1.3045        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.8130 | 144  | 1.1999        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.8299 | 147  | 1.3483        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.8469 | 150  | 1.2009        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.8638 | 153  | 1.4495        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.8807 | 156  | 1.2329        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.8977 | 159  | 1.1905        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.9146 | 162  | 1.277         | 2.7764              | 1.2929            | 0.5587          | 0.0525        | 0.0604          | 0.8656             | 1.1903                | 1.1581           | 1.1554        | 0.1988                 | 0.4943          | 2.0055                 | 1.0                 | 0.5311          | 0.8548                   |
+| 0.9315 | 165  | 1.339         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.9485 | 168  | 1.1535        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.9654 | 171  | 1.1643        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.9824 | 174  | 1.2221        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.9993 | 177  | 1.0974        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.0162 | 180  | 1.0984        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.0332 | 183  | 1.0543        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.0501 | 186  | 1.0994        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.0670 | 189  | 1.0621        | 2.6755              | 1.2004            | 0.3837          | 0.0421        | 0.0556          | 0.6897             | 1.0837                | 1.0353           | 0.9604        | 0.1854                 | 0.4047          | 1.9071                 | 1.0                 | 0.5420          | 0.8680                   |
+| 1.0840 | 192  | 0.8724        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.1009 | 195  | 0.9381        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.1179 | 198  | 0.9617        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.1348 | 201  | 1.0139        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.1517 | 204  | 1.1073        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.1687 | 207  | 0.8365        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.1856 | 210  | 1.1012        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.2025 | 213  | 1.0016        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.2195 | 216  | 1.0957        | 2.5466              | 1.1412            | 0.3591          | 0.0395        | 0.0517          | 0.5819             | 0.9366                | 0.9686           | 0.8172        | 0.1901                 | 0.3075          | 1.9161                 | 1.0                 | 0.5385          | 0.8656                   |
+| 1.2364 | 219  | 1.1273        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.2534 | 222  | 1.2568        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.2703 | 225  | 0.873         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.2872 | 228  | 1.0003        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.3042 | 231  | 1.142         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.3211 | 234  | 0.807         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.3380 | 237  | 1.0231        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.3550 | 240  | 0.797         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.3719 | 243  | 0.8473        | 2.5140              | 1.1067            | 0.2802          | 0.0343        | 0.0467          | 0.5559             | 0.8562                | 0.8929           | 0.7435        | 0.1750                 | 0.2355          | 1.8629                 | 1.0                 | 0.5508          | 0.8687                   |
+| 1.3888 | 246  | 0.9531        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.4058 | 249  | 0.9023        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.4227 | 252  | 0.8922        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.4397 | 255  | 0.9874        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.4566 | 258  | 0.8508        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.4735 | 261  | 0.7149        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.4905 | 264  | 0.894         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.5074 | 267  | 0.867         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.5243 | 270  | 0.7493        | 2.5574              | 1.0634            | 0.2217          | 0.0319        | 0.0435          | 0.5027             | 0.7999                | 0.8005           | 0.6530        | 0.1693                 | 0.2443          | 1.8535                 | 1.0                 | 0.5499          | 0.8716                   |
+| 1.5413 | 273  | 0.7974        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.5582 | 276  | 0.797         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.5752 | 279  | 0.6749        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.5921 | 282  | 0.9325        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.6090 | 285  | 0.8418        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.6260 | 288  | 1.0135        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.6429 | 291  | 0.6961        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.6598 | 294  | 0.9361        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.6768 | 297  | 0.6747        | 2.4871              | 0.9762            | 0.2242          | 0.0291        | 0.0396          | 0.5025             | 0.7668                | 0.7546           | 0.6427        | 0.1596                 | 0.1963          | 1.7349                 | 1.0                 | 0.5461          | 0.8787                   |
+| 1.6937 | 300  | 0.7786        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.7107 | 303  | 0.7171        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.7276 | 306  | 0.6627        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.7445 | 309  | 0.6711        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.7615 | 312  | 0.9076        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.7784 | 315  | 0.7414        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.7953 | 318  | 0.582         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.8123 | 321  | 0.6068        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.8292 | 324  | 0.6219        | 2.5197              | 1.0206            | 0.1630          | 0.0273        | 0.0383          | 0.4859             | 0.7109                | 0.7736           | 0.5533        | 0.1535                 | 0.2044          | 1.7016                 | 1.0                 | 0.5532          | 0.8807                   |
+| 1.8462 | 327  | 0.5862        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.8631 | 330  | 0.678         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.8800 | 333  | 0.6272        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.8970 | 336  | 0.5048        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.9139 | 339  | 0.7653        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.9308 | 342  | 0.6613        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.9478 | 345  | 0.6122        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.9647 | 348  | 0.5939        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 1.9817 | 351  | 0.6923        | 2.4379              | 0.9582            | 0.1464          | 0.0264        | 0.0382          | 0.4348             | 0.7554                | 0.7220           | 0.5432        | 0.1481                 | 0.1640          | 1.7345                 | 1.0                 | 0.5560          | 0.8837                   |
+| 1.9986 | 354  | 0.5712        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.0155 | 357  | 0.5969        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.0325 | 360  | 0.5881        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.0494 | 363  | 0.6005        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.0663 | 366  | 0.6066        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.0833 | 369  | 0.4921        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.1002 | 372  | 0.5354        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.1171 | 375  | 0.5602        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.1341 | 378  | 0.5686        | 2.3908              | 0.9614            | 0.1454          | 0.0271        | 0.0374          | 0.4246             | 0.7796                | 0.6965           | 0.5298        | 0.1401                 | 0.1604          | 1.7678                 | 1.0                 | 0.5539          | 0.8804                   |
+| 2.1510 | 381  | 0.6496        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.1680 | 384  | 0.4713        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.1849 | 387  | 0.6345        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.2018 | 390  | 0.5994        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.2188 | 393  | 0.6763        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.2357 | 396  | 0.7254        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.2526 | 399  | 0.8032        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.2696 | 402  | 0.4914        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.2865 | 405  | 0.6307        | 2.4388              | 0.9862            | 0.1308          | 0.0262        | 0.0379          | 0.3928             | 0.7434                | 0.6976           | 0.4998        | 0.1192                 | 0.1466          | 1.7093                 | 1.0                 | 0.5533          | 0.8859                   |
+| 2.3035 | 408  | 0.7493        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.3204 | 411  | 0.5139        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.3373 | 414  | 0.6364        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.3543 | 417  | 0.4763        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.3712 | 420  | 0.583         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.3881 | 423  | 0.5912        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.4051 | 426  | 0.5936        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.4220 | 429  | 0.5959        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.4390 | 432  | 0.676         | 2.4265              | 0.9634            | 0.1220          | 0.0260        | 0.0362          | 0.4292             | 0.7433                | 0.6771           | 0.4752        | 0.1282                 | 0.1304          | 1.6943                 | 1.0                 | 0.5532          | 0.8878                   |
+| 2.4559 | 435  | 0.5622        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.4728 | 438  | 0.4633        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.4898 | 441  | 0.5955        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.5067 | 444  | 0.6271        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.5236 | 447  | 0.4988        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.5406 | 450  | 0.519         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.5575 | 453  | 0.5538        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.5745 | 456  | 0.4826        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.5914 | 459  | 0.6322        | 2.4541              | 0.9231            | 0.1224          | 0.0253        | 0.0345          | 0.4048             | 0.7595                | 0.6607           | 0.4713        | 0.1168                 | 0.1323          | 1.7024                 | 1.0                 | 0.5557          | 0.8868                   |
+| 2.6083 | 462  | 0.6342        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.6253 | 465  | 0.7012        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.6422 | 468  | 0.4175        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.6591 | 471  | 0.7575        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.6761 | 474  | 0.4687        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.6930 | 477  | 0.5907        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.7100 | 480  | 0.4796        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.7269 | 483  | 0.4809        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.7438 | 486  | 0.4696        | 2.4899              | 0.9546            | 0.1169          | 0.0247        | 0.0343          | 0.4138             | 0.7444                | 0.6688           | 0.4838        | 0.1166                 | 0.1279          | 1.6605                 | 1.0                 | 0.5527          | 0.8883                   |
+| 2.7608 | 489  | 0.6588        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.7777 | 492  | 0.5675        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.7946 | 495  | 0.4007        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.8116 | 498  | 0.4476        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.8285 | 501  | 0.433         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.8454 | 504  | 0.4154        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.8624 | 507  | 0.5416        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.8793 | 510  | 0.4546        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.8963 | 513  | 0.3326        | 2.4924              | 0.9493            | 0.1071          | 0.0248        | 0.0344          | 0.4033             | 0.7376                | 0.6558           | 0.4478        | 0.1148                 | 0.1219          | 1.6918                 | 1.0                 | 0.5534          | 0.8907                   |
+| 2.9132 | 516  | 0.594         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.9301 | 519  | 0.4727        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.9471 | 522  | 0.4701        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.9640 | 525  | 0.4606        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.9809 | 528  | 0.5025        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 2.9979 | 531  | 0.4314        | 2.4532              | 0.9270            | 0.1131          | 0.0247        | 0.0344          | 0.3951             | 0.7123                | 0.6345           | 0.4383        | 0.1143                 | 0.1159          | 1.7003                 | 1.0                 | 0.5539          | 0.8904                   |
+| 0.0169 | 3    | 0.6012        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.0337 | 6    | 0.7573        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.0506 | 9    | 0.9212        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.0674 | 12   | 0.6117        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.0843 | 15   | 0.8545        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.1011 | 18   | 0.6515        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.1180 | 21   | 0.7159        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.1348 | 24   | 0.7019        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.1517 | 27   | 0.4411        | 2.4659              | 0.9318            | 0.1117          | 0.0249        | 0.0345          | 0.3955             | 0.7092                | 0.6506           | 0.4205        | 0.1150                 | 0.1110          | 1.7311                 | 1.0                 | 0.5512          | 0.8906                   |
+| 0.1685 | 30   | 0.5125        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.1854 | 33   | 0.6885        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.2022 | 36   | 0.6435        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.2191 | 39   | 0.753         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.2360 | 42   | 0.7427        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.2528 | 45   | 0.5083        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.2697 | 48   | 0.7454        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.2865 | 51   | 0.8356        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.3034 | 54   | 0.8864        | 2.4545              | 0.9158            | 0.1009          | 0.0252        | 0.0347          | 0.3809             | 0.7240                | 0.6208           | 0.4417        | 0.1117                 | 0.1055          | 1.7278                 | 1.0                 | 0.5499          | 0.8877                   |
+| 0.3202 | 57   | 0.6015        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.3371 | 60   | 0.9482        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.3539 | 63   | 0.5404        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.3708 | 66   | 0.805         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.3876 | 69   | 0.7184        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.4045 | 72   | 0.8708        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.4213 | 75   | 0.8327        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.4382 | 78   | 0.5025        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.4551 | 81   | 0.6517        | 2.3539              | 0.9324            | 0.0842          | 0.0244        | 0.0348          | 0.3454             | 0.7161                | 0.6094           | 0.4443        | 0.1182                 | 0.1060          | 1.6492                 | 1.0                 | 0.5557          | 0.8904                   |
+| 0.4719 | 84   | 0.5801        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.4888 | 87   | 0.791         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.5056 | 90   | 0.6042        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.5225 | 93   | 0.7559        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.5393 | 96   | 0.6258        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.5562 | 99   | 0.8853        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.5730 | 102  | 0.5947        | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+| 0.5899 | 105  | 0.644         | -                   | -                 | -               | -             | -               | -                  | -                     | -                | -             | -                      | -               | -                      | -                   | -               | -                        |
+</details>
 ### Framework Versions
 - Python: 3.10.13

checkpoint-107/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d68669b06d21146c42d3ab8ac5fb5ecd13179c0bf7760c5eae496de3c2bedb9
 size 1130520122

 version https://git-lfs.github.com/spec/v1
+oid sha256:c4b52b19c1b7ba5dc357d641807fc458a5edfc8d957fa781f3b74046c4c35266
 size 1130520122

checkpoint-107/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:509380132a556aa5c5abd5ae7e2966c9aeeff6d3c17f413118c7e375b07b4a0c
 size 565251810

 version https://git-lfs.github.com/spec/v1
+oid sha256:2573f8d44707a08d0f8ac75dc82a2db81d33d5f56b9ff43e4b8bd36b6360356e
 size 565251810

checkpoint-107/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dba89f3e04d18dac9ee9bb8984f08a24cbbbd385d8c90bc6b32d99e0123f4094
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:9ee4a49a4489e711ad7e57eb8006fdb27dea4dd2f04c074a42f884b3f1874718
 size 14244

checkpoint-107/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb571e03d7f101ced903b4b06060b388f532cdee9c838a84c6bbeeb165f467db
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:672e608d66e62675fe93e3516bd09994e5b9413ad5901cbe4ab81e1e4e26683a
 size 1064

checkpoint-107/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.6040931545518702,
   "eval_steps": 27,
   "global_step": 107,
   "is_hyper_param_search": false,
@@ -9,694 +9,694 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.016937191249117856,
-      "grad_norm": 34.22002029418945,
-      "learning_rate": 6.818181818181818e-07,
-      "loss": 7.2372,
       "step": 3
     },
     {
-      "epoch": 0.03387438249823571,
-      "grad_norm": 21.76839828491211,
-      "learning_rate": 1.3636363636363636e-06,
-      "loss": 6.855,
       "step": 6
     },
     {
-      "epoch": 0.05081157374735357,
-      "grad_norm": 21.260774612426758,
-      "learning_rate": 2.0454545454545457e-06,
-      "loss": 7.4707,
       "step": 9
     },
     {
-      "epoch": 0.06774876499647142,
-      "grad_norm": 16.885921478271484,
-      "learning_rate": 2.7272727272727272e-06,
-      "loss": 7.0187,
       "step": 12
     },
     {
-      "epoch": 0.08468595624558928,
-      "grad_norm": 19.509899139404297,
-      "learning_rate": 3.409090909090909e-06,
-      "loss": 6.6756,
       "step": 15
     },
     {
-      "epoch": 0.10162314749470713,
-      "grad_norm": 7.9427289962768555,
-      "learning_rate": 4.0909090909090915e-06,
-      "loss": 6.0155,
       "step": 18
     },
     {
-      "epoch": 0.11856033874382499,
-      "grad_norm": 7.325345039367676,
-      "learning_rate": 4.772727272727273e-06,
-      "loss": 6.1644,
       "step": 21
     },
     {
-      "epoch": 0.13549752999294284,
-      "grad_norm": 7.544689655303955,
-      "learning_rate": 5.4545454545454545e-06,
-      "loss": 6.2158,
       "step": 24
     },
     {
-      "epoch": 0.1524347212420607,
-      "grad_norm": 5.141758918762207,
-      "learning_rate": 6.136363636363637e-06,
-      "loss": 6.1369,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
       "eval_NLI-v2_cosine_accuracy": 1.0,
-      "eval_NLI-v2_dot_accuracy": 0.109375,
       "eval_NLI-v2_euclidean_accuracy": 1.0,
       "eval_NLI-v2_manhattan_accuracy": 1.0,
       "eval_NLI-v2_max_accuracy": 1.0,
-      "eval_VitaminC_cosine_accuracy": 0.5546875,
-      "eval_VitaminC_cosine_accuracy_threshold": 0.9544724822044373,
-      "eval_VitaminC_cosine_ap": 0.5356492030729136,
-      "eval_VitaminC_cosine_f1": 0.6542553191489362,
-      "eval_VitaminC_cosine_f1_threshold": 0.7148199081420898,
-      "eval_VitaminC_cosine_precision": 0.48616600790513836,
       "eval_VitaminC_cosine_recall": 1.0,
-      "eval_VitaminC_dot_accuracy": 0.55078125,
-      "eval_VitaminC_dot_accuracy_threshold": 414.4264831542969,
-      "eval_VitaminC_dot_ap": 0.5108219546857565,
-      "eval_VitaminC_dot_f1": 0.6507936507936508,
-      "eval_VitaminC_dot_f1_threshold": 271.6522521972656,
-      "eval_VitaminC_dot_precision": 0.4823529411764706,
       "eval_VitaminC_dot_recall": 1.0,
-      "eval_VitaminC_euclidean_accuracy": 0.55078125,
-      "eval_VitaminC_euclidean_accuracy_threshold": 6.519885063171387,
-      "eval_VitaminC_euclidean_ap": 0.5226419655984281,
-      "eval_VitaminC_euclidean_f1": 0.6505376344086021,
-      "eval_VitaminC_euclidean_f1_threshold": 15.194067001342773,
-      "eval_VitaminC_euclidean_precision": 0.4859437751004016,
-      "eval_VitaminC_euclidean_recall": 0.983739837398374,
-      "eval_VitaminC_manhattan_accuracy": 0.546875,
-      "eval_VitaminC_manhattan_accuracy_threshold": 149.20114135742188,
-      "eval_VitaminC_manhattan_ap": 0.5237451656134715,
-      "eval_VitaminC_manhattan_f1": 0.6542553191489362,
-      "eval_VitaminC_manhattan_f1_threshold": 259.007080078125,
-      "eval_VitaminC_manhattan_precision": 0.48616600790513836,
       "eval_VitaminC_manhattan_recall": 1.0,
-      "eval_VitaminC_max_accuracy": 0.5546875,
-      "eval_VitaminC_max_accuracy_threshold": 414.4264831542969,
-      "eval_VitaminC_max_ap": 0.5356492030729136,
-      "eval_VitaminC_max_f1": 0.6542553191489362,
-      "eval_VitaminC_max_f1_threshold": 271.6522521972656,
-      "eval_VitaminC_max_precision": 0.48616600790513836,
       "eval_VitaminC_max_recall": 1.0,
-      "eval_sequential_score": 0.5356492030729136,
-      "eval_sts-test_pearson_cosine": 0.056062031998983373,
-      "eval_sts-test_pearson_dot": 0.2979259445723872,
-      "eval_sts-test_pearson_euclidean": 0.0498319208592713,
-      "eval_sts-test_pearson_manhattan": 0.07381429239121526,
-      "eval_sts-test_pearson_max": 0.2979259445723872,
-      "eval_sts-test_spearman_cosine": 0.1066788491614481,
-      "eval_sts-test_spearman_dot": 0.315952670306405,
-      "eval_sts-test_spearman_euclidean": 0.07303394554435191,
-      "eval_sts-test_spearman_manhattan": 0.09039525717692232,
-      "eval_sts-test_spearman_max": 0.315952670306405,
-      "eval_vitaminc-pairs_loss": 2.698580741882324,
-      "eval_vitaminc-pairs_runtime": 1.4747,
-      "eval_vitaminc-pairs_samples_per_second": 73.236,
-      "eval_vitaminc-pairs_steps_per_second": 1.356,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_negation-triplets_loss": 5.142906665802002,
-      "eval_negation-triplets_runtime": 0.2993,
-      "eval_negation-triplets_samples_per_second": 213.865,
-      "eval_negation-triplets_steps_per_second": 3.342,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_scitail-pairs-pos_loss": 1.9216958284378052,
-      "eval_scitail-pairs-pos_runtime": 0.3834,
-      "eval_scitail-pairs-pos_samples_per_second": 140.842,
-      "eval_scitail-pairs-pos_steps_per_second": 2.608,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_xsum-pairs_loss": 6.073049545288086,
-      "eval_xsum-pairs_runtime": 3.1587,
-      "eval_xsum-pairs_samples_per_second": 40.523,
-      "eval_xsum-pairs_steps_per_second": 0.633,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_sciq_pairs_loss": 0.3449864387512207,
-      "eval_sciq_pairs_runtime": 3.3747,
-      "eval_sciq_pairs_samples_per_second": 37.93,
-      "eval_sciq_pairs_steps_per_second": 0.593,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_qasc_pairs_loss": 3.2267842292785645,
-      "eval_qasc_pairs_runtime": 0.6576,
-      "eval_qasc_pairs_samples_per_second": 194.646,
-      "eval_qasc_pairs_steps_per_second": 3.041,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_openbookqa_pairs_loss": 4.405983924865723,
-      "eval_openbookqa_pairs_runtime": 0.6107,
-      "eval_openbookqa_pairs_samples_per_second": 209.594,
-      "eval_openbookqa_pairs_steps_per_second": 3.275,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_msmarco_pairs_loss": 6.937691688537598,
-      "eval_msmarco_pairs_runtime": 1.3091,
-      "eval_msmarco_pairs_samples_per_second": 97.779,
-      "eval_msmarco_pairs_steps_per_second": 1.528,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_nq_pairs_loss": 6.794108867645264,
-      "eval_nq_pairs_runtime": 2.3968,
-      "eval_nq_pairs_samples_per_second": 53.404,
-      "eval_nq_pairs_steps_per_second": 0.834,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_trivia_pairs_loss": 6.3355631828308105,
-      "eval_trivia_pairs_runtime": 4.4974,
-      "eval_trivia_pairs_samples_per_second": 28.461,
-      "eval_trivia_pairs_steps_per_second": 0.445,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_gooaq_pairs_loss": 6.405998706817627,
-      "eval_gooaq_pairs_runtime": 0.8745,
-      "eval_gooaq_pairs_samples_per_second": 146.37,
-      "eval_gooaq_pairs_steps_per_second": 2.287,
       "step": 27
     },
     {
-      "epoch": 0.1524347212420607,
-      "eval_paws-pos_loss": 2.2308223247528076,
-      "eval_paws-pos_runtime": 0.6998,
-      "eval_paws-pos_samples_per_second": 182.908,
-      "eval_paws-pos_steps_per_second": 2.858,
       "step": 27
     },
     {
-      "epoch": 0.16937191249117856,
-      "grad_norm": 5.885251522064209,
-      "learning_rate": 6.818181818181818e-06,
-      "loss": 5.7653,
       "step": 30
     },
     {
-      "epoch": 0.1863091037402964,
-      "grad_norm": 7.357480049133301,
-      "learning_rate": 7.500000000000001e-06,
-      "loss": 6.1259,
       "step": 33
     },
     {
-      "epoch": 0.20324629498941427,
-      "grad_norm": 7.321795463562012,
-      "learning_rate": 8.181818181818183e-06,
-      "loss": 5.7539,
       "step": 36
     },
     {
-      "epoch": 0.22018348623853212,
-      "grad_norm": 4.239792346954346,
-      "learning_rate": 8.863636363636365e-06,
-      "loss": 6.0131,
       "step": 39
     },
     {
-      "epoch": 0.23712067748764998,
-      "grad_norm": 3.9554407596588135,
-      "learning_rate": 9.545454545454547e-06,
-      "loss": 6.0074,
       "step": 42
     },
     {
-      "epoch": 0.25405786873676783,
-      "grad_norm": 4.406026840209961,
-      "learning_rate": 1.0227272727272729e-05,
-      "loss": 5.7125,
       "step": 45
     },
     {
-      "epoch": 0.2709950599858857,
-      "grad_norm": 7.235893249511719,
-      "learning_rate": 1.0909090909090909e-05,
-      "loss": 5.5634,
       "step": 48
     },
     {
-      "epoch": 0.28793225123500354,
-      "grad_norm": 5.330288410186768,
-      "learning_rate": 1.1590909090909093e-05,
-      "loss": 5.2924,
       "step": 51
     },
     {
-      "epoch": 0.3048694424841214,
-      "grad_norm": 7.216403961181641,
-      "learning_rate": 1.2272727272727274e-05,
-      "loss": 5.2286,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
       "eval_NLI-v2_cosine_accuracy": 1.0,
-      "eval_NLI-v2_dot_accuracy": 0.046875,
       "eval_NLI-v2_euclidean_accuracy": 1.0,
       "eval_NLI-v2_manhattan_accuracy": 1.0,
       "eval_NLI-v2_max_accuracy": 1.0,
-      "eval_VitaminC_cosine_accuracy": 0.54296875,
-      "eval_VitaminC_cosine_accuracy_threshold": 0.9328227043151855,
-      "eval_VitaminC_cosine_ap": 0.5212059026196154,
-      "eval_VitaminC_cosine_f1": 0.6576819407008085,
-      "eval_VitaminC_cosine_f1_threshold": 0.7373804450035095,
-      "eval_VitaminC_cosine_precision": 0.49193548387096775,
-      "eval_VitaminC_cosine_recall": 0.991869918699187,
-      "eval_VitaminC_dot_accuracy": 0.55078125,
-      "eval_VitaminC_dot_accuracy_threshold": 418.2774658203125,
-      "eval_VitaminC_dot_ap": 0.5160594099493883,
-      "eval_VitaminC_dot_f1": 0.6521739130434782,
-      "eval_VitaminC_dot_f1_threshold": 291.5081481933594,
-      "eval_VitaminC_dot_precision": 0.4897959183673469,
-      "eval_VitaminC_dot_recall": 0.975609756097561,
-      "eval_VitaminC_euclidean_accuracy": 0.5390625,
-      "eval_VitaminC_euclidean_accuracy_threshold": 8.120429039001465,
-      "eval_VitaminC_euclidean_ap": 0.5224837623095228,
-      "eval_VitaminC_euclidean_f1": 0.6576819407008085,
-      "eval_VitaminC_euclidean_f1_threshold": 14.879999160766602,
-      "eval_VitaminC_euclidean_precision": 0.49193548387096775,
-      "eval_VitaminC_euclidean_recall": 0.991869918699187,
-      "eval_VitaminC_manhattan_accuracy": 0.53515625,
-      "eval_VitaminC_manhattan_accuracy_threshold": 137.40658569335938,
-      "eval_VitaminC_manhattan_ap": 0.5186382518671783,
-      "eval_VitaminC_manhattan_f1": 0.6576086956521738,
-      "eval_VitaminC_manhattan_f1_threshold": 263.32452392578125,
-      "eval_VitaminC_manhattan_precision": 0.49387755102040815,
-      "eval_VitaminC_manhattan_recall": 0.983739837398374,
-      "eval_VitaminC_max_accuracy": 0.55078125,
-      "eval_VitaminC_max_accuracy_threshold": 418.2774658203125,
-      "eval_VitaminC_max_ap": 0.5224837623095228,
-      "eval_VitaminC_max_f1": 0.6576819407008085,
-      "eval_VitaminC_max_f1_threshold": 291.5081481933594,
-      "eval_VitaminC_max_precision": 0.49387755102040815,
-      "eval_VitaminC_max_recall": 0.991869918699187,
-      "eval_sequential_score": 0.5224837623095228,
-      "eval_sts-test_pearson_cosine": 0.14377091128453176,
-      "eval_sts-test_pearson_dot": 0.24728387094758872,
-      "eval_sts-test_pearson_euclidean": 0.14604155960515372,
-      "eval_sts-test_pearson_manhattan": 0.1446467532231986,
-      "eval_sts-test_pearson_max": 0.24728387094758872,
-      "eval_sts-test_spearman_cosine": 0.1968510434344728,
-      "eval_sts-test_spearman_dot": 0.29467218283745694,
-      "eval_sts-test_spearman_euclidean": 0.17218164683969664,
-      "eval_sts-test_spearman_manhattan": 0.17741843340856742,
-      "eval_sts-test_spearman_max": 0.29467218283745694,
-      "eval_vitaminc-pairs_loss": 2.664700746536255,
-      "eval_vitaminc-pairs_runtime": 1.4487,
-      "eval_vitaminc-pairs_samples_per_second": 74.551,
-      "eval_vitaminc-pairs_steps_per_second": 1.381,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_negation-triplets_loss": 4.6218037605285645,
-      "eval_negation-triplets_runtime": 0.2971,
-      "eval_negation-triplets_samples_per_second": 215.438,
-      "eval_negation-triplets_steps_per_second": 3.366,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_scitail-pairs-pos_loss": 1.2413936853408813,
-      "eval_scitail-pairs-pos_runtime": 0.372,
-      "eval_scitail-pairs-pos_samples_per_second": 145.175,
-      "eval_scitail-pairs-pos_steps_per_second": 2.688,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_xsum-pairs_loss": 5.249766826629639,
-      "eval_xsum-pairs_runtime": 3.1506,
-      "eval_xsum-pairs_samples_per_second": 40.627,
-      "eval_xsum-pairs_steps_per_second": 0.635,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_sciq_pairs_loss": 0.2961578667163849,
-      "eval_sciq_pairs_runtime": 3.2909,
-      "eval_sciq_pairs_samples_per_second": 38.895,
-      "eval_sciq_pairs_steps_per_second": 0.608,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_qasc_pairs_loss": 2.530872344970703,
-      "eval_qasc_pairs_runtime": 0.6255,
-      "eval_qasc_pairs_samples_per_second": 204.63,
-      "eval_qasc_pairs_steps_per_second": 3.197,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_openbookqa_pairs_loss": 3.8855104446411133,
-      "eval_openbookqa_pairs_runtime": 0.5742,
-      "eval_openbookqa_pairs_samples_per_second": 222.914,
-      "eval_openbookqa_pairs_steps_per_second": 3.483,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_msmarco_pairs_loss": 5.246406555175781,
-      "eval_msmarco_pairs_runtime": 1.2872,
-      "eval_msmarco_pairs_samples_per_second": 99.442,
-      "eval_msmarco_pairs_steps_per_second": 1.554,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_nq_pairs_loss": 5.332630157470703,
-      "eval_nq_pairs_runtime": 2.3739,
-      "eval_nq_pairs_samples_per_second": 53.92,
-      "eval_nq_pairs_steps_per_second": 0.843,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_trivia_pairs_loss": 5.647429943084717,
-      "eval_trivia_pairs_runtime": 4.4729,
-      "eval_trivia_pairs_samples_per_second": 28.617,
-      "eval_trivia_pairs_steps_per_second": 0.447,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_gooaq_pairs_loss": 5.225871562957764,
-      "eval_gooaq_pairs_runtime": 0.8715,
-      "eval_gooaq_pairs_samples_per_second": 146.868,
-      "eval_gooaq_pairs_steps_per_second": 2.295,
       "step": 54
     },
     {
-      "epoch": 0.3048694424841214,
-      "eval_paws-pos_loss": 0.8335962891578674,
-      "eval_paws-pos_runtime": 0.6844,
-      "eval_paws-pos_samples_per_second": 187.036,
-      "eval_paws-pos_steps_per_second": 2.922,
       "step": 54
     },
     {
-      "epoch": 0.32180663373323926,
-      "grad_norm": 6.847682952880859,
-      "learning_rate": 1.2954545454545455e-05,
-      "loss": 4.4811,
       "step": 57
     },
     {
-      "epoch": 0.3387438249823571,
-      "grad_norm": 8.383002281188965,
-      "learning_rate": 1.3636363636363637e-05,
-      "loss": 4.4239,
       "step": 60
     },
     {
-      "epoch": 0.35568101623147497,
-      "grad_norm": 7.014843463897705,
-      "learning_rate": 1.431818181818182e-05,
-      "loss": 4.0273,
       "step": 63
     },
     {
-      "epoch": 0.3726182074805928,
-      "grad_norm": 5.9739885330200195,
-      "learning_rate": 1.5000000000000002e-05,
-      "loss": 3.4508,
       "step": 66
     },
     {
-      "epoch": 0.3895553987297107,
-      "grad_norm": 11.202752113342285,
-      "learning_rate": 1.5681818181818182e-05,
-      "loss": 3.9702,
       "step": 69
     },
     {
-      "epoch": 0.40649258997882853,
-      "grad_norm": 7.064818859100342,
-      "learning_rate": 1.6363636363636366e-05,
-      "loss": 3.5295,
       "step": 72
     },
     {
-      "epoch": 0.4234297812279464,
-      "grad_norm": 5.912719249725342,
-      "learning_rate": 1.7045454545454546e-05,
-      "loss": 3.6395,
       "step": 75
     },
     {
-      "epoch": 0.44036697247706424,
-      "grad_norm": 5.033207893371582,
-      "learning_rate": 1.772727272727273e-05,
-      "loss": 3.2398,
       "step": 78
     },
     {
-      "epoch": 0.4573041637261821,
-      "grad_norm": 5.218384265899658,
-      "learning_rate": 1.840909090909091e-05,
-      "loss": 3.116,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
       "eval_NLI-v2_cosine_accuracy": 1.0,
       "eval_NLI-v2_dot_accuracy": 0.0,
       "eval_NLI-v2_euclidean_accuracy": 1.0,
       "eval_NLI-v2_manhattan_accuracy": 1.0,
       "eval_NLI-v2_max_accuracy": 1.0,
-      "eval_VitaminC_cosine_accuracy": 0.5546875,
-      "eval_VitaminC_cosine_accuracy_threshold": 0.9041332006454468,
-      "eval_VitaminC_cosine_ap": 0.5292859731465609,
-      "eval_VitaminC_cosine_f1": 0.6542553191489362,
-      "eval_VitaminC_cosine_f1_threshold": 0.452939510345459,
-      "eval_VitaminC_cosine_precision": 0.48616600790513836,
       "eval_VitaminC_cosine_recall": 1.0,
-      "eval_VitaminC_dot_accuracy": 0.5546875,
-      "eval_VitaminC_dot_accuracy_threshold": 414.42559814453125,
-      "eval_VitaminC_dot_ap": 0.5222732504955002,
-      "eval_VitaminC_dot_f1": 0.6542553191489362,
-      "eval_VitaminC_dot_f1_threshold": 212.6934814453125,
-      "eval_VitaminC_dot_precision": 0.48616600790513836,
       "eval_VitaminC_dot_recall": 1.0,
-      "eval_VitaminC_euclidean_accuracy": 0.5546875,
-      "eval_VitaminC_euclidean_accuracy_threshold": 9.18377685546875,
-      "eval_VitaminC_euclidean_ap": 0.5291787221346742,
-      "eval_VitaminC_euclidean_f1": 0.6542553191489362,
-      "eval_VitaminC_euclidean_f1_threshold": 22.683509826660156,
-      "eval_VitaminC_euclidean_precision": 0.48616600790513836,
       "eval_VitaminC_euclidean_recall": 1.0,
-      "eval_VitaminC_manhattan_accuracy": 0.55859375,
-      "eval_VitaminC_manhattan_accuracy_threshold": 173.8212127685547,
-      "eval_VitaminC_manhattan_ap": 0.5305698453165033,
-      "eval_VitaminC_manhattan_f1": 0.6542553191489362,
-      "eval_VitaminC_manhattan_f1_threshold": 415.5366516113281,
-      "eval_VitaminC_manhattan_precision": 0.48616600790513836,
-      "eval_VitaminC_manhattan_recall": 1.0,
-      "eval_VitaminC_max_accuracy": 0.55859375,
-      "eval_VitaminC_max_accuracy_threshold": 414.42559814453125,
-      "eval_VitaminC_max_ap": 0.5305698453165033,
-      "eval_VitaminC_max_f1": 0.6542553191489362,
-      "eval_VitaminC_max_f1_threshold": 415.5366516113281,
-      "eval_VitaminC_max_precision": 0.48616600790513836,
       "eval_VitaminC_max_recall": 1.0,
-      "eval_sequential_score": 0.5305698453165033,
-      "eval_sts-test_pearson_cosine": 0.45494716382349193,
-      "eval_sts-test_pearson_dot": 0.44837123659858896,
-      "eval_sts-test_pearson_euclidean": 0.4480861256491879,
-      "eval_sts-test_pearson_manhattan": 0.4417008219313264,
-      "eval_sts-test_pearson_max": 0.45494716382349193,
-      "eval_sts-test_spearman_cosine": 0.48921418507251446,
-      "eval_sts-test_spearman_dot": 0.46707725062744593,
-      "eval_sts-test_spearman_euclidean": 0.4610824798409968,
-      "eval_sts-test_spearman_manhattan": 0.46068648052845956,
-      "eval_sts-test_spearman_max": 0.48921418507251446,
-      "eval_vitaminc-pairs_loss": 2.5043575763702393,
-      "eval_vitaminc-pairs_runtime": 1.4778,
-      "eval_vitaminc-pairs_samples_per_second": 73.079,
-      "eval_vitaminc-pairs_steps_per_second": 1.353,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_negation-triplets_loss": 3.4229447841644287,
-      "eval_negation-triplets_runtime": 0.2991,
-      "eval_negation-triplets_samples_per_second": 213.954,
-      "eval_negation-triplets_steps_per_second": 3.343,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_scitail-pairs-pos_loss": 0.2784869372844696,
-      "eval_scitail-pairs-pos_runtime": 0.3633,
-      "eval_scitail-pairs-pos_samples_per_second": 148.649,
-      "eval_scitail-pairs-pos_steps_per_second": 2.753,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_xsum-pairs_loss": 2.428964614868164,
-      "eval_xsum-pairs_runtime": 3.1548,
-      "eval_xsum-pairs_samples_per_second": 40.573,
-      "eval_xsum-pairs_steps_per_second": 0.634,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_sciq_pairs_loss": 0.15256048738956451,
-      "eval_sciq_pairs_runtime": 3.2432,
-      "eval_sciq_pairs_samples_per_second": 39.467,
-      "eval_sciq_pairs_steps_per_second": 0.617,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_qasc_pairs_loss": 1.2902077436447144,
-      "eval_qasc_pairs_runtime": 0.6211,
-      "eval_qasc_pairs_samples_per_second": 206.085,
-      "eval_qasc_pairs_steps_per_second": 3.22,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_openbookqa_pairs_loss": 2.4784862995147705,
-      "eval_openbookqa_pairs_runtime": 0.5758,
-      "eval_openbookqa_pairs_samples_per_second": 222.308,
-      "eval_openbookqa_pairs_steps_per_second": 3.474,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_msmarco_pairs_loss": 2.967724084854126,
-      "eval_msmarco_pairs_runtime": 1.2944,
-      "eval_msmarco_pairs_samples_per_second": 98.885,
-      "eval_msmarco_pairs_steps_per_second": 1.545,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_nq_pairs_loss": 3.358661413192749,
-      "eval_nq_pairs_runtime": 2.3827,
-      "eval_nq_pairs_samples_per_second": 53.722,
-      "eval_nq_pairs_steps_per_second": 0.839,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_trivia_pairs_loss": 3.1391680240631104,
-      "eval_trivia_pairs_runtime": 4.4155,
-      "eval_trivia_pairs_samples_per_second": 28.989,
-      "eval_trivia_pairs_steps_per_second": 0.453,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_gooaq_pairs_loss": 2.8774912357330322,
-      "eval_gooaq_pairs_runtime": 0.8746,
-      "eval_gooaq_pairs_samples_per_second": 146.346,
-      "eval_gooaq_pairs_steps_per_second": 2.287,
       "step": 81
     },
     {
-      "epoch": 0.4573041637261821,
-      "eval_paws-pos_loss": 0.19754411280155182,
-      "eval_paws-pos_runtime": 0.684,
-      "eval_paws-pos_samples_per_second": 187.141,
-      "eval_paws-pos_steps_per_second": 2.924,
       "step": 81
     },
     {
-      "epoch": 0.47424135497529996,
-      "grad_norm": 5.149569988250732,
-      "learning_rate": 1.9090909090909094e-05,
-      "loss": 2.6049,
       "step": 84
     },
     {
-      "epoch": 0.4911785462244178,
-      "grad_norm": 5.012928009033203,
-      "learning_rate": 1.9772727272727274e-05,
-      "loss": 2.7738,
       "step": 87
     },
     {
-      "epoch": 0.5081157374735357,
-      "grad_norm": 4.880725383758545,
-      "learning_rate": 2.0454545454545457e-05,
-      "loss": 2.5416,
       "step": 90
     },
     {
-      "epoch": 0.5250529287226535,
-      "grad_norm": 5.618528366088867,
-      "learning_rate": 2.113636363636364e-05,
-      "loss": 2.3913,
       "step": 93
     },
     {
-      "epoch": 0.5419901199717714,
-      "grad_norm": 5.020515441894531,
-      "learning_rate": 2.1818181818181818e-05,
-      "loss": 2.3144,
       "step": 96
     },
     {
-      "epoch": 0.5589273112208892,
-      "grad_norm": 4.818451404571533,
-      "learning_rate": 2.25e-05,
-      "loss": 2.1857,
       "step": 99
     },
     {
-      "epoch": 0.5758645024700071,
-      "grad_norm": 5.094771385192871,
-      "learning_rate": 2.3181818181818185e-05,
-      "loss": 1.8881,
       "step": 102
     },
     {
-      "epoch": 0.592801693719125,
-      "grad_norm": 3.795962333679199,
-      "learning_rate": 2.3863636363636365e-05,
-      "loss": 2.2699,
       "step": 105
     }
   ],
   "logging_steps": 3,
-  "max_steps": 531,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 3,
   "save_steps": 107,
@@ -713,7 +713,7 @@
     }
   },
   "total_flos": 0.0,
-  "train_batch_size": 160,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.601123595505618,
   "eval_steps": 27,
   "global_step": 107,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.016853932584269662,
+      "grad_norm": 2.9885776042938232,
+      "learning_rate": 1.4814814814814815e-06,
+      "loss": 0.6012,
       "step": 3
     },
     {
+      "epoch": 0.033707865168539325,
+      "grad_norm": 3.184929132461548,
+      "learning_rate": 2.962962962962963e-06,
+      "loss": 0.7573,
       "step": 6
     },
     {
+      "epoch": 0.05056179775280899,
+      "grad_norm": 3.256159782409668,
+      "learning_rate": 4.444444444444444e-06,
+      "loss": 0.9212,
       "step": 9
     },
     {
+      "epoch": 0.06741573033707865,
+      "grad_norm": 2.833339214324951,
+      "learning_rate": 5.925925925925926e-06,
+      "loss": 0.6117,
       "step": 12
     },
     {
+      "epoch": 0.08426966292134831,
+      "grad_norm": 3.08292818069458,
+      "learning_rate": 7.4074074074074075e-06,
+      "loss": 0.8545,
       "step": 15
     },
     {
+      "epoch": 0.10112359550561797,
+      "grad_norm": 2.317431688308716,
+      "learning_rate": 8.888888888888888e-06,
+      "loss": 0.6515,
       "step": 18
     },
     {
+      "epoch": 0.11797752808988764,
+      "grad_norm": 2.9611644744873047,
+      "learning_rate": 1.037037037037037e-05,
+      "loss": 0.7159,
       "step": 21
     },
     {
+      "epoch": 0.1348314606741573,
+      "grad_norm": 2.698537826538086,
+      "learning_rate": 1.1851851851851852e-05,
+      "loss": 0.7019,
       "step": 24
     },
     {
+      "epoch": 0.15168539325842698,
+      "grad_norm": 2.222154378890991,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.4411,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
       "eval_NLI-v2_cosine_accuracy": 1.0,
+      "eval_NLI-v2_dot_accuracy": 0.0,
       "eval_NLI-v2_euclidean_accuracy": 1.0,
       "eval_NLI-v2_manhattan_accuracy": 1.0,
       "eval_NLI-v2_max_accuracy": 1.0,
+      "eval_VitaminC_cosine_accuracy": 0.578125,
+      "eval_VitaminC_cosine_accuracy_threshold": 0.7817381620407104,
+      "eval_VitaminC_cosine_ap": 0.5507972943944112,
+      "eval_VitaminC_cosine_f1": 0.6595174262734584,
+      "eval_VitaminC_cosine_f1_threshold": 0.28573715686798096,
+      "eval_VitaminC_cosine_precision": 0.492,
       "eval_VitaminC_cosine_recall": 1.0,
+      "eval_VitaminC_dot_accuracy": 0.5703125,
+      "eval_VitaminC_dot_accuracy_threshold": 316.7283020019531,
+      "eval_VitaminC_dot_ap": 0.5511866185449577,
+      "eval_VitaminC_dot_f1": 0.6577540106951871,
+      "eval_VitaminC_dot_f1_threshold": 106.75863647460938,
+      "eval_VitaminC_dot_precision": 0.4900398406374502,
       "eval_VitaminC_dot_recall": 1.0,
+      "eval_VitaminC_euclidean_accuracy": 0.578125,
+      "eval_VitaminC_euclidean_accuracy_threshold": 13.298419952392578,
+      "eval_VitaminC_euclidean_ap": 0.5476323986807207,
+      "eval_VitaminC_euclidean_f1": 0.6577540106951871,
+      "eval_VitaminC_euclidean_f1_threshold": 23.83933448791504,
+      "eval_VitaminC_euclidean_precision": 0.4900398406374502,
+      "eval_VitaminC_euclidean_recall": 1.0,
+      "eval_VitaminC_manhattan_accuracy": 0.578125,
+      "eval_VitaminC_manhattan_accuracy_threshold": 279.69085693359375,
+      "eval_VitaminC_manhattan_ap": 0.5412538781107805,
+      "eval_VitaminC_manhattan_f1": 0.6577540106951871,
+      "eval_VitaminC_manhattan_f1_threshold": 499.8836364746094,
+      "eval_VitaminC_manhattan_precision": 0.4900398406374502,
       "eval_VitaminC_manhattan_recall": 1.0,
+      "eval_VitaminC_max_accuracy": 0.578125,
+      "eval_VitaminC_max_accuracy_threshold": 316.7283020019531,
+      "eval_VitaminC_max_ap": 0.5511866185449577,
+      "eval_VitaminC_max_f1": 0.6595174262734584,
+      "eval_VitaminC_max_f1_threshold": 499.8836364746094,
+      "eval_VitaminC_max_precision": 0.492,
       "eval_VitaminC_max_recall": 1.0,
+      "eval_sequential_score": 0.5511866185449577,
+      "eval_sts-test_pearson_cosine": 0.8488243436029344,
+      "eval_sts-test_pearson_dot": 0.8480167969551653,
+      "eval_sts-test_pearson_euclidean": 0.8800283985117625,
+      "eval_sts-test_pearson_manhattan": 0.880588311422627,
+      "eval_sts-test_pearson_max": 0.880588311422627,
+      "eval_sts-test_spearman_cosine": 0.8905659331642088,
+      "eval_sts-test_spearman_dot": 0.8692084657204004,
+      "eval_sts-test_spearman_euclidean": 0.8809566840232712,
+      "eval_sts-test_spearman_manhattan": 0.883434007028195,
+      "eval_sts-test_spearman_max": 0.8905659331642088,
+      "eval_vitaminc-pairs_loss": 2.465860366821289,
+      "eval_vitaminc-pairs_runtime": 1.4615,
+      "eval_vitaminc-pairs_samples_per_second": 73.899,
+      "eval_vitaminc-pairs_steps_per_second": 1.368,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_negation-triplets_loss": 1.7310789823532104,
+      "eval_negation-triplets_runtime": 0.3009,
+      "eval_negation-triplets_samples_per_second": 212.692,
+      "eval_negation-triplets_steps_per_second": 3.323,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_scitail-pairs-pos_loss": 0.1150394082069397,
+      "eval_scitail-pairs-pos_runtime": 0.3739,
+      "eval_scitail-pairs-pos_samples_per_second": 144.431,
+      "eval_scitail-pairs-pos_steps_per_second": 2.675,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_xsum-pairs_loss": 0.11168850213289261,
+      "eval_xsum-pairs_runtime": 3.1697,
+      "eval_xsum-pairs_samples_per_second": 40.382,
+      "eval_xsum-pairs_steps_per_second": 0.631,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_sciq_pairs_loss": 0.03450964391231537,
+      "eval_sciq_pairs_runtime": 3.3283,
+      "eval_sciq_pairs_samples_per_second": 38.459,
+      "eval_sciq_pairs_steps_per_second": 0.601,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_qasc_pairs_loss": 0.11095743626356125,
+      "eval_qasc_pairs_runtime": 0.6261,
+      "eval_qasc_pairs_samples_per_second": 204.45,
+      "eval_qasc_pairs_steps_per_second": 3.195,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_openbookqa_pairs_loss": 0.7092063426971436,
+      "eval_openbookqa_pairs_runtime": 0.5866,
+      "eval_openbookqa_pairs_samples_per_second": 218.19,
+      "eval_openbookqa_pairs_steps_per_second": 3.409,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_msmarco_pairs_loss": 0.3955218493938446,
+      "eval_msmarco_pairs_runtime": 1.2942,
+      "eval_msmarco_pairs_samples_per_second": 98.902,
+      "eval_msmarco_pairs_steps_per_second": 1.545,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_nq_pairs_loss": 0.42051073908805847,
+      "eval_nq_pairs_runtime": 2.3875,
+      "eval_nq_pairs_samples_per_second": 53.612,
+      "eval_nq_pairs_steps_per_second": 0.838,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_trivia_pairs_loss": 0.93178790807724,
+      "eval_trivia_pairs_runtime": 4.4363,
+      "eval_trivia_pairs_samples_per_second": 28.853,
+      "eval_trivia_pairs_steps_per_second": 0.451,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_gooaq_pairs_loss": 0.6505913138389587,
+      "eval_gooaq_pairs_runtime": 0.8826,
+      "eval_gooaq_pairs_samples_per_second": 145.027,
+      "eval_gooaq_pairs_steps_per_second": 2.266,
       "step": 27
     },
     {
+      "epoch": 0.15168539325842698,
+      "eval_paws-pos_loss": 0.024931101128458977,
+      "eval_paws-pos_runtime": 0.6852,
+      "eval_paws-pos_samples_per_second": 186.805,
+      "eval_paws-pos_steps_per_second": 2.919,
       "step": 27
     },
     {
+      "epoch": 0.16853932584269662,
+      "grad_norm": 2.826900005340576,
+      "learning_rate": 1.4814814814814815e-05,
+      "loss": 0.5125,
       "step": 30
     },
     {
+      "epoch": 0.1853932584269663,
+      "grad_norm": 2.9938910007476807,
+      "learning_rate": 1.6296296296296297e-05,
+      "loss": 0.6885,
       "step": 33
     },
     {
+      "epoch": 0.20224719101123595,
+      "grad_norm": 3.3046395778656006,
+      "learning_rate": 1.7777777777777777e-05,
+      "loss": 0.6435,
       "step": 36
     },
     {
+      "epoch": 0.21910112359550563,
+      "grad_norm": 2.4184651374816895,
+      "learning_rate": 1.925925925925926e-05,
+      "loss": 0.753,
       "step": 39
     },
     {
+      "epoch": 0.23595505617977527,
+      "grad_norm": 2.9905433654785156,
+      "learning_rate": 2.074074074074074e-05,
+      "loss": 0.7427,
       "step": 42
     },
     {
+      "epoch": 0.25280898876404495,
+      "grad_norm": 2.745820999145508,
+      "learning_rate": 2.2222222222222227e-05,
+      "loss": 0.5083,
       "step": 45
     },
     {
+      "epoch": 0.2696629213483146,
+      "grad_norm": 2.6370577812194824,
+      "learning_rate": 2.3703703703703703e-05,
+      "loss": 0.7454,
       "step": 48
     },
     {
+      "epoch": 0.28651685393258425,
+      "grad_norm": 3.044011116027832,
+      "learning_rate": 2.5185185185185187e-05,
+      "loss": 0.8356,
       "step": 51
     },
     {
+      "epoch": 0.30337078651685395,
+      "grad_norm": 3.718804121017456,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.8864,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
       "eval_NLI-v2_cosine_accuracy": 1.0,
+      "eval_NLI-v2_dot_accuracy": 0.0,
       "eval_NLI-v2_euclidean_accuracy": 1.0,
       "eval_NLI-v2_manhattan_accuracy": 1.0,
       "eval_NLI-v2_max_accuracy": 1.0,
+      "eval_VitaminC_cosine_accuracy": 0.57421875,
+      "eval_VitaminC_cosine_accuracy_threshold": 0.7991844415664673,
+      "eval_VitaminC_cosine_ap": 0.5485498837322925,
+      "eval_VitaminC_cosine_f1": 0.6595174262734584,
+      "eval_VitaminC_cosine_f1_threshold": 0.3160865008831024,
+      "eval_VitaminC_cosine_precision": 0.492,
+      "eval_VitaminC_cosine_recall": 1.0,
+      "eval_VitaminC_dot_accuracy": 0.578125,
+      "eval_VitaminC_dot_accuracy_threshold": 327.0416564941406,
+      "eval_VitaminC_dot_ap": 0.54993134882601,
+      "eval_VitaminC_dot_f1": 0.6595174262734584,
+      "eval_VitaminC_dot_f1_threshold": 117.44181060791016,
+      "eval_VitaminC_dot_precision": 0.492,
+      "eval_VitaminC_dot_recall": 1.0,
+      "eval_VitaminC_euclidean_accuracy": 0.57421875,
+      "eval_VitaminC_euclidean_accuracy_threshold": 13.019258499145508,
+      "eval_VitaminC_euclidean_ap": 0.5435066540334542,
+      "eval_VitaminC_euclidean_f1": 0.6577540106951871,
+      "eval_VitaminC_euclidean_f1_threshold": 23.688644409179688,
+      "eval_VitaminC_euclidean_precision": 0.4900398406374502,
+      "eval_VitaminC_euclidean_recall": 1.0,
+      "eval_VitaminC_manhattan_accuracy": 0.57421875,
+      "eval_VitaminC_manhattan_accuracy_threshold": 283.876220703125,
+      "eval_VitaminC_manhattan_ap": 0.5416615397828658,
+      "eval_VitaminC_manhattan_f1": 0.6559999999999999,
+      "eval_VitaminC_manhattan_f1_threshold": 514.0216064453125,
+      "eval_VitaminC_manhattan_precision": 0.4880952380952381,
+      "eval_VitaminC_manhattan_recall": 1.0,
+      "eval_VitaminC_max_accuracy": 0.578125,
+      "eval_VitaminC_max_accuracy_threshold": 327.0416564941406,
+      "eval_VitaminC_max_ap": 0.54993134882601,
+      "eval_VitaminC_max_f1": 0.6595174262734584,
+      "eval_VitaminC_max_f1_threshold": 514.0216064453125,
+      "eval_VitaminC_max_precision": 0.492,
+      "eval_VitaminC_max_recall": 1.0,
+      "eval_sequential_score": 0.54993134882601,
+      "eval_sts-test_pearson_cosine": 0.8452615878553369,
+      "eval_sts-test_pearson_dot": 0.8404858620687519,
+      "eval_sts-test_pearson_euclidean": 0.8780527810910925,
+      "eval_sts-test_pearson_manhattan": 0.878916157345712,
+      "eval_sts-test_pearson_max": 0.878916157345712,
+      "eval_sts-test_spearman_cosine": 0.8876915367075635,
+      "eval_sts-test_spearman_dot": 0.8608104875327304,
+      "eval_sts-test_spearman_euclidean": 0.8804138856889071,
+      "eval_sts-test_spearman_manhattan": 0.8822803815444743,
+      "eval_sts-test_spearman_max": 0.8876915367075635,
+      "eval_vitaminc-pairs_loss": 2.454524040222168,
+      "eval_vitaminc-pairs_runtime": 1.4583,
+      "eval_vitaminc-pairs_samples_per_second": 74.057,
+      "eval_vitaminc-pairs_steps_per_second": 1.371,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_negation-triplets_loss": 1.7277792692184448,
+      "eval_negation-triplets_runtime": 0.3027,
+      "eval_negation-triplets_samples_per_second": 211.436,
+      "eval_negation-triplets_steps_per_second": 3.304,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_scitail-pairs-pos_loss": 0.11168555170297623,
+      "eval_scitail-pairs-pos_runtime": 0.3726,
+      "eval_scitail-pairs-pos_samples_per_second": 144.911,
+      "eval_scitail-pairs-pos_steps_per_second": 2.684,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_xsum-pairs_loss": 0.10087604075670242,
+      "eval_xsum-pairs_runtime": 3.1701,
+      "eval_xsum-pairs_samples_per_second": 40.377,
+      "eval_xsum-pairs_steps_per_second": 0.631,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_sciq_pairs_loss": 0.03466618433594704,
+      "eval_sciq_pairs_runtime": 3.3778,
+      "eval_sciq_pairs_samples_per_second": 37.895,
+      "eval_sciq_pairs_steps_per_second": 0.592,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_qasc_pairs_loss": 0.10551701486110687,
+      "eval_qasc_pairs_runtime": 0.6271,
+      "eval_qasc_pairs_samples_per_second": 204.125,
+      "eval_qasc_pairs_steps_per_second": 3.189,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_openbookqa_pairs_loss": 0.7239958643913269,
+      "eval_openbookqa_pairs_runtime": 0.5811,
+      "eval_openbookqa_pairs_samples_per_second": 220.255,
+      "eval_openbookqa_pairs_steps_per_second": 3.441,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_msmarco_pairs_loss": 0.3808779716491699,
+      "eval_msmarco_pairs_runtime": 1.2919,
+      "eval_msmarco_pairs_samples_per_second": 99.082,
+      "eval_msmarco_pairs_steps_per_second": 1.548,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_nq_pairs_loss": 0.44170400500297546,
+      "eval_nq_pairs_runtime": 2.3835,
+      "eval_nq_pairs_samples_per_second": 53.703,
+      "eval_nq_pairs_steps_per_second": 0.839,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_trivia_pairs_loss": 0.9158428907394409,
+      "eval_trivia_pairs_runtime": 4.4326,
+      "eval_trivia_pairs_samples_per_second": 28.877,
+      "eval_trivia_pairs_steps_per_second": 0.451,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_gooaq_pairs_loss": 0.6208247542381287,
+      "eval_gooaq_pairs_runtime": 0.8797,
+      "eval_gooaq_pairs_samples_per_second": 145.497,
+      "eval_gooaq_pairs_steps_per_second": 2.273,
       "step": 54
     },
     {
+      "epoch": 0.30337078651685395,
+      "eval_paws-pos_loss": 0.02517784759402275,
+      "eval_paws-pos_runtime": 0.694,
+      "eval_paws-pos_samples_per_second": 184.442,
+      "eval_paws-pos_steps_per_second": 2.882,
       "step": 54
     },
     {
+      "epoch": 0.3202247191011236,
+      "grad_norm": 2.173736572265625,
+      "learning_rate": 2.814814814814815e-05,
+      "loss": 0.6015,
       "step": 57
     },
     {
+      "epoch": 0.33707865168539325,
+      "grad_norm": 3.8964712619781494,
+      "learning_rate": 2.962962962962963e-05,
+      "loss": 0.9482,
       "step": 60
     },
     {
+      "epoch": 0.3539325842696629,
+      "grad_norm": 2.659498691558838,
+      "learning_rate": 3.111111111111112e-05,
+      "loss": 0.5404,
       "step": 63
     },
     {
+      "epoch": 0.3707865168539326,
+      "grad_norm": 3.3499844074249268,
+      "learning_rate": 3.259259259259259e-05,
+      "loss": 0.805,
       "step": 66
     },
     {
+      "epoch": 0.38764044943820225,
+      "grad_norm": 3.770142078399658,
+      "learning_rate": 3.4074074074074077e-05,
+      "loss": 0.7184,
       "step": 69
     },
     {
+      "epoch": 0.4044943820224719,
+      "grad_norm": 3.740880012512207,
+      "learning_rate": 3.555555555555555e-05,
+      "loss": 0.8708,
       "step": 72
     },
     {
+      "epoch": 0.42134831460674155,
+      "grad_norm": 2.981106996536255,
+      "learning_rate": 3.703703703703704e-05,
+      "loss": 0.8327,
       "step": 75
     },
     {
+      "epoch": 0.43820224719101125,
+      "grad_norm": 2.3469011783599854,
+      "learning_rate": 3.851851851851852e-05,
+      "loss": 0.5025,
       "step": 78
     },
     {
+      "epoch": 0.4550561797752809,
+      "grad_norm": 3.296035051345825,
+      "learning_rate": 4e-05,
+      "loss": 0.6517,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
       "eval_NLI-v2_cosine_accuracy": 1.0,
       "eval_NLI-v2_dot_accuracy": 0.0,
       "eval_NLI-v2_euclidean_accuracy": 1.0,
       "eval_NLI-v2_manhattan_accuracy": 1.0,
       "eval_NLI-v2_max_accuracy": 1.0,
+      "eval_VitaminC_cosine_accuracy": 0.578125,
+      "eval_VitaminC_cosine_accuracy_threshold": 0.7859437465667725,
+      "eval_VitaminC_cosine_ap": 0.5557444337961499,
+      "eval_VitaminC_cosine_f1": 0.6595174262734584,
+      "eval_VitaminC_cosine_f1_threshold": 0.3211573362350464,
+      "eval_VitaminC_cosine_precision": 0.492,
       "eval_VitaminC_cosine_recall": 1.0,
+      "eval_VitaminC_dot_accuracy": 0.578125,
+      "eval_VitaminC_dot_accuracy_threshold": 315.9444580078125,
+      "eval_VitaminC_dot_ap": 0.5539524528858992,
+      "eval_VitaminC_dot_f1": 0.6595174262734584,
+      "eval_VitaminC_dot_f1_threshold": 129.88558959960938,
+      "eval_VitaminC_dot_precision": 0.492,
       "eval_VitaminC_dot_recall": 1.0,
+      "eval_VitaminC_euclidean_accuracy": 0.58203125,
+      "eval_VitaminC_euclidean_accuracy_threshold": 13.113249778747559,
+      "eval_VitaminC_euclidean_ap": 0.5510190217865811,
+      "eval_VitaminC_euclidean_f1": 0.6577540106951871,
+      "eval_VitaminC_euclidean_f1_threshold": 23.90462303161621,
+      "eval_VitaminC_euclidean_precision": 0.4900398406374502,
       "eval_VitaminC_euclidean_recall": 1.0,
+      "eval_VitaminC_manhattan_accuracy": 0.578125,
+      "eval_VitaminC_manhattan_accuracy_threshold": 276.40142822265625,
+      "eval_VitaminC_manhattan_ap": 0.5429240708188645,
+      "eval_VitaminC_manhattan_f1": 0.6576819407008085,
+      "eval_VitaminC_manhattan_f1_threshold": 469.7353515625,
+      "eval_VitaminC_manhattan_precision": 0.49193548387096775,
+      "eval_VitaminC_manhattan_recall": 0.991869918699187,
+      "eval_VitaminC_max_accuracy": 0.58203125,
+      "eval_VitaminC_max_accuracy_threshold": 315.9444580078125,
+      "eval_VitaminC_max_ap": 0.5557444337961499,
+      "eval_VitaminC_max_f1": 0.6595174262734584,
+      "eval_VitaminC_max_f1_threshold": 469.7353515625,
+      "eval_VitaminC_max_precision": 0.492,
       "eval_VitaminC_max_recall": 1.0,
+      "eval_sequential_score": 0.5557444337961499,
+      "eval_sts-test_pearson_cosine": 0.8483316632682467,
+      "eval_sts-test_pearson_dot": 0.8392403098680445,
+      "eval_sts-test_pearson_euclidean": 0.8814283057813619,
+      "eval_sts-test_pearson_manhattan": 0.8815226866327923,
+      "eval_sts-test_pearson_max": 0.8815226866327923,
+      "eval_sts-test_spearman_cosine": 0.8903503892346,
+      "eval_sts-test_spearman_dot": 0.857844431199042,
+      "eval_sts-test_spearman_euclidean": 0.8851830636663006,
+      "eval_sts-test_spearman_manhattan": 0.8865568876827619,
+      "eval_sts-test_spearman_max": 0.8903503892346,
+      "eval_vitaminc-pairs_loss": 2.3538782596588135,
+      "eval_vitaminc-pairs_runtime": 1.4618,
+      "eval_vitaminc-pairs_samples_per_second": 73.88,
+      "eval_vitaminc-pairs_steps_per_second": 1.368,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_negation-triplets_loss": 1.649215579032898,
+      "eval_negation-triplets_runtime": 0.3081,
+      "eval_negation-triplets_samples_per_second": 207.723,
+      "eval_negation-triplets_steps_per_second": 3.246,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_scitail-pairs-pos_loss": 0.11823470890522003,
+      "eval_scitail-pairs-pos_runtime": 0.376,
+      "eval_scitail-pairs-pos_samples_per_second": 143.616,
+      "eval_scitail-pairs-pos_steps_per_second": 2.66,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_xsum-pairs_loss": 0.08420603722333908,
+      "eval_xsum-pairs_runtime": 3.1576,
+      "eval_xsum-pairs_samples_per_second": 40.538,
+      "eval_xsum-pairs_steps_per_second": 0.633,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_sciq_pairs_loss": 0.034781794995069504,
+      "eval_sciq_pairs_runtime": 3.2597,
+      "eval_sciq_pairs_samples_per_second": 39.267,
+      "eval_sciq_pairs_steps_per_second": 0.614,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_qasc_pairs_loss": 0.10597346723079681,
+      "eval_qasc_pairs_runtime": 0.6245,
+      "eval_qasc_pairs_samples_per_second": 204.979,
+      "eval_qasc_pairs_steps_per_second": 3.203,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_openbookqa_pairs_loss": 0.7160983681678772,
+      "eval_openbookqa_pairs_runtime": 0.5767,
+      "eval_openbookqa_pairs_samples_per_second": 221.961,
+      "eval_openbookqa_pairs_steps_per_second": 3.468,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_msmarco_pairs_loss": 0.3454173803329468,
+      "eval_msmarco_pairs_runtime": 1.2912,
+      "eval_msmarco_pairs_samples_per_second": 99.134,
+      "eval_msmarco_pairs_steps_per_second": 1.549,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_nq_pairs_loss": 0.4442503750324249,
+      "eval_nq_pairs_runtime": 2.3854,
+      "eval_nq_pairs_samples_per_second": 53.659,
+      "eval_nq_pairs_steps_per_second": 0.838,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_trivia_pairs_loss": 0.9324482679367065,
+      "eval_trivia_pairs_runtime": 4.4251,
+      "eval_trivia_pairs_samples_per_second": 28.926,
+      "eval_trivia_pairs_steps_per_second": 0.452,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_gooaq_pairs_loss": 0.6094165444374084,
+      "eval_gooaq_pairs_runtime": 0.8751,
+      "eval_gooaq_pairs_samples_per_second": 146.261,
+      "eval_gooaq_pairs_steps_per_second": 2.285,
       "step": 81
     },
     {
+      "epoch": 0.4550561797752809,
+      "eval_paws-pos_loss": 0.024421451613307,
+      "eval_paws-pos_runtime": 0.6865,
+      "eval_paws-pos_samples_per_second": 186.444,
+      "eval_paws-pos_steps_per_second": 2.913,
       "step": 81
     },
     {
+      "epoch": 0.47191011235955055,
+      "grad_norm": 3.1395561695098877,
+      "learning_rate": 3.999675367909485e-05,
+      "loss": 0.5801,
       "step": 84
     },
     {
+      "epoch": 0.4887640449438202,
+      "grad_norm": 2.7977917194366455,
+      "learning_rate": 3.998701612152597e-05,
+      "loss": 0.791,
       "step": 87
     },
     {
+      "epoch": 0.5056179775280899,
+      "grad_norm": 2.3682048320770264,
+      "learning_rate": 3.997079154212493e-05,
+      "loss": 0.6042,
       "step": 90
     },
     {
+      "epoch": 0.5224719101123596,
+      "grad_norm": 2.843482255935669,
+      "learning_rate": 3.99480869635839e-05,
+      "loss": 0.7559,
       "step": 93
     },
     {
+      "epoch": 0.5393258426966292,
+      "grad_norm": 2.7346785068511963,
+      "learning_rate": 3.9918912213415936e-05,
+      "loss": 0.6258,
       "step": 96
     },
     {
+      "epoch": 0.5561797752808989,
+      "grad_norm": 3.149007558822632,
+      "learning_rate": 3.9883279919701226e-05,
+      "loss": 0.8853,
       "step": 99
     },
     {
+      "epoch": 0.5730337078651685,
+      "grad_norm": 3.3424761295318604,
+      "learning_rate": 3.9841205505621106e-05,
+      "loss": 0.5947,
       "step": 102
     },
     {
+      "epoch": 0.5898876404494382,
+      "grad_norm": 2.6377146244049072,
+      "learning_rate": 3.979270718278224e-05,
+      "loss": 0.644,
       "step": 105
     }
   ],
   "logging_steps": 3,
+  "max_steps": 534,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 3,
   "save_steps": 107,
     }
   },
   "total_flos": 0.0,
+  "train_batch_size": 320,
   "trial_name": null,
   "trial_params": null
 }

checkpoint-107/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:526057a01875662c89243f2f1101012515e0f154fca67a38aba3fb44dcb2d6d0
 size 5688

 version https://git-lfs.github.com/spec/v1
+oid sha256:72d6ebbf0ffc45e3199e7e67afe865d0f054853a38220ea09a039bd30fc6a761
 size 5688