Training in progress, epoch 18, checkpoint

Browse files

Files changed (5) hide show

checkpoint-1458/model.safetensors +1 -1
checkpoint-1458/optimizer.pt +1 -1
checkpoint-1458/rng_state.pth +1 -1
checkpoint-1458/trainer_state.json +543 -543
checkpoint-1458/training_args.bin +1 -1

checkpoint-1458/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e346ba3a18d9f52733128a08f2fcf33e8ad5cb58577af171e51867d45a9be48b
 size 592324828

 version https://git-lfs.github.com/spec/v1
+oid sha256:bac9984b2d9765cb537aef97e9f8a8c03a9ac5390280133677c8ed7efdd65c0b
 size 592324828

checkpoint-1458/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f081d6c3a001c889b64a1f0d87c470bf46a605387685bfdef3a7fd80e08f6ffb
 size 1014657786

 version https://git-lfs.github.com/spec/v1
+oid sha256:f669e4041d0aa60b36aafe323f84be4845ab9bce818277f43785ae6fec1a3b2b
 size 1014657786

checkpoint-1458/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06cb7d99259c09b675efbd978eb8e436a5421bc3dfafe9012920d410b89bfbcf
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:397d9f0c9659b8c458bbd5c411c44f792c5953742b278f71c3b66563b141c2b2
 size 14244

checkpoint-1458/trainer_state.json CHANGED Viewed

@@ -11,824 +11,824 @@
     {
       "epoch": 1.0,
       "eval_Claim": {
-        "f1-score": 0.5724454649827784,
-        "precision": 0.6002889477486154,
-        "recall": 0.5470704410796576,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.7860447185813415,
-        "precision": 0.698526892771497,
-        "recall": 0.8986337593653592,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9987820830889982,
-        "precision": 0.9975671292124707,
-        "recall": 1.0,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.8965445389824622,
-        "precision": 0.9051258677512096,
-        "recall": 0.8881243979633962,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8791279948197712,
-      "eval_loss": 0.3157936632633209,
       "eval_macro avg": {
-        "f1-score": 0.8134542014088951,
-        "precision": 0.8003772093709481,
-        "recall": 0.8334571496021033,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8184,
-      "eval_samples_per_second": 16.603,
-      "eval_steps_per_second": 2.075,
       "eval_weighted avg": {
-        "f1-score": 0.8781740995293698,
-        "precision": 0.8793943851252293,
-        "recall": 0.8791279948197712,
-        "support": 32431.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_Claim": {
-        "f1-score": 0.6090644692195831,
-        "precision": 0.680108254397835,
-        "recall": 0.5514592933947773,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8585858585858586,
-        "precision": 0.8960229995208433,
-        "recall": 0.8241516086381666,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.999458141425088,
-        "precision": 0.9992776523702032,
-        "recall": 0.9996386956914461,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9105885478942475,
-        "precision": 0.8801849235905997,
-        "recall": 0.9431677445988716,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.8990780426135487,
-      "eval_loss": 0.24451124668121338,
       "eval_macro avg": {
-        "f1-score": 0.8444242542811943,
-        "precision": 0.8638984574698704,
-        "recall": 0.8296043355808155,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8529,
-      "eval_samples_per_second": 16.485,
-      "eval_steps_per_second": 2.061,
       "eval_weighted avg": {
-        "f1-score": 0.8949194640367888,
-        "precision": 0.8938342965082798,
-        "recall": 0.8990780426135487,
-        "support": 32431.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_Claim": {
-        "f1-score": 0.6542320859402667,
-        "precision": 0.7079713847726111,
-        "recall": 0.60807548825982,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8915187376725839,
-        "precision": 0.8866608544027899,
-        "recall": 0.8964301454385192,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9995936611133684,
-        "precision": 0.9992778479870013,
-        "recall": 0.9999096739228616,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9157990498332153,
-        "precision": 0.8973258501155497,
-        "recall": 0.935048850970139,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9085442940396534,
-      "eval_loss": 0.22665414214134216,
       "eval_macro avg": {
-        "f1-score": 0.8652858836398586,
-        "precision": 0.872808984319488,
-        "recall": 0.8598660396478349,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8494,
-      "eval_samples_per_second": 16.497,
-      "eval_steps_per_second": 2.062,
       "eval_weighted avg": {
-        "f1-score": 0.9059516032151627,
-        "precision": 0.9047762338408377,
-        "recall": 0.9085442940396534,
-        "support": 32431.0
       },
       "step": 243
     },
     {
       "epoch": 4.0,
       "eval_Claim": {
-        "f1-score": 0.6861642294713161,
-        "precision": 0.6424741478360781,
-        "recall": 0.7362299758613122,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8995515695067264,
-        "precision": 0.9155636695572797,
-        "recall": 0.884089907448215,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9976481230212574,
-        "precision": 0.9990941208442794,
-        "recall": 0.9962063047601842,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9062532879739067,
-        "precision": 0.9242435081193219,
-        "recall": 0.8889500481629283,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9037649162838025,
-      "eval_loss": 0.2452327460050583,
       "eval_macro avg": {
-        "f1-score": 0.8724043024933017,
-        "precision": 0.8703438615892398,
-        "recall": 0.8763690590581599,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8393,
-      "eval_samples_per_second": 16.531,
-      "eval_steps_per_second": 2.066,
       "eval_weighted avg": {
-        "f1-score": 0.9060584182508294,
-        "precision": 0.9095955973231696,
-        "recall": 0.9037649162838025,
-        "support": 32431.0
       },
       "step": 324
     },
     {
       "epoch": 5.0,
       "eval_Claim": {
-        "f1-score": 0.6640249759846301,
-        "precision": 0.7332272606735614,
-        "recall": 0.6067588325652842,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8848007008322383,
-        "precision": 0.8794079233783195,
-        "recall": 0.8902600264433671,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.999367774566474,
-        "precision": 0.9992775219001174,
-        "recall": 0.9994580435371692,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9201314377682404,
-        "precision": 0.8973839110529758,
-        "recall": 0.9440621989816981,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9118127717307515,
-      "eval_loss": 0.28411003947257996,
       "eval_macro avg": {
-        "f1-score": 0.8670812222878956,
-        "precision": 0.8773241542512435,
-        "recall": 0.8601347753818797,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8228,
-      "eval_samples_per_second": 16.588,
-      "eval_steps_per_second": 2.073,
       "eval_weighted avg": {
-        "f1-score": 0.9087220731552942,
-        "precision": 0.9078434958291443,
-        "recall": 0.9118127717307515,
-        "support": 32431.0
       },
       "step": 405
     },
     {
       "epoch": 6.0,
       "eval_Claim": {
-        "f1-score": 0.6496087442553721,
-        "precision": 0.7484258729250143,
-        "recall": 0.5738424402018872,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8865800865800866,
-        "precision": 0.8711186729051468,
-        "recall": 0.9026002644336713,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9986892655367232,
-        "precision": 0.9994572100597069,
-        "recall": 0.9979225002258152,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9191778088205947,
-        "precision": 0.889647180015452,
-        "recall": 0.9507362047612495,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9105177145323918,
-      "eval_loss": 0.3082066774368286,
       "eval_macro avg": {
-        "f1-score": 0.8635139762981943,
-        "precision": 0.87716223397633,
-        "recall": 0.8562753524056559,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8389,
-      "eval_samples_per_second": 16.533,
-      "eval_steps_per_second": 2.067,
       "eval_weighted avg": {
-        "f1-score": 0.9061618943658084,
-        "precision": 0.9059932736781678,
-        "recall": 0.9105177145323918,
-        "support": 32431.0
       },
       "step": 486
     },
     {
       "epoch": 6.17,
-      "grad_norm": 0.8612700700759888,
       "learning_rate": 1.7530864197530865e-05,
-      "loss": 0.2223,
       "step": 500
     },
     {
       "epoch": 7.0,
       "eval_Claim": {
-        "f1-score": 0.6977381768334475,
-        "precision": 0.629950495049505,
-        "recall": 0.7818740399385561,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8892209178228387,
-        "precision": 0.8621688741721855,
-        "recall": 0.9180255619215514,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9988698521766648,
-        "precision": 0.9998190045248869,
-        "recall": 0.9979225002258152,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9034227633516503,
-        "precision": 0.9449996243143738,
-        "recall": 0.8653502132929682,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9025623631710401,
-      "eval_loss": 0.3512111008167267,
       "eval_macro avg": {
-        "f1-score": 0.8723129275461503,
-        "precision": 0.8592344995152377,
-        "recall": 0.8907930788447227,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8174,
-      "eval_samples_per_second": 16.607,
-      "eval_steps_per_second": 2.076,
       "eval_weighted avg": {
-        "f1-score": 0.9061105026169647,
-        "precision": 0.9136494810618672,
-        "recall": 0.9025623631710401,
-        "support": 32431.0
       },
       "step": 567
     },
     {
       "epoch": 8.0,
       "eval_Claim": {
-        "f1-score": 0.6987032799389779,
-        "precision": 0.6177710335525206,
-        "recall": 0.80403774412991,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.9015364639688379,
-        "precision": 0.8856292517006803,
-        "recall": 0.9180255619215514,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.998915499322187,
-        "precision": 0.9994574554661362,
-        "recall": 0.9983741306115076,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.8976577489773016,
-        "precision": 0.9472075788830315,
-        "recall": 0.8530342644832806,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9003114304215103,
-      "eval_loss": 0.3705728054046631,
       "eval_macro avg": {
-        "f1-score": 0.8742032480518261,
-        "precision": 0.8625163299005921,
-        "recall": 0.8933679252865624,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8542,
-      "eval_samples_per_second": 16.48,
-      "eval_steps_per_second": 2.06,
       "eval_weighted avg": {
-        "f1-score": 0.9045397397569994,
-        "precision": 0.9144455555782818,
-        "recall": 0.9003114304215103,
-        "support": 32431.0
       },
       "step": 648
     },
     {
       "epoch": 9.0,
       "eval_Claim": {
-        "f1-score": 0.6657139454567107,
-        "precision": 0.7278645833333334,
-        "recall": 0.6133421110379635,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8882521489971346,
-        "precision": 0.8884479717813051,
-        "recall": 0.8880564125165271,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9987339482727438,
-        "precision": 0.9999094612947035,
-        "recall": 0.9975611959172613,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9178854152690192,
-        "precision": 0.8955360649299646,
-        "recall": 0.9413788358332187,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9107335573987851,
-      "eval_loss": 0.41826051473617554,
       "eval_macro avg": {
-        "f1-score": 0.8676463644989021,
-        "precision": 0.8779395203348266,
-        "recall": 0.8600846388262426,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.809,
-      "eval_samples_per_second": 16.635,
-      "eval_steps_per_second": 2.079,
       "eval_weighted avg": {
-        "f1-score": 0.9079779452489347,
-        "precision": 0.9071100542045434,
-        "recall": 0.9107335573987851,
-        "support": 32431.0
       },
       "step": 729
     },
     {
       "epoch": 10.0,
       "eval_Claim": {
-        "f1-score": 0.6738416222952305,
-        "precision": 0.6964871194379391,
-        "recall": 0.652622339258284,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8951019550136641,
-        "precision": 0.8557073954983923,
-        "recall": 0.9382988100484795,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9989605459393501,
-        "precision": 0.9996382054992764,
-        "recall": 0.998283804534369,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9109121470961545,
-        "precision": 0.9083259218717931,
-        "recall": 0.9135131415990092,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9075267490980852,
-      "eval_loss": 0.5459077954292297,
       "eval_macro avg": {
-        "f1-score": 0.8697040675860997,
-        "precision": 0.8650396605768502,
-        "recall": 0.8756795238600354,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8478,
-      "eval_samples_per_second": 16.502,
-      "eval_steps_per_second": 2.063,
       "eval_weighted avg": {
-        "f1-score": 0.9065515080853328,
-        "precision": 0.9060496255197702,
-        "recall": 0.9075267490980852,
-        "support": 32431.0
       },
       "step": 810
     },
     {
       "epoch": 11.0,
       "eval_Claim": {
-        "f1-score": 0.6581417175035196,
-        "precision": 0.7070834383665239,
-        "recall": 0.6155365371955234,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.881979417560762,
-        "precision": 0.876414273281114,
-        "recall": 0.8876156897311591,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9999548390010388,
-        "precision": 0.9999096820809249,
-        "recall": 1.0,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9173079519373565,
-        "precision": 0.9002915065588976,
-        "recall": 0.9349800467868447,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9089759797724399,
-      "eval_loss": 0.5726844668388367,
       "eval_macro avg": {
-        "f1-score": 0.8643459815006692,
-        "precision": 0.8709247250718651,
-        "recall": 0.8595330684283817,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8447,
-      "eval_samples_per_second": 16.513,
-      "eval_steps_per_second": 2.064,
       "eval_weighted avg": {
-        "f1-score": 0.9066330640790278,
-        "precision": 0.9054793272287636,
-        "recall": 0.9089759797724399,
-        "support": 32431.0
       },
       "step": 891
     },
     {
       "epoch": 12.0,
       "eval_Claim": {
-        "f1-score": 0.7079179557694512,
-        "precision": 0.7407673860911271,
-        "recall": 0.6778582400702217,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.8947480331703169,
-        "precision": 0.8644207066557108,
-        "recall": 0.9272807404142794,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.999186477447347,
-        "precision": 0.9999095431931253,
-        "recall": 0.998464456688646,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9243840851702722,
-        "precision": 0.9169374492282697,
-        "recall": 0.9319526627218935,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9186272393697388,
-      "eval_loss": 0.5660926699638367,
       "eval_macro avg": {
-        "f1-score": 0.8815591378893468,
-        "precision": 0.8805087712920582,
-        "recall": 0.8838890249737601,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8659,
-      "eval_samples_per_second": 16.441,
-      "eval_steps_per_second": 2.055,
       "eval_weighted avg": {
-        "f1-score": 0.917429533390557,
-        "precision": 0.9168331226787283,
-        "recall": 0.9186272393697388,
-        "support": 32431.0
       },
       "step": 972
     },
     {
       "epoch": 12.35,
-      "grad_norm": 2.9101791381835938,
       "learning_rate": 1.506172839506173e-05,
-      "loss": 0.0294,
       "step": 1000
     },
     {
       "epoch": 13.0,
       "eval_Claim": {
-        "f1-score": 0.6744648496900223,
-        "precision": 0.7221943887775552,
-        "recall": 0.6326530612244898,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.9044719714465672,
-        "precision": 0.863672814755413,
-        "recall": 0.9493168796826796,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9995934041111363,
-        "precision": 0.9999096167751266,
-        "recall": 0.9992773913828923,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9161992180860105,
-        "precision": 0.9055171023452725,
-        "recall": 0.9271363698912893,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9119361105115475,
-      "eval_loss": 0.5764271020889282,
       "eval_macro avg": {
-        "f1-score": 0.8736823608334341,
-        "precision": 0.8728234806633418,
-        "recall": 0.8770959255453377,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8358,
-      "eval_samples_per_second": 16.543,
-      "eval_steps_per_second": 2.068,
       "eval_weighted avg": {
-        "f1-score": 0.9098800911419986,
-        "precision": 0.909053016531805,
-        "recall": 0.9119361105115475,
-        "support": 32431.0
       },
       "step": 1053
     },
     {
       "epoch": 14.0,
       "eval_Claim": {
-        "f1-score": 0.7047413793103449,
-        "precision": 0.6923565530383231,
-        "recall": 0.717577353522054,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.9112001687407719,
-        "precision": 0.8737864077669902,
-        "recall": 0.9519612163948876,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9992316384180792,
         "precision": 1.0,
-        "recall": 0.998464456688646,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9145424153781864,
-        "precision": 0.9258919757439007,
-        "recall": 0.903467730838035,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9131694983195091,
-      "eval_loss": 0.5468704700469971,
       "eval_macro avg": {
-        "f1-score": 0.8824289004618456,
-        "precision": 0.8730087341373035,
-        "recall": 0.8928676893609057,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8411,
-      "eval_samples_per_second": 16.525,
-      "eval_steps_per_second": 2.066,
       "eval_weighted avg": {
-        "f1-score": 0.9137390947680665,
-        "precision": 0.9147298617643856,
-        "recall": 0.9131694983195091,
-        "support": 32431.0
       },
       "step": 1134
     },
     {
       "epoch": 15.0,
       "eval_Claim": {
-        "f1-score": 0.6868638486408813,
-        "precision": 0.7559304164470216,
-        "recall": 0.6293614219881501,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.9058546000428909,
-        "precision": 0.8822055137844611,
-        "recall": 0.9308065226972234,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9999548349216385,
-        "precision": 1.0,
-        "recall": 0.9999096739228616,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9218029420675262,
-        "precision": 0.9023924075660713,
-        "recall": 0.9420668776661622,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9170855046097869,
-      "eval_loss": 0.6552095413208008,
       "eval_macro avg": {
-        "f1-score": 0.8786190564182342,
-        "precision": 0.8851320844493885,
-        "recall": 0.8755361240685993,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8081,
-      "eval_samples_per_second": 16.639,
-      "eval_steps_per_second": 2.08,
       "eval_weighted avg": {
-        "f1-score": 0.9143537536055225,
-        "precision": 0.9137205288178378,
-        "recall": 0.9170855046097869,
-        "support": 32431.0
       },
       "step": 1215
     },
     {
       "epoch": 16.0,
       "eval_Claim": {
-        "f1-score": 0.7261954261954263,
-        "precision": 0.6899071696622556,
-        "recall": 0.7665130568356375,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.9104052573932091,
-        "precision": 0.9050522648083623,
-        "recall": 0.9158219479947113,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9999548349216385,
         "precision": 1.0,
-        "recall": 0.9999096739228616,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9186291000841041,
-        "precision": 0.9360805599200114,
-        "recall": 0.9018164304389706,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9172705127809812,
-      "eval_loss": 0.604762613773346,
       "eval_macro avg": {
-        "f1-score": 0.8887961546485946,
-        "precision": 0.8827599985976573,
-        "recall": 0.8960152772980452,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8523,
-      "eval_samples_per_second": 16.487,
-      "eval_steps_per_second": 2.061,
       "eval_weighted avg": {
-        "f1-score": 0.918776399254959,
-        "precision": 0.92113920073012,
-        "recall": 0.9172705127809812,
-        "support": 32431.0
       },
       "step": 1296
     },
     {
       "epoch": 17.0,
       "eval_Claim": {
-        "f1-score": 0.6726977499420088,
-        "precision": 0.7134071340713407,
-        "recall": 0.6363835856923414,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.898166556218246,
-        "precision": 0.9003542958370239,
-        "recall": 0.8959894226531512,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9999548349216385,
-        "precision": 1.0,
-        "recall": 0.9999096739228616,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9172189909373732,
-        "precision": 0.9018486500864477,
-        "recall": 0.9331223338378973,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9116277635595572,
-      "eval_loss": 0.6666390299797058,
       "eval_macro avg": {
-        "f1-score": 0.8720095330048165,
-        "precision": 0.8789025199987031,
-        "recall": 0.8663512540265629,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8204,
-      "eval_samples_per_second": 16.596,
-      "eval_steps_per_second": 2.075,
       "eval_weighted avg": {
-        "f1-score": 0.9097710324765249,
-        "precision": 0.9087714991080675,
-        "recall": 0.9116277635595572,
-        "support": 32431.0
       },
       "step": 1377
     },
     {
       "epoch": 18.0,
       "eval_Claim": {
-        "f1-score": 0.7242054854157598,
-        "precision": 0.7184193478730296,
-        "recall": 0.7300855826201448,
-        "support": 4557.0
       },
       "eval_MajorClaim": {
-        "f1-score": 0.91550204257149,
-        "precision": 0.8937867338371117,
-        "recall": 0.9382988100484795,
-        "support": 2269.0
       },
       "eval_O": {
-        "f1-score": 0.9999548349216385,
-        "precision": 1.0,
-        "recall": 0.9999096739228616,
-        "support": 11071.0
       },
       "eval_Premise": {
-        "f1-score": 0.9218198185721211,
-        "precision": 0.9277948146083078,
-        "recall": 0.9159212880143113,
-        "support": 14534.0
       },
-      "eval_accuracy": 0.9200456353488946,
-      "eval_loss": 0.5898464918136597,
       "eval_macro avg": {
-        "f1-score": 0.8903705453702524,
-        "precision": 0.8850002240796123,
-        "recall": 0.8960538386514494,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8354,
-      "eval_samples_per_second": 16.545,
-      "eval_steps_per_second": 2.068,
       "eval_weighted avg": {
-        "f1-score": 0.9202833015380038,
-        "precision": 0.9206441029524512,
-        "recall": 0.9200456353488946,
-        "support": 32431.0
       },
       "step": 1458
     }
@@ -838,7 +838,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 2588197189082400.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_Claim": {
+        "f1-score": 0.5385059461955894,
+        "precision": 0.6267132491265789,
+        "recall": 0.4720647773279352,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.7814784727863526,
+        "precision": 0.9588039867109635,
+        "recall": 0.6595063985374772,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9938608715302625,
+        "precision": 0.9996969237763298,
+        "recall": 0.9880925634688834,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.8968837690149166,
+        "precision": 0.8455112497215416,
+        "recall": 0.954902824076986,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8837548103353491,
+      "eval_loss": 0.2860471308231354,
       "eval_macro avg": {
+        "f1-score": 0.8026822648817803,
+        "precision": 0.8576813523338533,
+        "recall": 0.7686416408528204,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9572,
+      "eval_samples_per_second": 16.34,
+      "eval_steps_per_second": 2.219,
       "eval_weighted avg": {
+        "f1-score": 0.8768739289107891,
+        "precision": 0.8792073379911217,
+        "recall": 0.8837548103353491,
+        "support": 36380.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_Claim": {
+        "f1-score": 0.6469459868753155,
+        "precision": 0.6453172205438067,
+        "recall": 0.648582995951417,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8435970110796187,
+        "precision": 0.9669226225634967,
+        "recall": 0.7481718464351006,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.998877245508982,
+        "precision": 0.9983541557567143,
+        "recall": 0.9994008836965476,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9099026477336144,
+        "precision": 0.8972179761540813,
+        "recall": 0.922951129001824,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.903243540406817,
+      "eval_loss": 0.24885737895965576,
       "eval_macro avg": {
+        "f1-score": 0.8498307227993828,
+        "precision": 0.8769529937545246,
+        "recall": 0.8297767137712222,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0097,
+      "eval_samples_per_second": 16.169,
+      "eval_steps_per_second": 2.196,
       "eval_weighted avg": {
+        "f1-score": 0.9028656814459712,
+        "precision": 0.9043261520711511,
+        "recall": 0.903243540406817,
+        "support": 36380.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_Claim": {
+        "f1-score": 0.7040630102775911,
+        "precision": 0.6698958142935478,
+        "recall": 0.7419028340080972,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8888411094388303,
+        "precision": 0.8392204628501827,
+        "recall": 0.9446983546617916,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.998989104796136,
+        "precision": 0.9988769092542678,
+        "recall": 0.9991013255448213,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.914582593823615,
+        "precision": 0.9390987408880053,
+        "recall": 0.8913139191144097,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9137987905442551,
+      "eval_loss": 0.24298855662345886,
       "eval_macro avg": {
+        "f1-score": 0.8766189545840432,
+        "precision": 0.8617729818215009,
+        "recall": 0.8942541083322799,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9876,
+      "eval_samples_per_second": 16.24,
+      "eval_steps_per_second": 2.205,
       "eval_weighted avg": {
+        "f1-score": 0.9154289662937856,
+        "precision": 0.9184781183611038,
+        "recall": 0.9137987905442551,
+        "support": 36380.0
       },
       "step": 243
     },
     {
       "epoch": 4.0,
       "eval_Claim": {
+        "f1-score": 0.6981611893583725,
+        "precision": 0.6754352763058289,
+        "recall": 0.7224696356275304,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.901231802911534,
+        "precision": 0.8836187966622749,
+        "recall": 0.9195612431444241,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9989130842172332,
+        "precision": 0.9998499399759904,
+        "recall": 0.9979779824758481,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9146224912392481,
+        "precision": 0.9266670970240785,
+        "recall": 0.9028869740235235,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9142935678944475,
+      "eval_loss": 0.23980534076690674,
       "eval_macro avg": {
+        "f1-score": 0.8782321419315969,
+        "precision": 0.8713927774920431,
+        "recall": 0.8857239588178316,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9726,
+      "eval_samples_per_second": 16.289,
+      "eval_steps_per_second": 2.212,
       "eval_weighted avg": {
+        "f1-score": 0.9153623106642749,
+        "precision": 0.9168247558035478,
+        "recall": 0.9142935678944475,
+        "support": 36380.0
       },
       "step": 324
     },
     {
       "epoch": 5.0,
       "eval_Claim": {
+        "f1-score": 0.6650318783717509,
+        "precision": 0.6450999048525214,
+        "recall": 0.6862348178137652,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9172031076581575,
+        "precision": 0.8916702632714717,
+        "recall": 0.9442413162705667,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9982383147794145,
+        "precision": 0.9992495872730002,
+        "recall": 0.9972290870965326,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.8998438545616774,
+        "precision": 0.9119622787753521,
+        "recall": 0.8880432731618341,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9040956569543706,
+      "eval_loss": 0.2932502031326294,
       "eval_macro avg": {
+        "f1-score": 0.87007928884275,
+        "precision": 0.8619955085430864,
+        "recall": 0.8789371235856747,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9595,
+      "eval_samples_per_second": 16.332,
+      "eval_steps_per_second": 2.218,
       "eval_weighted avg": {
+        "f1-score": 0.9051179642561333,
+        "precision": 0.9065430476942037,
+        "recall": 0.9040956569543706,
+        "support": 36380.0
       },
       "step": 405
     },
     {
       "epoch": 6.0,
       "eval_Claim": {
+        "f1-score": 0.6622698072805139,
+        "precision": 0.5740163325909429,
+        "recall": 0.7825910931174089,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9223704351629127,
+        "precision": 0.8842767295597485,
+        "recall": 0.9638939670932358,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9982004948639124,
+        "precision": 0.9993994444861497,
+        "recall": 0.9970044184827379,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.8780749379985253,
+        "precision": 0.9398091685199799,
+        "recall": 0.8239511918988616,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8902693787795491,
+      "eval_loss": 0.3604726195335388,
       "eval_macro avg": {
+        "f1-score": 0.865228918826466,
+        "precision": 0.8493754187892053,
+        "recall": 0.8918601676480611,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.991,
+      "eval_samples_per_second": 16.229,
+      "eval_steps_per_second": 2.204,
       "eval_weighted avg": {
+        "f1-score": 0.8955262233990811,
+        "precision": 0.9086708334194257,
+        "recall": 0.8902693787795491,
+        "support": 36380.0
       },
       "step": 486
     },
     {
       "epoch": 6.17,
+      "grad_norm": 17.04454231262207,
       "learning_rate": 1.7530864197530865e-05,
+      "loss": 0.2104,
       "step": 500
     },
     {
       "epoch": 7.0,
       "eval_Claim": {
+        "f1-score": 0.7037529399734124,
+        "precision": 0.7110973341599504,
+        "recall": 0.6965587044534413,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9196885428253615,
+        "precision": 0.8959687906371911,
+        "recall": 0.9446983546617916,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9987257327036954,
+        "precision": 0.9996248780853777,
+        "recall": 0.997828203399985,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9188781285372909,
+        "precision": 0.9187048098082364,
+        "recall": 0.9190515126737531,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9192963166575041,
+      "eval_loss": 0.36414769291877747,
       "eval_macro avg": {
+        "f1-score": 0.8852613360099401,
+        "precision": 0.8813489531726889,
+        "recall": 0.8895341937972427,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9835,
+      "eval_samples_per_second": 16.254,
+      "eval_steps_per_second": 2.207,
       "eval_weighted avg": {
+        "f1-score": 0.9190227083446231,
+        "precision": 0.9188476996393494,
+        "recall": 0.9192963166575041,
+        "support": 36380.0
       },
       "step": 567
     },
     {
       "epoch": 8.0,
       "eval_Claim": {
+        "f1-score": 0.7025399811853246,
+        "precision": 0.6562390158172232,
+        "recall": 0.7558704453441295,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9105835367206567,
+        "precision": 0.8848641655886158,
+        "recall": 0.9378427787934186,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9986513823331086,
+        "precision": 0.9991005172026085,
+        "recall": 0.9982026510896428,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9083384525849526,
+        "precision": 0.9345974717232203,
+        "recall": 0.8835146864582678,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.911544804837823,
+      "eval_loss": 0.35222452878952026,
       "eval_macro avg": {
+        "f1-score": 0.8800283382060107,
+        "precision": 0.8687002925829169,
+        "recall": 0.8938576404213647,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9741,
+      "eval_samples_per_second": 16.285,
+      "eval_steps_per_second": 2.211,
       "eval_weighted avg": {
+        "f1-score": 0.9136769997620249,
+        "precision": 0.9174837257168467,
+        "recall": 0.911544804837823,
+        "support": 36380.0
       },
       "step": 648
     },
     {
       "epoch": 9.0,
       "eval_Claim": {
+        "f1-score": 0.6566933693658913,
+        "precision": 0.6275594908688434,
+        "recall": 0.6886639676113361,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.8702745722244328,
+        "precision": 0.7706131078224101,
+        "recall": 0.9995429616087751,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9987648313807688,
+        "precision": 0.9983537862915295,
+        "recall": 0.9991762150827529,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9001826722338205,
+        "precision": 0.9350138917124077,
+        "recall": 0.8678533241084345,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.8996426608026388,
+      "eval_loss": 0.4436376690864563,
       "eval_macro avg": {
+        "f1-score": 0.8564788613012284,
+        "precision": 0.8328850691737977,
+        "recall": 0.8888091171028246,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0402,
+      "eval_samples_per_second": 16.071,
+      "eval_steps_per_second": 2.182,
       "eval_weighted avg": {
+        "f1-score": 0.9015045934020747,
+        "precision": 0.90662587513727,
+        "recall": 0.8996426608026388,
+        "support": 36380.0
       },
       "step": 729
     },
     {
       "epoch": 10.0,
       "eval_Claim": {
+        "f1-score": 0.7371103705155853,
+        "precision": 0.7145572025845686,
+        "recall": 0.7611336032388664,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9365328549002018,
+        "precision": 0.9194187582562747,
+        "recall": 0.9542961608775137,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9991386090408599,
+        "precision": 0.9993257416841475,
+        "recall": 0.9989515464689583,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9225428371233836,
+        "precision": 0.9344473837021743,
+        "recall": 0.9109377948298635,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9255085211654756,
+      "eval_loss": 0.44094258546829224,
       "eval_macro avg": {
+        "f1-score": 0.8988311678950076,
+        "precision": 0.8919372715567913,
+        "recall": 0.9063297763538004,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9458,
+      "eval_samples_per_second": 16.378,
+      "eval_steps_per_second": 2.224,
       "eval_weighted avg": {
+        "f1-score": 0.9263184587909816,
+        "precision": 0.927497977075915,
+        "recall": 0.9255085211654756,
+        "support": 36380.0
       },
       "step": 810
     },
     {
       "epoch": 11.0,
       "eval_Claim": {
+        "f1-score": 0.6750768578394996,
+        "precision": 0.7086579123080348,
+        "recall": 0.6445344129554655,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9008264462809917,
+        "precision": 0.8220211161387632,
+        "recall": 0.9963436928702011,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9990631440884392,
+        "precision": 0.9998499849984999,
+        "recall": 0.9982775406275743,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9168605748066159,
+        "precision": 0.9167452681883921,
+        "recall": 0.9169759104346186,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9145959318306762,
+      "eval_loss": 0.4954843521118164,
       "eval_macro avg": {
+        "f1-score": 0.8729567557538865,
+        "precision": 0.8618185704084225,
+        "recall": 0.8890328892219649,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0503,
+      "eval_samples_per_second": 16.039,
+      "eval_steps_per_second": 2.178,
       "eval_weighted avg": {
+        "f1-score": 0.9132365141301059,
+        "precision": 0.9132952764575458,
+        "recall": 0.9145959318306762,
+        "support": 36380.0
       },
       "step": 891
     },
     {
       "epoch": 12.0,
       "eval_Claim": {
+        "f1-score": 0.6857200770244248,
+        "precision": 0.6866247209255125,
+        "recall": 0.6848178137651821,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9214571488734471,
+        "precision": 0.8543537680593518,
+        "recall": 1.0,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9987652935234033,
+        "precision": 0.9979811574697174,
+        "recall": 0.9995506627724107,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9127542413343095,
+        "precision": 0.9239592731022039,
+        "recall": 0.9018177243851815,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.91412864211105,
+      "eval_loss": 0.5210011005401611,
       "eval_macro avg": {
+        "f1-score": 0.8796741901888963,
+        "precision": 0.8657297298891964,
+        "recall": 0.8965465502306935,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9497,
+      "eval_samples_per_second": 16.365,
+      "eval_steps_per_second": 2.222,
       "eval_weighted avg": {
+        "f1-score": 0.9140186385274314,
+        "precision": 0.9147147620844138,
+        "recall": 0.91412864211105,
+        "support": 36380.0
       },
       "step": 972
     },
     {
       "epoch": 12.35,
+      "grad_norm": 3.2667109966278076,
       "learning_rate": 1.506172839506173e-05,
+      "loss": 0.0286,
       "step": 1000
     },
     {
       "epoch": 13.0,
       "eval_Claim": {
+        "f1-score": 0.7024380291747424,
+        "precision": 0.7079991774624718,
+        "recall": 0.6969635627530364,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9075119409465915,
+        "precision": 0.8643507030603805,
+        "recall": 0.9552102376599635,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9986895802912875,
+        "precision": 0.9985774183887391,
+        "recall": 0.9988017673930952,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9200429808482398,
+        "precision": 0.9246014101505431,
+        "recall": 0.9155292785709793,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9188015393073117,
+      "eval_loss": 0.5909315347671509,
       "eval_macro avg": {
+        "f1-score": 0.8821706328152152,
+        "precision": 0.8738821772655336,
+        "recall": 0.8916262115942686,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9699,
+      "eval_samples_per_second": 16.298,
+      "eval_steps_per_second": 2.213,
       "eval_weighted avg": {
+        "f1-score": 0.9186076225687217,
+        "precision": 0.918717904416961,
+        "recall": 0.9188015393073117,
+        "support": 36380.0
       },
       "step": 1053
     },
     {
       "epoch": 14.0,
       "eval_Claim": {
+        "f1-score": 0.7095000509113125,
+        "precision": 0.7137881581643106,
+        "recall": 0.7052631578947368,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.921028466483012,
+        "precision": 0.9252767527675276,
+        "recall": 0.916819012797075,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9994754982766372,
         "precision": 1.0,
+        "recall": 0.9989515464689583,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9206986297074409,
+        "precision": 0.9180215107553776,
+        "recall": 0.9233914082646707,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9211105002748763,
+      "eval_loss": 0.559357225894928,
       "eval_macro avg": {
+        "f1-score": 0.8876756613446006,
+        "precision": 0.889271605421804,
+        "recall": 0.8861062813563602,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9811,
+      "eval_samples_per_second": 16.262,
+      "eval_steps_per_second": 2.208,
       "eval_weighted avg": {
+        "f1-score": 0.9209544908843665,
+        "precision": 0.9208148168193181,
+        "recall": 0.9211105002748763,
+        "support": 36380.0
       },
       "step": 1134
     },
     {
       "epoch": 15.0,
       "eval_Claim": {
+        "f1-score": 0.6915445526531356,
+        "precision": 0.6282454109475774,
+        "recall": 0.7690283400809717,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9327135900841081,
+        "precision": 0.9042918454935622,
+        "recall": 0.9629798903107861,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9995130539011873,
+        "precision": 0.9998501199040767,
+        "recall": 0.9991762150827529,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.8984226716408141,
+        "precision": 0.936421311139914,
+        "recall": 0.8633876344424177,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9064046179219352,
+      "eval_loss": 0.6213898658752441,
       "eval_macro avg": {
+        "f1-score": 0.8805484670698113,
+        "precision": 0.8672021718712826,
+        "recall": 0.898643019979232,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9756,
+      "eval_samples_per_second": 16.28,
+      "eval_steps_per_second": 2.211,
       "eval_weighted avg": {
+        "f1-score": 0.9094977265082566,
+        "precision": 0.9159231436204942,
+        "recall": 0.9064046179219352,
+        "support": 36380.0
       },
       "step": 1215
     },
     {
       "epoch": 16.0,
       "eval_Claim": {
+        "f1-score": 0.6819089456869009,
+        "precision": 0.6727738376674547,
+        "recall": 0.6912955465587044,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9290586630286495,
+        "precision": 0.9244343891402715,
+        "recall": 0.9337294332723949,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9998127410958391,
         "precision": 1.0,
+        "recall": 0.9996255523103422,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9087691578448412,
+        "precision": 0.9131843007748,
+        "recall": 0.9043965029247123,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9121770203408466,
+      "eval_loss": 0.6214332580566406,
       "eval_macro avg": {
+        "f1-score": 0.8798873769140577,
+        "precision": 0.8775981318956315,
+        "recall": 0.8822617587665385,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.962,
+      "eval_samples_per_second": 16.324,
+      "eval_steps_per_second": 2.217,
       "eval_weighted avg": {
+        "f1-score": 0.9126011797368843,
+        "precision": 0.9130808795913876,
+        "recall": 0.9121770203408466,
+        "support": 36380.0
       },
       "step": 1296
     },
     {
       "epoch": 17.0,
       "eval_Claim": {
+        "f1-score": 0.6977198697068404,
+        "precision": 0.7524590163934426,
+        "recall": 0.6504048582995952,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.935002195871761,
+        "precision": 0.8998309382924767,
+        "recall": 0.9730347349177331,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9994757732344791,
+        "precision": 0.9994757732344791,
+        "recall": 0.9994757732344791,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9219572623103128,
+        "precision": 0.908120309926179,
+        "recall": 0.9362224039247752,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9228422210005498,
+      "eval_loss": 0.6075455546379089,
       "eval_macro avg": {
+        "f1-score": 0.8885387752808483,
+        "precision": 0.8899715094616443,
+        "recall": 0.8897844425941457,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0046,
+      "eval_samples_per_second": 16.185,
+      "eval_steps_per_second": 2.198,
       "eval_weighted avg": {
+        "f1-score": 0.9207454500932067,
+        "precision": 0.9200160099363349,
+        "recall": 0.9228422210005498,
+        "support": 36380.0
       },
       "step": 1377
     },
     {
       "epoch": 18.0,
       "eval_Claim": {
+        "f1-score": 0.6748943740271293,
+        "precision": 0.7486433152442032,
+        "recall": 0.6143724696356275,
+        "support": 4940.0
       },
       "eval_MajorClaim": {
+        "f1-score": 0.9180620674257648,
+        "precision": 0.8974247053688346,
+        "recall": 0.9396709323583181,
+        "support": 2188.0
       },
       "eval_O": {
+        "f1-score": 0.9997753145596164,
+        "precision": 0.9998501984870047,
+        "recall": 0.9997004418482738,
+        "support": 13353.0
       },
       "eval_Premise": {
+        "f1-score": 0.9206027683147655,
+        "precision": 0.898945097099017,
+        "recall": 0.9433297691678721,
+        "support": 15899.0
       },
+      "eval_accuracy": 0.9191313908741067,
+      "eval_loss": 0.6335331201553345,
       "eval_macro avg": {
+        "f1-score": 0.878333631081819,
+        "precision": 0.8862158290497649,
+        "recall": 0.874268403252523,
+        "support": 36380.0
+      },
+      "eval_runtime": 4.9489,
+      "eval_samples_per_second": 16.367,
+      "eval_steps_per_second": 2.223,
       "eval_weighted avg": {
+        "f1-score": 0.9161451676737934,
+        "precision": 0.9154807870211,
+        "recall": 0.9191313908741067,
+        "support": 36380.0
       },
       "step": 1458
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 2580159309613200.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-1458/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b2dd7b387b7349843b62a9d5b4facde1d14a6a35003d55f9e21a477105ecd1d3
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:95e8ce1619d475b315f2cb3494747dc2424fb9856a35d6759fcf75e79995f1f1
 size 4856