Marcos12886 commited on Sep 8

Commit

65c1586

•

1 Parent(s): a007ad9

Upload folder using huggingface_hub

Browse files

Files changed (39) hide show

README.md +14 -15
checkpoint-170/model.safetensors +1 -1
checkpoint-170/optimizer.pt +1 -1
checkpoint-170/scheduler.pt +1 -1
checkpoint-170/trainer_state.json +19 -19
checkpoint-170/training_args.bin +1 -1
checkpoint-256/model.safetensors +1 -1
checkpoint-256/optimizer.pt +1 -1
checkpoint-256/scheduler.pt +1 -1
checkpoint-256/trainer_state.json +28 -28
checkpoint-256/training_args.bin +1 -1
checkpoint-341/model.safetensors +1 -1
checkpoint-341/optimizer.pt +1 -1
checkpoint-341/scheduler.pt +1 -1
checkpoint-341/trainer_state.json +35 -35
checkpoint-341/training_args.bin +1 -1
checkpoint-426/model.safetensors +1 -1
checkpoint-426/optimizer.pt +1 -1
checkpoint-426/scheduler.pt +1 -1
checkpoint-426/trainer_state.json +43 -43
checkpoint-426/training_args.bin +1 -1
checkpoint-512/model.safetensors +1 -1
checkpoint-512/optimizer.pt +1 -1
checkpoint-512/scheduler.pt +1 -1
checkpoint-512/trainer_state.json +55 -55
checkpoint-512/training_args.bin +1 -1
checkpoint-597/model.safetensors +1 -1
checkpoint-597/optimizer.pt +1 -1
checkpoint-597/scheduler.pt +1 -1
checkpoint-597/trainer_state.json +64 -64
checkpoint-597/training_args.bin +1 -1
checkpoint-85/model.safetensors +1 -1
checkpoint-85/optimizer.pt +1 -1
checkpoint-85/scheduler.pt +1 -1
checkpoint-85/trainer_state.json +11 -11
checkpoint-85/training_args.bin +1 -1
model.safetensors +1 -1
runs/Sep08_20-15-47_ubumarcos/events.out.tfevents.1725819348.ubumarcos +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -21,11 +21,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0878
-- Accuracy: 0.9861
-- Precision: 0.9861
-- Recall: 0.9861
-- F1: 0.9861
 ## Model description
@@ -44,7 +44,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0001
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 123
@@ -53,20 +53,19 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.001
-- num_epochs: 8
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
-| No log        | 0.9956 | 85   | 0.1204          | 0.9641   | 0.9641    | 0.9641 | 0.9638 |
-| No log        | 1.9912 | 170  | 0.0847          | 0.9773   | 0.9772    | 0.9773 | 0.9773 |
-| No log        | 2.9985 | 256  | 0.1025          | 0.9766   | 0.9769    | 0.9766 | 0.9766 |
-| No log        | 3.9941 | 341  | 0.0869          | 0.9832   | 0.9835    | 0.9832 | 0.9832 |
-| No log        | 4.9898 | 426  | 0.0746          | 0.9832   | 0.9834    | 0.9832 | 0.9832 |
-| 0.0538        | 5.9971 | 512  | 0.0870          | 0.9861   | 0.9861    | 0.9861 | 0.9861 |
-| 0.0538        | 6.9927 | 597  | 0.0890          | 0.9861   | 0.9861    | 0.9861 | 0.9861 |
-| 0.0538        | 7.9649 | 680  | 0.0878          | 0.9861   | 0.9861    | 0.9861 | 0.9861 |
 ### Framework versions

 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0359
+- Accuracy: 0.9883
+- Precision: 0.9883
+- Recall: 0.9883
+- F1: 0.9883
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 123
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.001
+- num_epochs: 10
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| No log        | 0.9956 | 85   | 0.1341          | 0.9538   | 0.9543    | 0.9538 | 0.9532 |
+| No log        | 1.9912 | 170  | 0.0831          | 0.9700   | 0.9720    | 0.9700 | 0.9703 |
+| No log        | 2.9985 | 256  | 0.0570          | 0.9846   | 0.9847    | 0.9846 | 0.9846 |
+| No log        | 3.9941 | 341  | 0.0340          | 0.9897   | 0.9898    | 0.9897 | 0.9898 |
+| No log        | 4.9898 | 426  | 0.0460          | 0.9875   | 0.9879    | 0.9875 | 0.9876 |
+| 0.0707        | 5.9971 | 512  | 0.0431          | 0.9897   | 0.9899    | 0.9897 | 0.9898 |
+| 0.0707        | 6.9927 | 597  | 0.0359          | 0.9883   | 0.9883    | 0.9883 | 0.9883 |
 ### Framework versions

checkpoint-170/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ddc4c9cb0876910fe2ac6089e9622d2ec25163c90268babf3b3a68cc1955bbc3
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:85ed9f40490b0d3b2eab42a74aa78295bc0d5dc610c89bcfd6132ab265cc46c1
 size 94763496

checkpoint-170/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f284ad3b43a12e7fdbaf43673ca92e158c1ab9cbea63e0352b6085f5564ff555
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:884f223ad6abdd025f9f4a7bfacafc6c26b7792676f01b2a92bf8115fe98f14b
 size 189552570

checkpoint-170/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:28ead2442e291cf84a44bd5f670a529388e7aee7f31ec31fec65f8af5dd527ac
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:9cb57d1cea1cb2499417a821f65ecd6374c5073b4605d8ad26f8414a8ef5b7bd
 size 1064

checkpoint-170/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9772893772893773,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 1.9912152269399708,
   "eval_steps": 500,
@@ -10,33 +10,33 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_f1": 0.9772624500008753,
-      "eval_loss": 0.08473604917526245,
-      "eval_precision": 0.9772470873644479,
-      "eval_recall": 0.9772893772893773,
-      "eval_runtime": 5.9068,
-      "eval_samples_per_second": 231.09,
-      "eval_steps_per_second": 28.95,
       "step": 170
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.96996336996337,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 1.9912152269399708,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.96996336996337,
+      "eval_f1": 0.970275727358029,
+      "eval_loss": 0.08308757096529007,
+      "eval_precision": 0.9720059808561178,
+      "eval_recall": 0.96996336996337,
+      "eval_runtime": 5.9321,
+      "eval_samples_per_second": 230.105,
+      "eval_steps_per_second": 28.826,
       "step": 170
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-170/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

checkpoint-256/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1e8fcce3d6821b09907a57bf2280fdb73fc79c008d23670c77bd0350d6249146
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0ef8be12a66054ee49a311e5cbc1e77f0f3bfeb6e0808f2d1f3fb47764355ad
 size 94763496

checkpoint-256/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb370b3600823d6c126a14d977da564c51a816566b23701954070eb23a1ecf47
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:1fa10a1f73ef67de699f17b8a38795e4419b28e161b6906950ff154e933bfac8
 size 189552570

checkpoint-256/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b1ef84753a69d0410f7f7d925e2fedd5694b09472e6721f4fe864ef701cb0dd7
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:b581d82b68cb684515c782403bb76f13250579eff8704b811486ec59bb8e6b6a
 size 1064

checkpoint-256/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.9772893772893773,
-  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 2.998535871156662,
   "eval_steps": 500,
   "global_step": 256,
@@ -10,45 +10,45 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_f1": 0.9772624500008753,
-      "eval_loss": 0.08473604917526245,
-      "eval_precision": 0.9772470873644479,
-      "eval_recall": 0.9772893772893773,
-      "eval_runtime": 5.9068,
-      "eval_samples_per_second": 231.09,
-      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9765567765567765,
-      "eval_f1": 0.9766464967450174,
-      "eval_loss": 0.10245847702026367,
-      "eval_precision": 0.9768621127754256,
-      "eval_recall": 0.9765567765567765,
-      "eval_runtime": 5.8911,
-      "eval_samples_per_second": 231.706,
-      "eval_steps_per_second": 29.027,
       "step": 256
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9846153846153847,
+  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-256",
   "epoch": 2.998535871156662,
   "eval_steps": 500,
   "global_step": 256,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.96996336996337,
+      "eval_f1": 0.970275727358029,
+      "eval_loss": 0.08308757096529007,
+      "eval_precision": 0.9720059808561178,
+      "eval_recall": 0.96996336996337,
+      "eval_runtime": 5.9321,
+      "eval_samples_per_second": 230.105,
+      "eval_steps_per_second": 28.826,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9846153846153847,
+      "eval_f1": 0.9845587007434289,
+      "eval_loss": 0.05695493519306183,
+      "eval_precision": 0.984652882646444,
+      "eval_recall": 0.9846153846153847,
+      "eval_runtime": 5.924,
+      "eval_samples_per_second": 230.421,
+      "eval_steps_per_second": 28.866,
       "step": 256
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-256/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

checkpoint-341/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:083f40b77a3962067064a68eb072696b4bf2222ce7f9bdab915843b0aab6cf86
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:937ffa1cb79f16f4e7753ea842c3e32fe34e525562027e5b33ce48fc4b308a82
 size 94763496

checkpoint-341/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f581f41271d1b7b3e94ec5316e0b37c75a3ad264185a441b84016451887b8ec4
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a6119421582bbc05f8c02a4a9aab4dfdd2cb761cc17d9b827d99f803877b837
 size 189552570

checkpoint-341/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d5073b7c775ebf0fc889f5dba154fdfe2dbb913e0f115f2091d61c7aad83715e
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:6383f793cae08448b1e6023eca64340792bd03b29faa8b0a3800859cbaf6c3ca
 size 1064

checkpoint-341/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9831501831501831,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 3.994143484626647,
   "eval_steps": 500,
@@ -10,57 +10,57 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_f1": 0.9772624500008753,
-      "eval_loss": 0.08473604917526245,
-      "eval_precision": 0.9772470873644479,
-      "eval_recall": 0.9772893772893773,
-      "eval_runtime": 5.9068,
-      "eval_samples_per_second": 231.09,
-      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9765567765567765,
-      "eval_f1": 0.9766464967450174,
-      "eval_loss": 0.10245847702026367,
-      "eval_precision": 0.9768621127754256,
-      "eval_recall": 0.9765567765567765,
-      "eval_runtime": 5.8911,
-      "eval_samples_per_second": 231.706,
-      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.9832333934847322,
-      "eval_loss": 0.08685966581106186,
-      "eval_precision": 0.9835305336122597,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9568,
-      "eval_samples_per_second": 229.152,
-      "eval_steps_per_second": 28.707,
       "step": 341
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9897435897435898,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 3.994143484626647,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.96996336996337,
+      "eval_f1": 0.970275727358029,
+      "eval_loss": 0.08308757096529007,
+      "eval_precision": 0.9720059808561178,
+      "eval_recall": 0.96996336996337,
+      "eval_runtime": 5.9321,
+      "eval_samples_per_second": 230.105,
+      "eval_steps_per_second": 28.826,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9846153846153847,
+      "eval_f1": 0.9845587007434289,
+      "eval_loss": 0.05695493519306183,
+      "eval_precision": 0.984652882646444,
+      "eval_recall": 0.9846153846153847,
+      "eval_runtime": 5.924,
+      "eval_samples_per_second": 230.421,
+      "eval_steps_per_second": 28.866,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9897435897435898,
+      "eval_f1": 0.9897502348272303,
+      "eval_loss": 0.03400224819779396,
+      "eval_precision": 0.9897618176566864,
+      "eval_recall": 0.9897435897435898,
+      "eval_runtime": 5.9234,
+      "eval_samples_per_second": 230.441,
+      "eval_steps_per_second": 28.868,
       "step": 341
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-341/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

checkpoint-426/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a9d6d392a4f841e92110c90f40ef7219881d17b11f11a64bad39c27cbe0178e
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:2f2381bd8ac8db8cd3c2425166e4419c44d01eb2bdc4a00d95e3ff3806ebad52
 size 94763496

checkpoint-426/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fcfe6fb7847bde58aeb36b9a7bc45200d4352f754fb3595c33126144f17addf2
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddad96bd00a38ac13e824dddeb8bec0bff93f4b8005f4f483d201e92de9bdadf
 size 189552570

checkpoint-426/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d56f52cf1fd1013d5989e211cbbbf97096f52d89af5defd532d0d8a25d4724f7
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f3d79bed0dd03dfef1d407d59369329e4670d54e356165ddfc162563cf81d14
 size 1064

checkpoint-426/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9831501831501831,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 4.989751098096632,
   "eval_steps": 500,
@@ -10,69 +10,69 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_f1": 0.9772624500008753,
-      "eval_loss": 0.08473604917526245,
-      "eval_precision": 0.9772470873644479,
-      "eval_recall": 0.9772893772893773,
-      "eval_runtime": 5.9068,
-      "eval_samples_per_second": 231.09,
-      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9765567765567765,
-      "eval_f1": 0.9766464967450174,
-      "eval_loss": 0.10245847702026367,
-      "eval_precision": 0.9768621127754256,
-      "eval_recall": 0.9765567765567765,
-      "eval_runtime": 5.8911,
-      "eval_samples_per_second": 231.706,
-      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.9832333934847322,
-      "eval_loss": 0.08685966581106186,
-      "eval_precision": 0.9835305336122597,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9568,
-      "eval_samples_per_second": 229.152,
-      "eval_steps_per_second": 28.707,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.983208365019189,
-      "eval_loss": 0.07458490133285522,
-      "eval_precision": 0.9833696765629429,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9419,
-      "eval_samples_per_second": 229.726,
-      "eval_steps_per_second": 28.779,
       "step": 426
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9897435897435898,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 4.989751098096632,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.96996336996337,
+      "eval_f1": 0.970275727358029,
+      "eval_loss": 0.08308757096529007,
+      "eval_precision": 0.9720059808561178,
+      "eval_recall": 0.96996336996337,
+      "eval_runtime": 5.9321,
+      "eval_samples_per_second": 230.105,
+      "eval_steps_per_second": 28.826,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9846153846153847,
+      "eval_f1": 0.9845587007434289,
+      "eval_loss": 0.05695493519306183,
+      "eval_precision": 0.984652882646444,
+      "eval_recall": 0.9846153846153847,
+      "eval_runtime": 5.924,
+      "eval_samples_per_second": 230.421,
+      "eval_steps_per_second": 28.866,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9897435897435898,
+      "eval_f1": 0.9897502348272303,
+      "eval_loss": 0.03400224819779396,
+      "eval_precision": 0.9897618176566864,
+      "eval_recall": 0.9897435897435898,
+      "eval_runtime": 5.9234,
+      "eval_samples_per_second": 230.441,
+      "eval_steps_per_second": 28.868,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9875457875457876,
+      "eval_f1": 0.9876042969414931,
+      "eval_loss": 0.04599935933947563,
+      "eval_precision": 0.9879353582239604,
+      "eval_recall": 0.9875457875457876,
+      "eval_runtime": 5.9141,
+      "eval_samples_per_second": 230.803,
+      "eval_steps_per_second": 28.914,
       "step": 426
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-426/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

checkpoint-512/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbc5b2463f7b10d6accd90a38663b1fe5924ce417d20bd4c4b022491ab407a53
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:35b0d90358beea477341c41eb5ba7259fabcc0922d7900d91362f0fbaf06bab2
 size 94763496

checkpoint-512/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:00ec41f63df75118d702c2384056a8cc4b5a13080b78a48bdd542ffc79dc1c02
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:648b988b59d53cdfb9a307e0c1ecb64a428672a7b441f4145e8d3d009ae2cfbe
 size 189552570

checkpoint-512/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bcc97a747eb11a8dc86d1d122f7b8fac6f5b54e0a4e11d9bd187896e44dca8fe
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1f22cb39573891adcd854d571d182ed521927c0644cb49b42c5a9a0f0635791
 size 1064

checkpoint-512/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.9860805860805861,
-  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
   "epoch": 5.997071742313324,
   "eval_steps": 500,
   "global_step": 512,
@@ -10,88 +10,88 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_f1": 0.9772624500008753,
-      "eval_loss": 0.08473604917526245,
-      "eval_precision": 0.9772470873644479,
-      "eval_recall": 0.9772893772893773,
-      "eval_runtime": 5.9068,
-      "eval_samples_per_second": 231.09,
-      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9765567765567765,
-      "eval_f1": 0.9766464967450174,
-      "eval_loss": 0.10245847702026367,
-      "eval_precision": 0.9768621127754256,
-      "eval_recall": 0.9765567765567765,
-      "eval_runtime": 5.8911,
-      "eval_samples_per_second": 231.706,
-      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.9832333934847322,
-      "eval_loss": 0.08685966581106186,
-      "eval_precision": 0.9835305336122597,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9568,
-      "eval_samples_per_second": 229.152,
-      "eval_steps_per_second": 28.707,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.983208365019189,
-      "eval_loss": 0.07458490133285522,
-      "eval_precision": 0.9833696765629429,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9419,
-      "eval_samples_per_second": 229.726,
-      "eval_steps_per_second": 28.779,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
-      "grad_norm": 0.01886621303856373,
-      "learning_rate": 1.6360497736760383e-05,
-      "loss": 0.0538,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_f1": 0.9860860332682386,
-      "eval_loss": 0.08699370175600052,
-      "eval_precision": 0.9860927746075414,
-      "eval_recall": 0.9860805860805861,
-      "eval_runtime": 5.9399,
-      "eval_samples_per_second": 229.803,
-      "eval_steps_per_second": 28.789,
       "step": 512
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9897435897435898,
+  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 5.997071742313324,
   "eval_steps": 500,
   "global_step": 512,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.96996336996337,
+      "eval_f1": 0.970275727358029,
+      "eval_loss": 0.08308757096529007,
+      "eval_precision": 0.9720059808561178,
+      "eval_recall": 0.96996336996337,
+      "eval_runtime": 5.9321,
+      "eval_samples_per_second": 230.105,
+      "eval_steps_per_second": 28.826,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9846153846153847,
+      "eval_f1": 0.9845587007434289,
+      "eval_loss": 0.05695493519306183,
+      "eval_precision": 0.984652882646444,
+      "eval_recall": 0.9846153846153847,
+      "eval_runtime": 5.924,
+      "eval_samples_per_second": 230.421,
+      "eval_steps_per_second": 28.866,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9897435897435898,
+      "eval_f1": 0.9897502348272303,
+      "eval_loss": 0.03400224819779396,
+      "eval_precision": 0.9897618176566864,
+      "eval_recall": 0.9897435897435898,
+      "eval_runtime": 5.9234,
+      "eval_samples_per_second": 230.441,
+      "eval_steps_per_second": 28.868,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9875457875457876,
+      "eval_f1": 0.9876042969414931,
+      "eval_loss": 0.04599935933947563,
+      "eval_precision": 0.9879353582239604,
+      "eval_recall": 0.9875457875457876,
+      "eval_runtime": 5.9141,
+      "eval_samples_per_second": 230.803,
+      "eval_steps_per_second": 28.914,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
+      "grad_norm": 0.020362911745905876,
+      "learning_rate": 1.819507083000514e-05,
+      "loss": 0.0707,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
+      "eval_accuracy": 0.9897435897435898,
+      "eval_f1": 0.9897761336599745,
+      "eval_loss": 0.04312068223953247,
+      "eval_precision": 0.9899308989239506,
+      "eval_recall": 0.9897435897435898,
+      "eval_runtime": 5.5776,
+      "eval_samples_per_second": 244.727,
+      "eval_steps_per_second": 30.658,
       "step": 512
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-512/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

checkpoint-597/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a064606432f81dfcabef436b3a7746c96408c18ddc57930d2e91972b830e997f
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:c617973600d573c483f588a59837c6d45814ca8e16c64575f5523b65246f0c5e
 size 94763496

checkpoint-597/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84091c5d2d0db5e72458d1db7aef4f39da72483fa57f4cd28ecc4085a3dfd425
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:86268f89454cc35e41155e346d8e2ca8d5a9b6f579d1fef2bbfc8b823eace3b9
 size 189552570

checkpoint-597/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbae7c9f313f104f989b156afed3a79758bf4cf1949ca702f760fa941bede2bf
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c216d743853a404a50b6a598e3c4bf36fa1dc8935b24320ebe609a9c5c9b437
 size 1064

checkpoint-597/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.9860805860805861,
-  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
   "epoch": 6.992679355783309,
   "eval_steps": 500,
   "global_step": 597,
@@ -10,100 +10,100 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_f1": 0.9772624500008753,
-      "eval_loss": 0.08473604917526245,
-      "eval_precision": 0.9772470873644479,
-      "eval_recall": 0.9772893772893773,
-      "eval_runtime": 5.9068,
-      "eval_samples_per_second": 231.09,
-      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9765567765567765,
-      "eval_f1": 0.9766464967450174,
-      "eval_loss": 0.10245847702026367,
-      "eval_precision": 0.9768621127754256,
-      "eval_recall": 0.9765567765567765,
-      "eval_runtime": 5.8911,
-      "eval_samples_per_second": 231.706,
-      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.9832333934847322,
-      "eval_loss": 0.08685966581106186,
-      "eval_precision": 0.9835305336122597,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9568,
-      "eval_samples_per_second": 229.152,
-      "eval_steps_per_second": 28.707,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
-      "eval_accuracy": 0.9831501831501831,
-      "eval_f1": 0.983208365019189,
-      "eval_loss": 0.07458490133285522,
-      "eval_precision": 0.9833696765629429,
-      "eval_recall": 0.9831501831501831,
-      "eval_runtime": 5.9419,
-      "eval_samples_per_second": 229.726,
-      "eval_steps_per_second": 28.779,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
-      "grad_norm": 0.01886621303856373,
-      "learning_rate": 1.6360497736760383e-05,
-      "loss": 0.0538,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_f1": 0.9860860332682386,
-      "eval_loss": 0.08699370175600052,
-      "eval_precision": 0.9860927746075414,
-      "eval_recall": 0.9860805860805861,
-      "eval_runtime": 5.9399,
-      "eval_samples_per_second": 229.803,
-      "eval_steps_per_second": 28.789,
       "step": 512
     },
     {
       "epoch": 6.992679355783309,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_f1": 0.9860860332682386,
-      "eval_loss": 0.08903729915618896,
-      "eval_precision": 0.9860927746075414,
-      "eval_recall": 0.9860805860805861,
-      "eval_runtime": 5.9207,
-      "eval_samples_per_second": 230.546,
-      "eval_steps_per_second": 28.882,
       "step": 597
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {
@@ -121,7 +121,7 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }

 {
+  "best_metric": 0.9897435897435898,
+  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 6.992679355783309,
   "eval_steps": 500,
   "global_step": 597,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.96996336996337,
+      "eval_f1": 0.970275727358029,
+      "eval_loss": 0.08308757096529007,
+      "eval_precision": 0.9720059808561178,
+      "eval_recall": 0.96996336996337,
+      "eval_runtime": 5.9321,
+      "eval_samples_per_second": 230.105,
+      "eval_steps_per_second": 28.826,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9846153846153847,
+      "eval_f1": 0.9845587007434289,
+      "eval_loss": 0.05695493519306183,
+      "eval_precision": 0.984652882646444,
+      "eval_recall": 0.9846153846153847,
+      "eval_runtime": 5.924,
+      "eval_samples_per_second": 230.421,
+      "eval_steps_per_second": 28.866,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9897435897435898,
+      "eval_f1": 0.9897502348272303,
+      "eval_loss": 0.03400224819779396,
+      "eval_precision": 0.9897618176566864,
+      "eval_recall": 0.9897435897435898,
+      "eval_runtime": 5.9234,
+      "eval_samples_per_second": 230.441,
+      "eval_steps_per_second": 28.868,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9875457875457876,
+      "eval_f1": 0.9876042969414931,
+      "eval_loss": 0.04599935933947563,
+      "eval_precision": 0.9879353582239604,
+      "eval_recall": 0.9875457875457876,
+      "eval_runtime": 5.9141,
+      "eval_samples_per_second": 230.803,
+      "eval_steps_per_second": 28.914,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
+      "grad_norm": 0.020362911745905876,
+      "learning_rate": 1.819507083000514e-05,
+      "loss": 0.0707,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
+      "eval_accuracy": 0.9897435897435898,
+      "eval_f1": 0.9897761336599745,
+      "eval_loss": 0.04312068223953247,
+      "eval_precision": 0.9899308989239506,
+      "eval_recall": 0.9897435897435898,
+      "eval_runtime": 5.5776,
+      "eval_samples_per_second": 244.727,
+      "eval_steps_per_second": 30.658,
       "step": 512
     },
     {
       "epoch": 6.992679355783309,
+      "eval_accuracy": 0.9882783882783883,
+      "eval_f1": 0.9882934987415589,
+      "eval_loss": 0.035927049815654755,
+      "eval_precision": 0.9883282714000319,
+      "eval_recall": 0.9882783882783883,
+      "eval_runtime": 5.5806,
+      "eval_samples_per_second": 244.596,
+      "eval_steps_per_second": 30.642,
       "step": 597
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }

checkpoint-597/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

checkpoint-85/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a15277aa4797964b12aaedf5acf9218acf9f11597a299deaf3a64bad8d89176e
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:735ade2638b1f118fe459d58e0f846d8676adb708417e44d45e5c5631286bd6c
 size 94763496

checkpoint-85/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9c4d0328f867e3a4371326367364a334fc34c6ecaba4f27c44bae6d943a3f5e
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9c2df0704bbd0ae60f95b2890a8b3ca3655b01d98a8e15e46e75396add56c28
 size 189552570

checkpoint-85/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a3200599f03a01d89a474fcdd8a567058cd33b2f50dde928b44d422ff5012f0
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:627e28ee33138f33050cb3ea94003427c4a362d22084d2243ecd2a8541bf03ff
 size 1064

checkpoint-85/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9641025641025641,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-85",
   "epoch": 0.9956076134699854,
   "eval_steps": 500,
@@ -10,21 +10,21 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9641025641025641,
-      "eval_f1": 0.9637911305761953,
-      "eval_loss": 0.12035853415727615,
-      "eval_precision": 0.9640509308043554,
-      "eval_recall": 0.9641025641025641,
-      "eval_runtime": 6.052,
-      "eval_samples_per_second": 225.545,
-      "eval_steps_per_second": 28.255,
       "step": 85
     }
   ],
   "logging_steps": 500,
-  "max_steps": 680,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9538461538461539,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-85",
   "epoch": 0.9956076134699854,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9538461538461539,
+      "eval_f1": 0.953235199825453,
+      "eval_loss": 0.13410410284996033,
+      "eval_precision": 0.9543176332312968,
+      "eval_recall": 0.9538461538461539,
+      "eval_runtime": 5.9191,
+      "eval_samples_per_second": 230.61,
+      "eval_steps_per_second": 28.89,
       "step": 85
     }
   ],
   "logging_steps": 500,
+  "max_steps": 850,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-85/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbc5b2463f7b10d6accd90a38663b1fe5924ce417d20bd4c4b022491ab407a53
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:937ffa1cb79f16f4e7753ea842c3e32fe34e525562027e5b33ce48fc4b308a82
 size 94763496

runs/Sep08_20-15-47_ubumarcos/events.out.tfevents.1725819348.ubumarcos ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3acac0f35b9d995564af973913d52663295aac3c4883be89bc110f97f39bcd36
+size 9711

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:831297954221509dc3f32e8eaf01789c3f660cf430e186799d52e58ec3b5b334
 size 5240