Marcos12886 commited on Sep 8

Commit

a007ad9

•

1 Parent(s): 7630b28

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +20 -2
checkpoint-170/config.json +3 -2
checkpoint-170/model.safetensors +1 -1
checkpoint-170/optimizer.pt +1 -1
checkpoint-170/scheduler.pt +1 -1
checkpoint-170/trainer_state.json +19 -13
checkpoint-170/training_args.bin +1 -1
checkpoint-256/config.json +3 -2
checkpoint-256/model.safetensors +1 -1
checkpoint-256/optimizer.pt +1 -1
checkpoint-256/scheduler.pt +1 -1
checkpoint-256/trainer_state.json +27 -18
checkpoint-256/training_args.bin +1 -1
checkpoint-341/config.json +3 -2
checkpoint-341/model.safetensors +1 -1
checkpoint-341/optimizer.pt +1 -1
checkpoint-341/scheduler.pt +1 -1
checkpoint-341/trainer_state.json +35 -23
checkpoint-341/training_args.bin +1 -1
checkpoint-426/config.json +3 -2
checkpoint-426/model.safetensors +1 -1
checkpoint-426/optimizer.pt +1 -1
checkpoint-426/scheduler.pt +1 -1
checkpoint-426/trainer_state.json +44 -29
checkpoint-426/training_args.bin +1 -1
checkpoint-512/config.json +3 -2
checkpoint-512/model.safetensors +1 -1
checkpoint-512/optimizer.pt +1 -1
checkpoint-512/scheduler.pt +1 -1
checkpoint-512/trainer_state.json +54 -36
checkpoint-512/training_args.bin +1 -1
checkpoint-597/config.json +3 -2
checkpoint-597/model.safetensors +1 -1
checkpoint-597/optimizer.pt +1 -1
checkpoint-597/scheduler.pt +1 -1
checkpoint-597/trainer_state.json +62 -41
checkpoint-597/training_args.bin +1 -1
checkpoint-680/config.json +81 -0
checkpoint-680/model.safetensors +3 -0
checkpoint-680/optimizer.pt +3 -0
checkpoint-680/rng_state.pth +3 -0
checkpoint-680/scheduler.pt +3 -0
checkpoint-680/trainer_state.json +145 -0
checkpoint-680/training_args.bin +3 -0
checkpoint-85/model.safetensors +1 -1
checkpoint-85/optimizer.pt +1 -1
checkpoint-85/rng_state.pth +1 -1
checkpoint-85/scheduler.pt +1 -1
checkpoint-85/trainer_state.json +13 -13
checkpoint-85/training_args.bin +1 -1

README.md CHANGED Viewed

@@ -4,6 +4,11 @@ license: apache-2.0
 base_model: ntu-spml/distilhubert
 tags:
 - generated_from_trainer
 model-index:
 - name: distilhubert-finetuned-cry-detector
   results: []
@@ -15,6 +20,12 @@ should probably proofread and complete it, then remove this comment. -->
 # distilhubert-finetuned-cry-detector
 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 ## Model description
@@ -42,13 +53,20 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.001
-- num_epochs: 1
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
-| No log        | 0.9956 | 85   | 0.1412          | 0.9480   | 0.9478    | 0.9480 | 0.9476 |
 ### Framework versions

 base_model: ntu-spml/distilhubert
 tags:
 - generated_from_trainer
+metrics:
+- accuracy
+- precision
+- recall
+- f1
 model-index:
 - name: distilhubert-finetuned-cry-detector
   results: []
 # distilhubert-finetuned-cry-detector
 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0878
+- Accuracy: 0.9861
+- Precision: 0.9861
+- Recall: 0.9861
+- F1: 0.9861
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.001
+- num_epochs: 8
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| No log        | 0.9956 | 85   | 0.1204          | 0.9641   | 0.9641    | 0.9641 | 0.9638 |
+| No log        | 1.9912 | 170  | 0.0847          | 0.9773   | 0.9772    | 0.9773 | 0.9773 |
+| No log        | 2.9985 | 256  | 0.1025          | 0.9766   | 0.9769    | 0.9766 | 0.9766 |
+| No log        | 3.9941 | 341  | 0.0869          | 0.9832   | 0.9835    | 0.9832 | 0.9832 |
+| No log        | 4.9898 | 426  | 0.0746          | 0.9832   | 0.9834    | 0.9832 | 0.9832 |
+| 0.0538        | 5.9971 | 512  | 0.0870          | 0.9861   | 0.9861    | 0.9861 | 0.9861 |
+| 0.0538        | 6.9927 | 597  | 0.0890          | 0.9861   | 0.9861    | 0.9861 | 0.9861 |
+| 0.0538        | 7.9649 | 680  | 0.0878          | 0.9861   | 0.9861    | 0.9861 | 0.9861 |
 ### Framework versions

checkpoint-170/config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
@@ -55,8 +56,8 @@
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "crying": "0",
-    "no_crying": "1"
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "crying": 0,
+    "no_crying": 1
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

checkpoint-170/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:234766c4455d275002665fd833b44efa39e41bc2661c4bb2462491e9b235265b
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddc4c9cb0876910fe2ac6089e9622d2ec25163c90268babf3b3a68cc1955bbc3
 size 94763496

checkpoint-170/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:54168c775d69b037d7dd954b39f148a62b5d5230761ef39bcb3fc60c2c2b65be
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:f284ad3b43a12e7fdbaf43673ca92e158c1ab9cbea63e0352b6085f5564ff555
 size 189552570

checkpoint-170/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2034409269304d3556c2ec17a8e8112c21629214e514ea105efbb26052b23cf
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:28ead2442e291cf84a44bd5f670a529388e7aee7f31ec31fec65f8af5dd527ac
 size 1064

checkpoint-170/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9860805860805861,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 1.9912152269399708,
   "eval_steps": 500,
@@ -10,27 +10,33 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_loss": 0.06922276318073273,
-      "eval_runtime": 15.5305,
-      "eval_samples_per_second": 87.892,
-      "eval_steps_per_second": 11.011,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_loss": 0.04661192744970322,
-      "eval_runtime": 15.4605,
-      "eval_samples_per_second": 88.29,
-      "eval_steps_per_second": 11.06,
       "step": 170
     }
   ],
   "logging_steps": 500,
-  "max_steps": 850,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9772893772893773,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 1.9912152269399708,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
       "step": 170
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-170/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84d763bc52a548d7900e672478766167dea5015bedfc4ad077e5cffda9256cc8
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

checkpoint-256/config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
@@ -55,8 +56,8 @@
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "crying": "0",
-    "no_crying": "1"
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "crying": 0,
+    "no_crying": 1
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

checkpoint-256/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74664b03f722ebd6f388e4906fa982d1ec05522a8b62f38b65182ae0f78dd659
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:1e8fcce3d6821b09907a57bf2280fdb73fc79c008d23670c77bd0350d6249146
 size 94763496

checkpoint-256/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c93c7b3a43b80636a934d1782de63f8303fd44e61f41d41d41caa10a9639ffc1
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb370b3600823d6c126a14d977da564c51a816566b23701954070eb23a1ecf47
 size 189552570

checkpoint-256/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c1daa6dfbc632505773869a612096b9f14303a596de4d72e49c6d934621e4204
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:b1ef84753a69d0410f7f7d925e2fedd5694b09472e6721f4fe864ef701cb0dd7
 size 1064

checkpoint-256/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9860805860805861,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 2.998535871156662,
   "eval_steps": 500,
@@ -10,36 +10,45 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_loss": 0.06922276318073273,
-      "eval_runtime": 15.5305,
-      "eval_samples_per_second": 87.892,
-      "eval_steps_per_second": 11.011,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_loss": 0.04661192744970322,
-      "eval_runtime": 15.4605,
-      "eval_samples_per_second": 88.29,
-      "eval_steps_per_second": 11.06,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9853479853479854,
-      "eval_loss": 0.04894961416721344,
-      "eval_runtime": 15.5622,
-      "eval_samples_per_second": 87.713,
-      "eval_steps_per_second": 10.988,
       "step": 256
     }
   ],
   "logging_steps": 500,
-  "max_steps": 850,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9772893772893773,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-170",
   "epoch": 2.998535871156662,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9765567765567765,
+      "eval_f1": 0.9766464967450174,
+      "eval_loss": 0.10245847702026367,
+      "eval_precision": 0.9768621127754256,
+      "eval_recall": 0.9765567765567765,
+      "eval_runtime": 5.8911,
+      "eval_samples_per_second": 231.706,
+      "eval_steps_per_second": 29.027,
       "step": 256
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-256/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84d763bc52a548d7900e672478766167dea5015bedfc4ad077e5cffda9256cc8
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

checkpoint-341/config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
@@ -55,8 +56,8 @@
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "crying": "0",
-    "no_crying": "1"
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "crying": 0,
+    "no_crying": 1
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

checkpoint-341/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4c4695016088987cb75a8381886d078dee5da33d439dfa3472cbded298196975
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:083f40b77a3962067064a68eb072696b4bf2222ce7f9bdab915843b0aab6cf86
 size 94763496

checkpoint-341/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88625b2c249303af96915509b84fbe0fd810785b84d32d68e936f83e44e0c710
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:f581f41271d1b7b3e94ec5316e0b37c75a3ad264185a441b84016451887b8ec4
 size 189552570

checkpoint-341/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d0e5f3394e1cb08f5e6ec9d7e11dc43d76ef8c66bf2eaa7a0f848f815b1d4cc
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:d5073b7c775ebf0fc889f5dba154fdfe2dbb913e0f115f2091d61c7aad83715e
 size 1064

checkpoint-341/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9897435897435898,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 3.994143484626647,
   "eval_steps": 500,
@@ -10,45 +10,57 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_loss": 0.06922276318073273,
-      "eval_runtime": 15.5305,
-      "eval_samples_per_second": 87.892,
-      "eval_steps_per_second": 11.011,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_loss": 0.04661192744970322,
-      "eval_runtime": 15.4605,
-      "eval_samples_per_second": 88.29,
-      "eval_steps_per_second": 11.06,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9853479853479854,
-      "eval_loss": 0.04894961416721344,
-      "eval_runtime": 15.5622,
-      "eval_samples_per_second": 87.713,
-      "eval_steps_per_second": 10.988,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9897435897435898,
-      "eval_loss": 0.04228556528687477,
-      "eval_runtime": 15.6217,
-      "eval_samples_per_second": 87.378,
-      "eval_steps_per_second": 10.946,
       "step": 341
     }
   ],
   "logging_steps": 500,
-  "max_steps": 850,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9831501831501831,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 3.994143484626647,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9765567765567765,
+      "eval_f1": 0.9766464967450174,
+      "eval_loss": 0.10245847702026367,
+      "eval_precision": 0.9768621127754256,
+      "eval_recall": 0.9765567765567765,
+      "eval_runtime": 5.8911,
+      "eval_samples_per_second": 231.706,
+      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.9832333934847322,
+      "eval_loss": 0.08685966581106186,
+      "eval_precision": 0.9835305336122597,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9568,
+      "eval_samples_per_second": 229.152,
+      "eval_steps_per_second": 28.707,
       "step": 341
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-341/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84d763bc52a548d7900e672478766167dea5015bedfc4ad077e5cffda9256cc8
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

checkpoint-426/config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
@@ -55,8 +56,8 @@
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "crying": "0",
-    "no_crying": "1"
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "crying": 0,
+    "no_crying": 1
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

checkpoint-426/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d14ac9c4fea572b7ef6e0e3502f94a78d1c0c3fef295cf4a6f6746aeac8feaf9
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a9d6d392a4f841e92110c90f40ef7219881d17b11f11a64bad39c27cbe0178e
 size 94763496

checkpoint-426/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2bfbb9842afd0e0e7c548c18e2442c293c57767268f19e3c10c10c38c6745a66
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:fcfe6fb7847bde58aeb36b9a7bc45200d4352f754fb3595c33126144f17addf2
 size 189552570

checkpoint-426/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d495ecbbc4c3121c1feab1c93a2d37084137f7007f1d94685663700a6993c70
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:d56f52cf1fd1013d5989e211cbbbf97096f52d89af5defd532d0d8a25d4724f7
 size 1064

checkpoint-426/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.991941391941392,
-  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-426",
   "epoch": 4.989751098096632,
   "eval_steps": 500,
   "global_step": 426,
@@ -10,54 +10,69 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_loss": 0.06922276318073273,
-      "eval_runtime": 15.5305,
-      "eval_samples_per_second": 87.892,
-      "eval_steps_per_second": 11.011,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_loss": 0.04661192744970322,
-      "eval_runtime": 15.4605,
-      "eval_samples_per_second": 88.29,
-      "eval_steps_per_second": 11.06,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9853479853479854,
-      "eval_loss": 0.04894961416721344,
-      "eval_runtime": 15.5622,
-      "eval_samples_per_second": 87.713,
-      "eval_steps_per_second": 10.988,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9897435897435898,
-      "eval_loss": 0.04228556528687477,
-      "eval_runtime": 15.6217,
-      "eval_samples_per_second": 87.378,
-      "eval_steps_per_second": 10.946,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
-      "eval_accuracy": 0.991941391941392,
-      "eval_loss": 0.044283464550971985,
-      "eval_runtime": 15.0667,
-      "eval_samples_per_second": 90.597,
-      "eval_steps_per_second": 11.35,
       "step": 426
     }
   ],
   "logging_steps": 500,
-  "max_steps": 850,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9831501831501831,
+  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-341",
   "epoch": 4.989751098096632,
   "eval_steps": 500,
   "global_step": 426,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9765567765567765,
+      "eval_f1": 0.9766464967450174,
+      "eval_loss": 0.10245847702026367,
+      "eval_precision": 0.9768621127754256,
+      "eval_recall": 0.9765567765567765,
+      "eval_runtime": 5.8911,
+      "eval_samples_per_second": 231.706,
+      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.9832333934847322,
+      "eval_loss": 0.08685966581106186,
+      "eval_precision": 0.9835305336122597,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9568,
+      "eval_samples_per_second": 229.152,
+      "eval_steps_per_second": 28.707,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.983208365019189,
+      "eval_loss": 0.07458490133285522,
+      "eval_precision": 0.9833696765629429,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9419,
+      "eval_samples_per_second": 229.726,
+      "eval_steps_per_second": 28.779,
       "step": 426
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-426/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84d763bc52a548d7900e672478766167dea5015bedfc4ad077e5cffda9256cc8
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

checkpoint-512/config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
@@ -55,8 +56,8 @@
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "crying": "0",
-    "no_crying": "1"
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "crying": 0,
+    "no_crying": 1
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

checkpoint-512/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3dc7074a340619ed7e6d2c55347500f679c4e5f5a30b51392562feb760a9f1c7
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:dbc5b2463f7b10d6accd90a38663b1fe5924ce417d20bd4c4b022491ab407a53
 size 94763496

checkpoint-512/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:02b1c42643e3e59059b3734bb2a70cedcdb1a3f2b1cfd13f8b4f6444d7bb6e94
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:00ec41f63df75118d702c2384056a8cc4b5a13080b78a48bdd542ffc79dc1c02
 size 189552570

checkpoint-512/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:11fe4216d2ecf2b0e2a833d51c97781e3fccf9e2a48a3b58142f2cf031047fa3
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:bcc97a747eb11a8dc86d1d122f7b8fac6f5b54e0a4e11d9bd187896e44dca8fe
 size 1064

checkpoint-512/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9926739926739927,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
   "epoch": 5.997071742313324,
   "eval_steps": 500,
@@ -10,70 +10,88 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_loss": 0.06922276318073273,
-      "eval_runtime": 15.5305,
-      "eval_samples_per_second": 87.892,
-      "eval_steps_per_second": 11.011,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_loss": 0.04661192744970322,
-      "eval_runtime": 15.4605,
-      "eval_samples_per_second": 88.29,
-      "eval_steps_per_second": 11.06,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9853479853479854,
-      "eval_loss": 0.04894961416721344,
-      "eval_runtime": 15.5622,
-      "eval_samples_per_second": 87.713,
-      "eval_steps_per_second": 10.988,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9897435897435898,
-      "eval_loss": 0.04228556528687477,
-      "eval_runtime": 15.6217,
-      "eval_samples_per_second": 87.378,
-      "eval_steps_per_second": 10.946,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
-      "eval_accuracy": 0.991941391941392,
-      "eval_loss": 0.044283464550971985,
-      "eval_runtime": 15.0667,
-      "eval_samples_per_second": 90.597,
-      "eval_steps_per_second": 11.35,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
-      "grad_norm": 0.008579956367611885,
-      "learning_rate": 3.639014166001028e-05,
-      "loss": 0.055,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
-      "eval_accuracy": 0.9926739926739927,
-      "eval_loss": 0.04338795691728592,
-      "eval_runtime": 14.898,
-      "eval_samples_per_second": 91.623,
-      "eval_steps_per_second": 11.478,
       "step": 512
     }
   ],
   "logging_steps": 500,
-  "max_steps": 850,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9860805860805861,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
   "epoch": 5.997071742313324,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9765567765567765,
+      "eval_f1": 0.9766464967450174,
+      "eval_loss": 0.10245847702026367,
+      "eval_precision": 0.9768621127754256,
+      "eval_recall": 0.9765567765567765,
+      "eval_runtime": 5.8911,
+      "eval_samples_per_second": 231.706,
+      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.9832333934847322,
+      "eval_loss": 0.08685966581106186,
+      "eval_precision": 0.9835305336122597,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9568,
+      "eval_samples_per_second": 229.152,
+      "eval_steps_per_second": 28.707,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.983208365019189,
+      "eval_loss": 0.07458490133285522,
+      "eval_precision": 0.9833696765629429,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9419,
+      "eval_samples_per_second": 229.726,
+      "eval_steps_per_second": 28.779,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
+      "grad_norm": 0.01886621303856373,
+      "learning_rate": 1.6360497736760383e-05,
+      "loss": 0.0538,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
+      "eval_accuracy": 0.9860805860805861,
+      "eval_f1": 0.9860860332682386,
+      "eval_loss": 0.08699370175600052,
+      "eval_precision": 0.9860927746075414,
+      "eval_recall": 0.9860805860805861,
+      "eval_runtime": 5.9399,
+      "eval_samples_per_second": 229.803,
+      "eval_steps_per_second": 28.789,
       "step": 512
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-512/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84d763bc52a548d7900e672478766167dea5015bedfc4ad077e5cffda9256cc8
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

checkpoint-597/config.json CHANGED Viewed

@@ -45,6 +45,7 @@
   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
@@ -55,8 +56,8 @@
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "crying": "0",
-    "no_crying": "1"
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

   "feat_proj_dropout": 0.0,
   "feat_proj_layer_norm": false,
   "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
   "hidden_act": "gelu",
   "hidden_dropout": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "crying": 0,
+    "no_crying": 1
   },
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,

checkpoint-597/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:15156ce7496feffe08a94b0b76ed04e2398b912b56dfe3d329336cae4f32b8ab
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:a064606432f81dfcabef436b3a7746c96408c18ddc57930d2e91972b830e997f
 size 94763496

checkpoint-597/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14a1d6ff155620819b854ea259f85accf2532818e85d714ea4a614a3b91d42cb
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:84091c5d2d0db5e72458d1db7aef4f39da72483fa57f4cd28ecc4085a3dfd425
 size 189552570

checkpoint-597/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08eb49f7720b737aa4a97dd1c15d069bd20c33dc2f3de8105e499906c629b0bb
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:fbae7c9f313f104f989b156afed3a79758bf4cf1949ca702f760fa941bede2bf
 size 1064

checkpoint-597/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9926739926739927,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
   "epoch": 6.992679355783309,
   "eval_steps": 500,
@@ -10,79 +10,100 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9772893772893773,
-      "eval_loss": 0.06922276318073273,
-      "eval_runtime": 15.5305,
-      "eval_samples_per_second": 87.892,
-      "eval_steps_per_second": 11.011,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
-      "eval_accuracy": 0.9860805860805861,
-      "eval_loss": 0.04661192744970322,
-      "eval_runtime": 15.4605,
-      "eval_samples_per_second": 88.29,
-      "eval_steps_per_second": 11.06,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
-      "eval_accuracy": 0.9853479853479854,
-      "eval_loss": 0.04894961416721344,
-      "eval_runtime": 15.5622,
-      "eval_samples_per_second": 87.713,
-      "eval_steps_per_second": 10.988,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
-      "eval_accuracy": 0.9897435897435898,
-      "eval_loss": 0.04228556528687477,
-      "eval_runtime": 15.6217,
-      "eval_samples_per_second": 87.378,
-      "eval_steps_per_second": 10.946,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
-      "eval_accuracy": 0.991941391941392,
-      "eval_loss": 0.044283464550971985,
-      "eval_runtime": 15.0667,
-      "eval_samples_per_second": 90.597,
-      "eval_steps_per_second": 11.35,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
-      "grad_norm": 0.008579956367611885,
-      "learning_rate": 3.639014166001028e-05,
-      "loss": 0.055,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
-      "eval_accuracy": 0.9926739926739927,
-      "eval_loss": 0.04338795691728592,
-      "eval_runtime": 14.898,
-      "eval_samples_per_second": 91.623,
-      "eval_steps_per_second": 11.478,
       "step": 512
     },
     {
       "epoch": 6.992679355783309,
-      "eval_accuracy": 0.9926739926739927,
-      "eval_loss": 0.04399614781141281,
-      "eval_runtime": 15.2426,
-      "eval_samples_per_second": 89.552,
-      "eval_steps_per_second": 11.219,
       "step": 597
     }
   ],
   "logging_steps": 500,
-  "max_steps": 850,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.9860805860805861,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
   "epoch": 6.992679355783309,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     },
     {
       "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
       "step": 170
     },
     {
       "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9765567765567765,
+      "eval_f1": 0.9766464967450174,
+      "eval_loss": 0.10245847702026367,
+      "eval_precision": 0.9768621127754256,
+      "eval_recall": 0.9765567765567765,
+      "eval_runtime": 5.8911,
+      "eval_samples_per_second": 231.706,
+      "eval_steps_per_second": 29.027,
       "step": 256
     },
     {
       "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.9832333934847322,
+      "eval_loss": 0.08685966581106186,
+      "eval_precision": 0.9835305336122597,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9568,
+      "eval_samples_per_second": 229.152,
+      "eval_steps_per_second": 28.707,
       "step": 341
     },
     {
       "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.983208365019189,
+      "eval_loss": 0.07458490133285522,
+      "eval_precision": 0.9833696765629429,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9419,
+      "eval_samples_per_second": 229.726,
+      "eval_steps_per_second": 28.779,
       "step": 426
     },
     {
       "epoch": 5.856515373352855,
+      "grad_norm": 0.01886621303856373,
+      "learning_rate": 1.6360497736760383e-05,
+      "loss": 0.0538,
       "step": 500
     },
     {
       "epoch": 5.997071742313324,
+      "eval_accuracy": 0.9860805860805861,
+      "eval_f1": 0.9860860332682386,
+      "eval_loss": 0.08699370175600052,
+      "eval_precision": 0.9860927746075414,
+      "eval_recall": 0.9860805860805861,
+      "eval_runtime": 5.9399,
+      "eval_samples_per_second": 229.803,
+      "eval_steps_per_second": 28.789,
       "step": 512
     },
     {
       "epoch": 6.992679355783309,
+      "eval_accuracy": 0.9860805860805861,
+      "eval_f1": 0.9860860332682386,
+      "eval_loss": 0.08903729915618896,
+      "eval_precision": 0.9860927746075414,
+      "eval_recall": 0.9860805860805861,
+      "eval_runtime": 5.9207,
+      "eval_samples_per_second": 230.546,
+      "eval_steps_per_second": 28.882,
       "step": 597
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-597/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84d763bc52a548d7900e672478766167dea5015bedfc4ad077e5cffda9256cc8
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240

checkpoint-680/config.json ADDED Viewed

	@@ -0,0 +1,81 @@

+{
+  "_name_or_path": "ntu-spml/distilhubert",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": false,
+  "architectures": [
+    "HubertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.0,
+  "feat_proj_layer_norm": false,
+  "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "crying",
+    "1": "no_crying"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "crying": 0,
+    "no_crying": 1
+  },
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 12,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 2,
+  "pad_token_id": 0,
+  "torch_dtype": "float32",
+  "transformers_version": "4.44.2",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

checkpoint-680/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:44cc698d409540f6e674563ba636b09a358b51b95c971805d7140c78f749221d
+size 94763496

checkpoint-680/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64ee67cfbe8e68b976d9e8b9d28361fe29aabb080922e8ca1dfc46687eee0bf5
+size 189552570

checkpoint-680/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89fd3252e5fe944df77172e7776b58570ce1e9687a28e4844bb5682e98356731
+size 14308

checkpoint-680/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba3c5930117a39fdd2c8cd1183dafd9e8a9fe0628798a35edc18e6f58251dd0e
+size 1064

checkpoint-680/trainer_state.json ADDED Viewed

	@@ -0,0 +1,145 @@

+{
+  "best_metric": 0.9860805860805861,
+  "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-512",
+  "epoch": 7.964860907759883,
+  "eval_steps": 500,
+  "global_step": 680,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
+      "step": 85
+    },
+    {
+      "epoch": 1.9912152269399708,
+      "eval_accuracy": 0.9772893772893773,
+      "eval_f1": 0.9772624500008753,
+      "eval_loss": 0.08473604917526245,
+      "eval_precision": 0.9772470873644479,
+      "eval_recall": 0.9772893772893773,
+      "eval_runtime": 5.9068,
+      "eval_samples_per_second": 231.09,
+      "eval_steps_per_second": 28.95,
+      "step": 170
+    },
+    {
+      "epoch": 2.998535871156662,
+      "eval_accuracy": 0.9765567765567765,
+      "eval_f1": 0.9766464967450174,
+      "eval_loss": 0.10245847702026367,
+      "eval_precision": 0.9768621127754256,
+      "eval_recall": 0.9765567765567765,
+      "eval_runtime": 5.8911,
+      "eval_samples_per_second": 231.706,
+      "eval_steps_per_second": 29.027,
+      "step": 256
+    },
+    {
+      "epoch": 3.994143484626647,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.9832333934847322,
+      "eval_loss": 0.08685966581106186,
+      "eval_precision": 0.9835305336122597,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9568,
+      "eval_samples_per_second": 229.152,
+      "eval_steps_per_second": 28.707,
+      "step": 341
+    },
+    {
+      "epoch": 4.989751098096632,
+      "eval_accuracy": 0.9831501831501831,
+      "eval_f1": 0.983208365019189,
+      "eval_loss": 0.07458490133285522,
+      "eval_precision": 0.9833696765629429,
+      "eval_recall": 0.9831501831501831,
+      "eval_runtime": 5.9419,
+      "eval_samples_per_second": 229.726,
+      "eval_steps_per_second": 28.779,
+      "step": 426
+    },
+    {
+      "epoch": 5.856515373352855,
+      "grad_norm": 0.01886621303856373,
+      "learning_rate": 1.6360497736760383e-05,
+      "loss": 0.0538,
+      "step": 500
+    },
+    {
+      "epoch": 5.997071742313324,
+      "eval_accuracy": 0.9860805860805861,
+      "eval_f1": 0.9860860332682386,
+      "eval_loss": 0.08699370175600052,
+      "eval_precision": 0.9860927746075414,
+      "eval_recall": 0.9860805860805861,
+      "eval_runtime": 5.9399,
+      "eval_samples_per_second": 229.803,
+      "eval_steps_per_second": 28.789,
+      "step": 512
+    },
+    {
+      "epoch": 6.992679355783309,
+      "eval_accuracy": 0.9860805860805861,
+      "eval_f1": 0.9860860332682386,
+      "eval_loss": 0.08903729915618896,
+      "eval_precision": 0.9860927746075414,
+      "eval_recall": 0.9860805860805861,
+      "eval_runtime": 5.9207,
+      "eval_samples_per_second": 230.546,
+      "eval_steps_per_second": 28.882,
+      "step": 597
+    },
+    {
+      "epoch": 7.964860907759883,
+      "eval_accuracy": 0.9860805860805861,
+      "eval_f1": 0.9860860332682386,
+      "eval_loss": 0.08778514713048935,
+      "eval_precision": 0.9860927746075414,
+      "eval_recall": 0.9860805860805861,
+      "eval_runtime": 5.9724,
+      "eval_samples_per_second": 228.552,
+      "eval_steps_per_second": 28.632,
+      "step": 680
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 680,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 3,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 9.8908515478272e+16,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-680/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
+size 5240

checkpoint-85/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df8b4bbb885f9e08a2aba87cc03e2b8f1567fabb50c07badd97e951e719a31ac
 size 94763496

 version https://git-lfs.github.com/spec/v1
+oid sha256:a15277aa4797964b12aaedf5acf9218acf9f11597a299deaf3a64bad8d89176e
 size 94763496

checkpoint-85/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb53a5b91f0cc0ec8e866f1a0a30bed26aa135a28c7a35daf2f9f91b6d1b05c9
 size 189552570

 version https://git-lfs.github.com/spec/v1
+oid sha256:f9c4d0328f867e3a4371326367364a334fc34c6ecaba4f27c44bae6d943a3f5e
 size 189552570

checkpoint-85/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3db364763fd75b720e1e92ab8fcebb6dd7848ca54daab21f7eb8f5ba3936503a
 size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:74e1c11b94b090a41a3c1ccee3afde4077ab65e935c7dfa8559b5a7860ed3169
 size 14308

checkpoint-85/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08ad4dbf82e07518bfba3f03afe8b5f7b88773a00971103527317aa28f4df577
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a3200599f03a01d89a474fcdd8a567058cd33b2f50dde928b44d422ff5012f0
 size 1064

checkpoint-85/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.9560439560439561,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-85",
   "epoch": 0.9956076134699854,
   "eval_steps": 500,
@@ -10,21 +10,21 @@
   "log_history": [
     {
       "epoch": 0.9956076134699854,
-      "eval_accuracy": 0.9560439560439561,
-      "eval_f1": 0.956078786784062,
-      "eval_loss": 0.12699252367019653,
-      "eval_precision": 0.9561185753022488,
-      "eval_recall": 0.9560439560439561,
-      "eval_runtime": 5.8872,
-      "eval_samples_per_second": 231.858,
-      "eval_steps_per_second": 29.046,
       "step": 85
     }
   ],
   "logging_steps": 500,
-  "max_steps": 85,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 1,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {
@@ -42,12 +42,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
   },
-  "total_flos": 1.237152405504e+16,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.9641025641025641,
   "best_model_checkpoint": "distilhubert-finetuned-cry-detector/checkpoint-85",
   "epoch": 0.9956076134699854,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9956076134699854,
+      "eval_accuracy": 0.9641025641025641,
+      "eval_f1": 0.9637911305761953,
+      "eval_loss": 0.12035853415727615,
+      "eval_precision": 0.9640509308043554,
+      "eval_recall": 0.9641025641025641,
+      "eval_runtime": 6.052,
+      "eval_samples_per_second": 225.545,
+      "eval_steps_per_second": 28.255,
       "step": 85
     }
   ],
   "logging_steps": 500,
+  "max_steps": 680,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   },
+  "total_flos": 1.241700759936e+16,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

checkpoint-85/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d5b268a75d8603f488ccdf5a9c773941c717339e58b25823758027bd2a38cac6
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:cda0bf828ccc04cd6d3fb7933f60f34ca3c8ba14b14579f9e878d688bc739b4a
 size 5240