imvladikon commited on Jan 29, 2022

Commit

e55479e

•

1 Parent(s): 0db3bbd

init

Browse files

Files changed (18) hide show

checkpoint-4000/config.json +79 -0
checkpoint-4000/optimizer.pt +3 -0
checkpoint-4000/preprocessor_config.json +9 -0
checkpoint-4000/pytorch_model.bin +3 -0
checkpoint-4000/rng_state.pth +3 -0
checkpoint-4000/scaler.pt +3 -0
checkpoint-4000/scheduler.pt +3 -0
checkpoint-4000/trainer_state.json +166 -0
checkpoint-4000/training_args.bin +3 -0
checkpoint-4400/config.json +79 -0
checkpoint-4400/optimizer.pt +3 -0
checkpoint-4400/preprocessor_config.json +9 -0
checkpoint-4400/pytorch_model.bin +3 -0
checkpoint-4400/rng_state.pth +3 -0
checkpoint-4400/scaler.pt +3 -0
checkpoint-4400/scheduler.pt +3 -0
checkpoint-4400/trainer_state.json +181 -0
checkpoint-4400/training_args.bin +3 -0

checkpoint-4000/config.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
+  "activation_dropout": 0.0,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "pad_token_id": 29,
+  "proj_codevector_dim": 768,
+  "torch_dtype": "float32",
+  "transformers_version": "4.11.3",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

checkpoint-4000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:052d9d1f443d1b9f67c2f7a6c2808fe922f1eb7ec26dba77c36c332395ec93d6
+size 2490321361

checkpoint-4000/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-4000/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:092b750aa2825af7fb89c41d0967aa326857a67ed0c101103b080ef3668b8ca5
+size 1262054897

checkpoint-4000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1bf4dfa62752c868edada56217703db94c074fedf843e434f438dfbdfd0009a0
+size 14631

checkpoint-4000/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93d4c53e2e4d886d0eac00fb8b6e3a12d9b4941d302b762706e463005cd1e4ad
+size 559

checkpoint-4000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8a20530e63990facdbe1c575c37ff4cc0d4637f57452c1d8f3b74093a7afbf98
+size 623

checkpoint-4000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,166 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.5759306677171558,
+  "global_step": 4000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.16,
+      "learning_rate": 0.0002388,
+      "loss": 4.5334,
+      "step": 400
+    },
+    {
+      "epoch": 0.16,
+      "eval_loss": 2.026416063308716,
+      "eval_runtime": 471.8471,
+      "eval_samples_per_second": 10.758,
+      "eval_steps_per_second": 1.346,
+      "eval_wer": 0.9800369528744665,
+      "step": 400
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 0.00029881808566895816,
+      "loss": 1.0808,
+      "step": 800
+    },
+    {
+      "epoch": 0.32,
+      "eval_loss": 0.7069017887115479,
+      "eval_runtime": 472.368,
+      "eval_samples_per_second": 10.746,
+      "eval_steps_per_second": 1.344,
+      "eval_wer": 0.593412194448574,
+      "step": 800
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.0002972316234796404,
+      "loss": 0.7499,
+      "step": 1200
+    },
+    {
+      "epoch": 0.47,
+      "eval_loss": 0.5792935490608215,
+      "eval_runtime": 471.2762,
+      "eval_samples_per_second": 10.771,
+      "eval_steps_per_second": 1.347,
+      "eval_wer": 0.49153694225582434,
+      "step": 1200
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 0.00029564516129032255,
+      "loss": 0.6397,
+      "step": 1600
+    },
+    {
+      "epoch": 0.63,
+      "eval_loss": 0.5181192755699158,
+      "eval_runtime": 470.1504,
+      "eval_samples_per_second": 10.797,
+      "eval_steps_per_second": 1.351,
+      "eval_wer": 0.41618705799902306,
+      "step": 1600
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.0002940586991010047,
+      "loss": 0.597,
+      "step": 2000
+    },
+    {
+      "epoch": 0.79,
+      "eval_loss": 0.47279468178749084,
+      "eval_runtime": 470.9283,
+      "eval_samples_per_second": 10.779,
+      "eval_steps_per_second": 1.348,
+      "eval_wer": 0.37248072716461017,
+      "step": 2000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.00029247223691168694,
+      "loss": 0.5666,
+      "step": 2400
+    },
+    {
+      "epoch": 0.95,
+      "eval_loss": 0.4448830783367157,
+      "eval_runtime": 471.0174,
+      "eval_samples_per_second": 10.777,
+      "eval_steps_per_second": 1.348,
+      "eval_wer": 0.3520292225030263,
+      "step": 2400
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 0.0002908857747223691,
+      "loss": 0.5067,
+      "step": 2800
+    },
+    {
+      "epoch": 1.1,
+      "eval_loss": 0.421601802110672,
+      "eval_runtime": 470.0998,
+      "eval_samples_per_second": 10.798,
+      "eval_steps_per_second": 1.351,
+      "eval_wer": 0.3330855650179455,
+      "step": 2800
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 0.0002892993125330513,
+      "loss": 0.477,
+      "step": 3200
+    },
+    {
+      "epoch": 1.26,
+      "eval_loss": 0.39891988039016724,
+      "eval_runtime": 471.7321,
+      "eval_samples_per_second": 10.76,
+      "eval_steps_per_second": 1.346,
+      "eval_wer": 0.30331089260305394,
+      "step": 3200
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00028771285034373344,
+      "loss": 0.4633,
+      "step": 3600
+    },
+    {
+      "epoch": 1.42,
+      "eval_loss": 0.41667959094047546,
+      "eval_runtime": 473.0088,
+      "eval_samples_per_second": 10.731,
+      "eval_steps_per_second": 1.342,
+      "eval_wer": 0.3046276042219721,
+      "step": 3600
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 0.0002861263881544156,
+      "loss": 0.4606,
+      "step": 4000
+    },
+    {
+      "epoch": 1.58,
+      "eval_loss": 0.3892616033554077,
+      "eval_runtime": 473.5469,
+      "eval_samples_per_second": 10.719,
+      "eval_steps_per_second": 1.341,
+      "eval_wer": 0.29747063945462654,
+      "step": 4000
+    }
+  ],
+  "max_steps": 76140,
+  "num_train_epochs": 30,
+  "total_flos": 5.025867257304392e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-4000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4c1c368c4db40de7b0ac3ee4ff79af2d311395b8ce794d1869af91457b7e050
+size 2863

checkpoint-4400/config.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
+  "activation_dropout": 0.0,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "pad_token_id": 29,
+  "proj_codevector_dim": 768,
+  "torch_dtype": "float32",
+  "transformers_version": "4.11.3",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

checkpoint-4400/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10430c88cb27d80d4909d60b1f5b4649806024e17f499620af7b33e594972686
+size 2490321361

checkpoint-4400/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-4400/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f6b19c2693a520d464d36c22f9e97cab05ee230f04af2c84cb79a18b55c8190
+size 1262054897

checkpoint-4400/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f850e9eef43b3d8d7daa339e72e185c9b03f2fbdfe48df592252aedbe1875965
+size 14567

checkpoint-4400/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4affccbe68b9032483a9a189417afa898f74547fed0e8eff9cfb5b00deb58885
+size 559

checkpoint-4400/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e11bf57746f56037dc02c0f1b9ef426c313cafb919b3099b8b7f85426ae9e2d5
+size 623

checkpoint-4400/trainer_state.json ADDED Viewed

	@@ -0,0 +1,181 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.733504037817609,
+  "global_step": 4400,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.16,
+      "learning_rate": 0.0002388,
+      "loss": 4.5334,
+      "step": 400
+    },
+    {
+      "epoch": 0.16,
+      "eval_loss": 2.026416063308716,
+      "eval_runtime": 471.8471,
+      "eval_samples_per_second": 10.758,
+      "eval_steps_per_second": 1.346,
+      "eval_wer": 0.9800369528744665,
+      "step": 400
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 0.00029881808566895816,
+      "loss": 1.0808,
+      "step": 800
+    },
+    {
+      "epoch": 0.32,
+      "eval_loss": 0.7069017887115479,
+      "eval_runtime": 472.368,
+      "eval_samples_per_second": 10.746,
+      "eval_steps_per_second": 1.344,
+      "eval_wer": 0.593412194448574,
+      "step": 800
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.0002972316234796404,
+      "loss": 0.7499,
+      "step": 1200
+    },
+    {
+      "epoch": 0.47,
+      "eval_loss": 0.5792935490608215,
+      "eval_runtime": 471.2762,
+      "eval_samples_per_second": 10.771,
+      "eval_steps_per_second": 1.347,
+      "eval_wer": 0.49153694225582434,
+      "step": 1200
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 0.00029564516129032255,
+      "loss": 0.6397,
+      "step": 1600
+    },
+    {
+      "epoch": 0.63,
+      "eval_loss": 0.5181192755699158,
+      "eval_runtime": 470.1504,
+      "eval_samples_per_second": 10.797,
+      "eval_steps_per_second": 1.351,
+      "eval_wer": 0.41618705799902306,
+      "step": 1600
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.0002940586991010047,
+      "loss": 0.597,
+      "step": 2000
+    },
+    {
+      "epoch": 0.79,
+      "eval_loss": 0.47279468178749084,
+      "eval_runtime": 470.9283,
+      "eval_samples_per_second": 10.779,
+      "eval_steps_per_second": 1.348,
+      "eval_wer": 0.37248072716461017,
+      "step": 2000
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.00029247223691168694,
+      "loss": 0.5666,
+      "step": 2400
+    },
+    {
+      "epoch": 0.95,
+      "eval_loss": 0.4448830783367157,
+      "eval_runtime": 471.0174,
+      "eval_samples_per_second": 10.777,
+      "eval_steps_per_second": 1.348,
+      "eval_wer": 0.3520292225030263,
+      "step": 2400
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 0.0002908857747223691,
+      "loss": 0.5067,
+      "step": 2800
+    },
+    {
+      "epoch": 1.1,
+      "eval_loss": 0.421601802110672,
+      "eval_runtime": 470.0998,
+      "eval_samples_per_second": 10.798,
+      "eval_steps_per_second": 1.351,
+      "eval_wer": 0.3330855650179455,
+      "step": 2800
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 0.0002892993125330513,
+      "loss": 0.477,
+      "step": 3200
+    },
+    {
+      "epoch": 1.26,
+      "eval_loss": 0.39891988039016724,
+      "eval_runtime": 471.7321,
+      "eval_samples_per_second": 10.76,
+      "eval_steps_per_second": 1.346,
+      "eval_wer": 0.30331089260305394,
+      "step": 3200
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00028771285034373344,
+      "loss": 0.4633,
+      "step": 3600
+    },
+    {
+      "epoch": 1.42,
+      "eval_loss": 0.41667959094047546,
+      "eval_runtime": 473.0088,
+      "eval_samples_per_second": 10.731,
+      "eval_steps_per_second": 1.342,
+      "eval_wer": 0.3046276042219721,
+      "step": 3600
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 0.0002861263881544156,
+      "loss": 0.4606,
+      "step": 4000
+    },
+    {
+      "epoch": 1.58,
+      "eval_loss": 0.3892616033554077,
+      "eval_runtime": 473.5469,
+      "eval_samples_per_second": 10.719,
+      "eval_steps_per_second": 1.341,
+      "eval_wer": 0.29747063945462654,
+      "step": 4000
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.0002845399259650978,
+      "loss": 0.4385,
+      "step": 4400
+    },
+    {
+      "epoch": 1.73,
+      "eval_loss": 0.3867528438568115,
+      "eval_runtime": 471.6975,
+      "eval_samples_per_second": 10.761,
+      "eval_steps_per_second": 1.346,
+      "eval_wer": 0.3090237220464247,
+      "step": 4400
+    }
+  ],
+  "max_steps": 76140,
+  "num_train_epochs": 30,
+  "total_flos": 5.530258185352643e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-4400/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c4c1c368c4db40de7b0ac3ee4ff79af2d311395b8ce794d1869af91457b7e050
+size 2863