Upload WhisperForConditionalGeneration

Files changed (5) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "openai/whisper-small",
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "apply_spec_augment": false,
@@ -13,17 +13,17 @@
   ],
   "bos_token_id": 50257,
   "classifier_proj_size": 256,
-  "d_model": 768,
-  "decoder_attention_heads": 12,
-  "decoder_ffn_dim": 3072,
   "decoder_layerdrop": 0.0,
-  "decoder_layers": 12,
   "decoder_start_token_id": 50258,
   "dropout": 0.0,
-  "encoder_attention_heads": 12,
-  "encoder_ffn_dim": 3072,
   "encoder_layerdrop": 0.0,
-  "encoder_layers": 12,
   "eos_token_id": 50257,
   "forced_decoder_ids": null,
   "init_std": 0.02,
@@ -39,14 +39,14 @@
   "max_target_positions": 448,
   "median_filter_width": 7,
   "model_type": "whisper",
-  "num_hidden_layers": 12,
-  "num_mel_bins": 80,
-  "pad_token_id": 50257,
   "scale_embedding": false,
   "suppress_tokens": [],
   "torch_dtype": "float32",
-  "transformers_version": "4.34.0.dev0",
   "use_cache": true,
   "use_weighted_layer_sum": false,
-  "vocab_size": 51865
 }

 {
+  "_name_or_path": "openai/whisper-large-v3",
   "activation_dropout": 0.0,
   "activation_function": "gelu",
   "apply_spec_augment": false,
   ],
   "bos_token_id": 50257,
   "classifier_proj_size": 256,
+  "d_model": 1280,
+  "decoder_attention_heads": 20,
+  "decoder_ffn_dim": 5120,
   "decoder_layerdrop": 0.0,
+  "decoder_layers": 32,
   "decoder_start_token_id": 50258,
   "dropout": 0.0,
+  "encoder_attention_heads": 20,
+  "encoder_ffn_dim": 5120,
   "encoder_layerdrop": 0.0,
+  "encoder_layers": 32,
   "eos_token_id": 50257,
   "forced_decoder_ids": null,
   "init_std": 0.02,
   "max_target_positions": 448,
   "median_filter_width": 7,
   "model_type": "whisper",
+  "num_hidden_layers": 32,
+  "num_mel_bins": 128,
+  "pad_token_id": 50256,
   "scale_embedding": false,
   "suppress_tokens": [],
   "torch_dtype": "float32",
+  "transformers_version": "4.36.0.dev0",
   "use_cache": true,
   "use_weighted_layer_sum": false,
+  "vocab_size": 51866
 }

generation_config.json CHANGED Viewed

@@ -1,44 +1,44 @@
 {
   "alignment_heads": [
     [
-      5,
-      3
     ],
     [
-      5,
-      9
     ],
     [
-      8,
-      0
     ],
     [
-      8,
-      4
     ],
     [
-      8,
-      7
     ],
     [
-      8,
-      8
     ],
     [
-      9,
-      0
     ],
     [
-      9,
-      7
     ],
     [
-      9,
-      9
     ],
     [
-      10,
-      5
     ]
   ],
   "begin_suppress_tokens": [
@@ -55,7 +55,7 @@
     ],
     [
       2,
-      50359
     ]
   ],
   "is_multilingual": true,
@@ -158,11 +158,12 @@
     "<|vi|>": 50278,
     "<|yi|>": 50335,
     "<|yo|>": 50325,
     "<|zh|>": 50260
   },
   "max_initial_timestamp_index": 1,
   "max_length": 448,
-  "no_timestamps_token_id": 50363,
   "pad_token_id": 50257,
   "return_timestamps": false,
   "suppress_tokens": [
@@ -249,15 +250,15 @@
     49870,
     50254,
     50258,
-    50358,
     50359,
     50360,
     50361,
-    50362
   ],
   "task_to_id": {
-    "transcribe": 50359,
-    "translate": 50358
   },
-  "transformers_version": "4.34.0.dev0"
 }

 {
   "alignment_heads": [
     [
+      7,
+      0
     ],
     [
+      10,
+      17
     ],
     [
+      12,
+      18
     ],
     [
+      13,
+      12
     ],
     [
+      16,
+      1
     ],
     [
+      17,
+      14
     ],
     [
+      19,
+      11
     ],
     [
+      21,
+      4
     ],
     [
+      24,
+      1
     ],
     [
+      25,
+      6
     ]
   ],
   "begin_suppress_tokens": [
     ],
     [
       2,
+      50360
     ]
   ],
   "is_multilingual": true,
     "<|vi|>": 50278,
     "<|yi|>": 50335,
     "<|yo|>": 50325,
+    "<|yue|>": 50358,
     "<|zh|>": 50260
   },
   "max_initial_timestamp_index": 1,
   "max_length": 448,
+  "no_timestamps_token_id": 50364,
   "pad_token_id": 50257,
   "return_timestamps": false,
   "suppress_tokens": [
     49870,
     50254,
     50258,
     50359,
     50360,
     50361,
+    50362,
+    50363
   ],
   "task_to_id": {
+    "transcribe": 50360,
+    "translate": 50359
   },
+  "transformers_version": "4.36.0.dev0"
 }

model-00001-of-00002.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba2a4c5046d1813176f2457181fda8cc6202f1cad32e5b48a0718b0aae572fc2
+size 4993448880

model-00002-of-00002.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:28937bc5e70b444638b38295854dacb2c85dc00be8520c7bf111db8cc1c1f6da
+size 1180663192

model.safetensors.index.json ADDED Viewed

The diff for this file is too large to render. See raw diff