Use BERTIN model

Browse files

Files changed (3) hide show

config.json +9 -10
flax_model.msgpack +2 -2
logs/events.out.tfevents.1626476231.t1v-n-5900a4fe-w-0.1105221.3.v2 +0 -3

config.json CHANGED Viewed

@@ -7,21 +7,21 @@
   "projection_dim": 512,
   "seed": 42,
   "text_config": {
-    "_name_or_path": "dccuchile/bert-base-spanish-wwm-cased",
     "add_cross_attention": false,
     "architectures": [
-      "BertForMaskedLM"
     ],
     "attention_probs_dropout_prob": 0.1,
     "bad_words_ids": null,
-    "bos_token_id": null,
     "chunk_size_feed_forward": 0,
     "decoder_start_token_id": null,
     "diversity_penalty": 0.0,
     "do_sample": false,
     "early_stopping": false,
     "encoder_no_repeat_ngram_size": 0,
-    "eos_token_id": null,
     "finetuning_task": null,
     "forced_bos_token_id": null,
     "forced_eos_token_id": null,
@@ -41,12 +41,12 @@
       "LABEL_0": 0,
       "LABEL_1": 1
     },
-    "layer_norm_eps": 1e-12,
     "length_penalty": 1.0,
     "max_length": 20,
-    "max_position_embeddings": 512,
     "min_length": 0,
-    "model_type": "bert",
     "no_repeat_ngram_size": 0,
     "num_attention_heads": 12,
     "num_beam_groups": 1,
@@ -55,7 +55,6 @@
     "num_return_sequences": 1,
     "output_attentions": false,
     "output_hidden_states": false,
-    "output_past": true,
     "output_scores": false,
     "pad_token_id": 1,
     "position_embedding_type": "absolute",
@@ -77,10 +76,10 @@
     "torch_dtype": null,
     "torchscript": false,
     "transformers_version": "4.9.0.dev0",
-    "type_vocab_size": 2,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 31002
   },
   "transformers_version": null,
   "vision_config": {

   "projection_dim": 512,
   "seed": 42,
   "text_config": {
+    "_name_or_path": "",
     "add_cross_attention": false,
     "architectures": [
+      "RobertaForMaskedLM"
     ],
     "attention_probs_dropout_prob": 0.1,
     "bad_words_ids": null,
+    "bos_token_id": 0,
     "chunk_size_feed_forward": 0,
     "decoder_start_token_id": null,
     "diversity_penalty": 0.0,
     "do_sample": false,
     "early_stopping": false,
     "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
     "finetuning_task": null,
     "forced_bos_token_id": null,
     "forced_eos_token_id": null,
       "LABEL_0": 0,
       "LABEL_1": 1
     },
+    "layer_norm_eps": 1e-05,
     "length_penalty": 1.0,
     "max_length": 20,
+    "max_position_embeddings": 514,
     "min_length": 0,
+    "model_type": "roberta",
     "no_repeat_ngram_size": 0,
     "num_attention_heads": 12,
     "num_beam_groups": 1,
     "num_return_sequences": 1,
     "output_attentions": false,
     "output_hidden_states": false,
     "output_scores": false,
     "pad_token_id": 1,
     "position_embedding_type": "absolute",
     "torch_dtype": null,
     "torchscript": false,
     "transformers_version": "4.9.0.dev0",
+    "type_vocab_size": 1,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 50265
   },
   "transformers_version": null,
   "vision_config": {

flax_model.msgpack CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f528ad8bfefe1abf023fa9670cee2e2d4ef36c903cb47c4d980b47ad0eb0d04f
-size 792387416

 version https://git-lfs.github.com/spec/v1
+oid sha256:55def72bbb5079de08c70573842ea2aa973f6c502d95505a9709e4cd2a2f6402
+size 851566424

logs/events.out.tfevents.1626476231.t1v-n-5900a4fe-w-0.1105221.3.v2 DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:14b7bc36e0d61b44077faab7a77617ee43c5c454bfcc1417c3741066482b2b93
-size 1626638