Model files.

Browse files

Files changed (10) hide show

.gitattributes +1 -0
README.md +6 -0
best.th +3 -0
config.json +226 -0
log/train/events.out.tfevents +3 -0
log/validation/events.out.tfevents +3 -0
metrics.json +20 -0
vocabulary/.lock +0 -0
vocabulary/non_padded_namespaces.txt +2 -0
vocabulary/pos.txt +18 -0

.gitattributes CHANGED Viewed

@@ -25,3 +25,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.th filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,6 @@

+---
+tags:
+- allennlp
+---
+# TODO: Fill this model card

best.th ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c59993607c26b7dd8d9da3c7d208b78475deeb7759bf4686472945a80bf9faa
+size 504095439

config.json ADDED Viewed

	@@ -0,0 +1,226 @@

+{
+    "dataset_reader": {
+        "type": "multitask",
+        "readers": {
+            "pos": {
+                "type": "mlrs_pos",
+                "language_specific": false,
+                "token_indexers": {
+                    "transformer": {
+                        "type": "pretrained_transformer_mismatched",
+                        "max_length": 512,
+                        "model_name": "MLRS/BERTu"
+                    }
+                }
+            }
+        }
+    },
+    "model": {
+        "type": "multitask",
+        "arg_name_mapping": {
+            "backbone": {
+                "tokens": "text",
+                "words": "text"
+            }
+        },
+        "backbone": {
+            "type": "embedder_and_mask",
+            "text_field_embedder": {
+                "token_embedders": {
+                    "transformer": {
+                        "type": "pretrained_transformer_mismatched_with_dropout",
+                        "last_layer_only": false,
+                        "layer_dropout": 0.1,
+                        "max_length": 512,
+                        "model_name": "MLRS/BERTu",
+                        "tokenizer_kwargs": {},
+                        "train_parameters": true
+                    }
+                }
+            }
+        },
+        "heads": {
+            "pos": {
+                "type": "linear_tagger",
+                "dropout": 0.3,
+                "encoder": {
+                    "type": "pass_through",
+                    "input_dim": 768
+                },
+                "initializer": {
+                    "regexes": [
+                        [
+                            ".*projection.*weight",
+                            {
+                                "type": "xavier_uniform"
+                            }
+                        ],
+                        [
+                            ".*projection.*bias",
+                            {
+                                "type": "zero"
+                            }
+                        ],
+                        [
+                            ".*tag_bilinear.*weight",
+                            {
+                                "type": "xavier_uniform"
+                            }
+                        ],
+                        [
+                            ".*tag_bilinear.*bias",
+                            {
+                                "type": "zero"
+                            }
+                        ],
+                        [
+                            ".*weight_ih.*",
+                            {
+                                "type": "xavier_uniform"
+                            }
+                        ],
+                        [
+                            ".*weight_hh.*",
+                            {
+                                "type": "orthogonal"
+                            }
+                        ],
+                        [
+                            ".*bias_ih.*",
+                            {
+                                "type": "zero"
+                            }
+                        ],
+                        [
+                            ".*bias_hh.*",
+                            {
+                                "type": "lstm_hidden_bias"
+                            }
+                        ]
+                    ]
+                }
+            }
+        }
+    },
+    "train_data_path": {
+        "pos": "MLRS POS Gold/mlrs_pos-train.tsv"
+    },
+    "validation_data_path": {
+        "pos": "MLRS POS Gold/mlrs_pos-dev.tsv"
+    },
+    "trainer": {
+        "callbacks": [
+            {
+                "tensorboard_writer": {
+                    "should_log_learning_rate": true,
+                    "should_log_parameter_statistics": true
+                },
+                "type": "tensorboard"
+            }
+        ],
+        "cuda_device": 0,
+        "grad_norm": 5,
+        "learning_rate_scheduler": {
+            "type": "ulmfit_sqrt",
+            "affected_group_count": 2,
+            "decay_factor": 0.05,
+            "discriminative_fine_tuning": true,
+            "factor": 5,
+            "gradual_unfreezing": true,
+            "model_size": 1,
+            "start_step": 39,
+            "warmup_steps": 39
+        },
+        "num_epochs": 200,
+        "optimizer": {
+            "type": "huggingface_adamw",
+            "betas": [
+                0.9,
+                0.999
+            ],
+            "correct_bias": false,
+            "lr": 0.0005,
+            "parameter_groups": [
+                [
+                    [
+                        "text_field_embedder.*transformer_model.embeddings.*_embeddings.*",
+                        "text_field_embedder.*transformer_model.encoder.*.(key|query|value|dense).weight"
+                    ],
+                    {}
+                ],
+                [
+                    [
+                        "text_field_embedder.*transformer_model.embeddings.LayerNorm.*",
+                        "text_field_embedder.*transformer_model.encoder.*.output.LayerNorm.*",
+                        "text_field_embedder.*transformer_model.encoder.*.(key|query|value|dense).bias",
+                        "text_field_embedder.*transformer_model.pooler.dense.bias"
+                    ],
+                    {
+                        "weight_decay": 0
+                    }
+                ],
+                [
+                    [
+                        "text_field_embedder.*._scalar_mix.*",
+                        "text_field_embedder.*transformer_model.pooler.dense.weight",
+                        "_head_sentinel",
+                        "head_arc_feedforward._linear_layers.*.weight",
+                        "child_arc_feedforward._linear_layers.*.weight",
+                        "head_tag_feedforward._linear_layers.*.weight",
+                        "child_tag_feedforward._linear_layers.*.weight",
+                        "arc_attention._weight_matrix",
+                        "tag_bilinear.weight",
+                        "tag_projection_layer._module.weight",
+                        "crf",
+                        "linear.weight",
+                        "tagger_linear.weight"
+                    ],
+                    {}
+                ],
+                [
+                    [
+                        "head_arc_feedforward._linear_layers.*.bias",
+                        "child_arc_feedforward._linear_layers.*.bias",
+                        "head_tag_feedforward._linear_layers.*.bias",
+                        "child_tag_feedforward._linear_layers.*.bias",
+                        "arc_attention._bias",
+                        "tag_bilinear.bias",
+                        "tag_projection_layer._module.bias",
+                        "linear.bias",
+                        "tagger_linear.bias"
+                    ],
+                    {
+                        "weight_decay": 0
+                    }
+                ]
+            ],
+            "weight_decay": 0.01
+        },
+        "patience": 20,
+        "validation_metric": [
+            "+pos_accuracy"
+        ]
+    },
+    "data_loader": {
+        "type": "multitask",
+        "scheduler": {
+            "type": "unbalanced_homogeneous_roundrobin",
+            "batch_size": 128,
+            "dataset_sizes": {
+                "pos": 4935
+            }
+        },
+        "shuffle": true
+    },
+    "numpy_seed": 1279,
+    "pytorch_seed": 127,
+    "random_seed": 12790,
+    "validation_data_loader": {
+        "type": "multitask",
+        "scheduler": {
+            "type": "homogeneous_roundrobin",
+            "batch_size": 128
+        },
+        "shuffle": true
+    }
+}

log/train/events.out.tfevents ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0cc434c6da5af8279be80087cc906c7a771aac737e0430e6a0b12b82ea9bc551
+size 4365860

log/validation/events.out.tfevents ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:22db75e8cedb36ea926adaee22a4a309640fe8b9efcdc5a8578e393992a9d977
+size 7996

metrics.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "best_epoch": 32,
+  "peak_worker_0_memory_MB": 4411.46484375,
+  "peak_gpu_0_memory_MB": 20483.64892578125,
+  "training_duration": "0:09:30.396633",
+  "training_start_epoch": 0,
+  "training_epochs": 51,
+  "epoch": 51,
+  "training_pos_accuracy": 0.9999886954555731,
+  "training_pos_accuracy_words_only": 0.9999870104565824,
+  "training_loss": 0.00021654496140399715,
+  "training_worker_0_memory_MB": 4411.46484375,
+  "training_gpu_0_memory_MB": 20483.64892578125,
+  "validation_pos_accuracy": 0.989863375936536,
+  "validation_pos_accuracy_words_only": 0.9891052153737516,
+  "validation_loss": 0.10308615937829017,
+  "best_validation_pos_accuracy": 0.9908329660643456,
+  "best_validation_pos_accuracy_words_only": 0.9901139917280339,
+  "best_validation_loss": 0.09275933802127838
+}

vocabulary/.lock ADDED Viewed

File without changes

vocabulary/non_padded_namespaces.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ *tags
2	+ *labels

vocabulary/pos.txt ADDED Viewed

	@@ -0,0 +1,18 @@

+@@UNKNOWN@@
+NOUN
+VERB
+PUNCT
+ADP
+DET
+PRON
+SCONJ
+ADJ
+PROPN
+CCONJ
+AUX
+ADV
+NUM
+PART
+X
+INTJ
+SYM