Initial Commit

Browse files

Files changed (5) hide show

README.md +187 -0
config.json +159 -0
eval_results_ml.json +1 -0
pytorch_model.bin +3 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,187 @@

+---
+license: mit
+base_model: microsoft/mdeberta-v3-base
+tags:
+- generated_from_trainer
+datasets:
+- massive
+metrics:
+- accuracy
+- f1
+model-index:
+- name: scenario-MDBT-TCR_data-en-massive_all_1_1
+  results:
+  - task:
+      name: Text Classification
+      type: text-classification
+    dataset:
+      name: massive
+      type: massive
+      config: all_1.1
+      split: validation
+      args: all_1.1
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.7227317882391521
+    - name: F1
+      type: f1
+      value: 0.6670992426180887
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# scenario-MDBT-TCR_data-en-massive_all_1_1
+This model is a fine-tuned version of [microsoft/mdeberta-v3-base](https://huggingface.co/microsoft/mdeberta-v3-base) on the massive dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.6914
+- Accuracy: 0.7227
+- F1: 0.6671
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 32
+- eval_batch_size: 64
+- seed: 66
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 30
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Accuracy | F1     |
+|:-------------:|:-----:|:-----:|:---------------:|:--------:|:------:|
+| No log        | 0.28  | 100   | 3.1171          | 0.2852   | 0.0691 |
+| No log        | 0.56  | 200   | 2.3001          | 0.4341   | 0.1961 |
+| No log        | 0.83  | 300   | 1.7494          | 0.5860   | 0.3648 |
+| No log        | 1.11  | 400   | 1.5526          | 0.6387   | 0.4610 |
+| 1.995         | 1.39  | 500   | 1.5531          | 0.6500   | 0.4780 |
+| 1.995         | 1.67  | 600   | 1.4151          | 0.6671   | 0.5333 |
+| 1.995         | 1.94  | 700   | 1.2962          | 0.6946   | 0.5785 |
+| 1.995         | 2.22  | 800   | 1.3865          | 0.6875   | 0.5773 |
+| 1.995         | 2.5   | 900   | 1.2868          | 0.7121   | 0.6082 |
+| 0.6196        | 2.78  | 1000  | 1.3864          | 0.6981   | 0.6033 |
+| 0.6196        | 3.06  | 1100  | 1.4551          | 0.6925   | 0.6229 |
+| 0.6196        | 3.33  | 1200  | 1.4319          | 0.7092   | 0.6216 |
+| 0.6196        | 3.61  | 1300  | 1.4668          | 0.7035   | 0.6309 |
+| 0.6196        | 3.89  | 1400  | 1.4418          | 0.7056   | 0.6303 |
+| 0.347         | 4.17  | 1500  | 1.4875          | 0.7108   | 0.6562 |
+| 0.347         | 4.44  | 1600  | 1.4943          | 0.7144   | 0.6564 |
+| 0.347         | 4.72  | 1700  | 1.5156          | 0.7122   | 0.6407 |
+| 0.347         | 5.0   | 1800  | 1.5642          | 0.7013   | 0.6506 |
+| 0.347         | 5.28  | 1900  | 1.5904          | 0.7112   | 0.6440 |
+| 0.2195        | 5.56  | 2000  | 1.5237          | 0.7239   | 0.6596 |
+| 0.2195        | 5.83  | 2100  | 1.6728          | 0.7064   | 0.6285 |
+| 0.2195        | 6.11  | 2200  | 1.6606          | 0.7026   | 0.6457 |
+| 0.2195        | 6.39  | 2300  | 1.6961          | 0.7117   | 0.6461 |
+| 0.2195        | 6.67  | 2400  | 1.7144          | 0.7088   | 0.6451 |
+| 0.1729        | 6.94  | 2500  | 1.6841          | 0.7148   | 0.6585 |
+| 0.1729        | 7.22  | 2600  | 1.8309          | 0.7057   | 0.6420 |
+| 0.1729        | 7.5   | 2700  | 1.7698          | 0.7197   | 0.6580 |
+| 0.1729        | 7.78  | 2800  | 1.9600          | 0.7069   | 0.6430 |
+| 0.1729        | 8.06  | 2900  | 2.0215          | 0.6836   | 0.6281 |
+| 0.113         | 8.33  | 3000  | 1.8546          | 0.7191   | 0.6600 |
+| 0.113         | 8.61  | 3100  | 1.9063          | 0.7190   | 0.6593 |
+| 0.113         | 8.89  | 3200  | 1.7990          | 0.7263   | 0.6578 |
+| 0.113         | 9.17  | 3300  | 1.8465          | 0.7215   | 0.6613 |
+| 0.113         | 9.44  | 3400  | 1.9787          | 0.7133   | 0.6522 |
+| 0.0826        | 9.72  | 3500  | 1.9424          | 0.7168   | 0.6593 |
+| 0.0826        | 10.0  | 3600  | 2.1079          | 0.6973   | 0.6399 |
+| 0.0826        | 10.28 | 3700  | 2.0101          | 0.7081   | 0.6510 |
+| 0.0826        | 10.56 | 3800  | 2.1830          | 0.6990   | 0.6307 |
+| 0.0826        | 10.83 | 3900  | 2.1300          | 0.7112   | 0.6541 |
+| 0.066         | 11.11 | 4000  | 2.0432          | 0.7118   | 0.6480 |
+| 0.066         | 11.39 | 4100  | 2.2643          | 0.7005   | 0.6312 |
+| 0.066         | 11.67 | 4200  | 2.3124          | 0.7056   | 0.6504 |
+| 0.066         | 11.94 | 4300  | 2.1704          | 0.7169   | 0.6606 |
+| 0.066         | 12.22 | 4400  | 2.1669          | 0.7244   | 0.6668 |
+| 0.0465        | 12.5  | 4500  | 2.0924          | 0.7187   | 0.6566 |
+| 0.0465        | 12.78 | 4600  | 2.1401          | 0.7192   | 0.6520 |
+| 0.0465        | 13.06 | 4700  | 2.1376          | 0.7233   | 0.6552 |
+| 0.0465        | 13.33 | 4800  | 2.1814          | 0.7246   | 0.6625 |
+| 0.0465        | 13.61 | 4900  | 2.1595          | 0.7232   | 0.6618 |
+| 0.0321        | 13.89 | 5000  | 2.2037          | 0.7299   | 0.6757 |
+| 0.0321        | 14.17 | 5100  | 2.2631          | 0.7220   | 0.6736 |
+| 0.0321        | 14.44 | 5200  | 2.3036          | 0.7178   | 0.6608 |
+| 0.0321        | 14.72 | 5300  | 2.4098          | 0.7164   | 0.6625 |
+| 0.0321        | 15.0  | 5400  | 2.3241          | 0.7177   | 0.6615 |
+| 0.0238        | 15.28 | 5500  | 2.4564          | 0.7105   | 0.6606 |
+| 0.0238        | 15.56 | 5600  | 2.3782          | 0.7208   | 0.6666 |
+| 0.0238        | 15.83 | 5700  | 2.3832          | 0.7189   | 0.6591 |
+| 0.0238        | 16.11 | 5800  | 2.5115          | 0.7075   | 0.6452 |
+| 0.0238        | 16.39 | 5900  | 2.4870          | 0.7112   | 0.6640 |
+| 0.0208        | 16.67 | 6000  | 2.5268          | 0.7145   | 0.6636 |
+| 0.0208        | 16.94 | 6100  | 2.5253          | 0.7134   | 0.6641 |
+| 0.0208        | 17.22 | 6200  | 2.4308          | 0.7233   | 0.6696 |
+| 0.0208        | 17.5  | 6300  | 2.4632          | 0.7177   | 0.6668 |
+| 0.0208        | 17.78 | 6400  | 2.3885          | 0.7253   | 0.6665 |
+| 0.0169        | 18.06 | 6500  | 2.4380          | 0.7187   | 0.6631 |
+| 0.0169        | 18.33 | 6600  | 2.4620          | 0.7163   | 0.6681 |
+| 0.0169        | 18.61 | 6700  | 2.4921          | 0.7195   | 0.6646 |
+| 0.0169        | 18.89 | 6800  | 2.5746          | 0.7087   | 0.6474 |
+| 0.0169        | 19.17 | 6900  | 2.5031          | 0.7201   | 0.6645 |
+| 0.0139        | 19.44 | 7000  | 2.5396          | 0.7183   | 0.6579 |
+| 0.0139        | 19.72 | 7100  | 2.5645          | 0.7191   | 0.6635 |
+| 0.0139        | 20.0  | 7200  | 2.5458          | 0.7184   | 0.6614 |
+| 0.0139        | 20.28 | 7300  | 2.5119          | 0.7210   | 0.6663 |
+| 0.0139        | 20.56 | 7400  | 2.5254          | 0.7257   | 0.6752 |
+| 0.0079        | 20.83 | 7500  | 2.5765          | 0.7198   | 0.6709 |
+| 0.0079        | 21.11 | 7600  | 2.5612          | 0.7203   | 0.6703 |
+| 0.0079        | 21.39 | 7700  | 2.5182          | 0.7278   | 0.6719 |
+| 0.0079        | 21.67 | 7800  | 2.5369          | 0.7247   | 0.6711 |
+| 0.0079        | 21.94 | 7900  | 2.6488          | 0.7208   | 0.6681 |
+| 0.0045        | 22.22 | 8000  | 2.6237          | 0.7245   | 0.6726 |
+| 0.0045        | 22.5  | 8100  | 2.5783          | 0.7243   | 0.6722 |
+| 0.0045        | 22.78 | 8200  | 2.6651          | 0.7209   | 0.6738 |
+| 0.0045        | 23.06 | 8300  | 2.5498          | 0.7253   | 0.6717 |
+| 0.0045        | 23.33 | 8400  | 2.6436          | 0.7233   | 0.6687 |
+| 0.0056        | 23.61 | 8500  | 2.6572          | 0.7245   | 0.6710 |
+| 0.0056        | 23.89 | 8600  | 2.8399          | 0.7147   | 0.6647 |
+| 0.0056        | 24.17 | 8700  | 2.7875          | 0.7161   | 0.6682 |
+| 0.0056        | 24.44 | 8800  | 2.7095          | 0.7195   | 0.6669 |
+| 0.0056        | 24.72 | 8900  | 2.6328          | 0.7248   | 0.6688 |
+| 0.0056        | 25.0  | 9000  | 2.6524          | 0.7246   | 0.6693 |
+| 0.0056        | 25.28 | 9100  | 2.6860          | 0.7219   | 0.6685 |
+| 0.0056        | 25.56 | 9200  | 2.7291          | 0.7194   | 0.6671 |
+| 0.0056        | 25.83 | 9300  | 2.7558          | 0.7164   | 0.6625 |
+| 0.0056        | 26.11 | 9400  | 2.7021          | 0.7185   | 0.6636 |
+| 0.0023        | 26.39 | 9500  | 2.7087          | 0.7200   | 0.6650 |
+| 0.0023        | 26.67 | 9600  | 2.7187          | 0.7199   | 0.6688 |
+| 0.0023        | 26.94 | 9700  | 2.6568          | 0.7241   | 0.6720 |
+| 0.0023        | 27.22 | 9800  | 2.6873          | 0.7213   | 0.6675 |
+| 0.0023        | 27.5  | 9900  | 2.7043          | 0.7205   | 0.6667 |
+| 0.0024        | 27.78 | 10000 | 2.7342          | 0.7178   | 0.6662 |
+| 0.0024        | 28.06 | 10100 | 2.7089          | 0.7202   | 0.6673 |
+| 0.0024        | 28.33 | 10200 | 2.7063          | 0.7207   | 0.6674 |
+| 0.0024        | 28.61 | 10300 | 2.7048          | 0.7208   | 0.6671 |
+| 0.0024        | 28.89 | 10400 | 2.7010          | 0.7214   | 0.6674 |
+| 0.0015        | 29.17 | 10500 | 2.6951          | 0.7226   | 0.6670 |
+| 0.0015        | 29.44 | 10600 | 2.6964          | 0.7223   | 0.6669 |
+| 0.0015        | 29.72 | 10700 | 2.6925          | 0.7225   | 0.6671 |
+| 0.0015        | 30.0  | 10800 | 2.6914          | 0.7227   | 0.6671 |
+### Framework versions
+- Transformers 4.33.3
+- Pytorch 2.1.1+cu121
+- Datasets 2.14.5
+- Tokenizers 0.13.3

config.json ADDED Viewed

	@@ -0,0 +1,159 @@

+{
+  "_name_or_path": "microsoft/mdeberta-v3-base",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27",
+    "28": "LABEL_28",
+    "29": "LABEL_29",
+    "30": "LABEL_30",
+    "31": "LABEL_31",
+    "32": "LABEL_32",
+    "33": "LABEL_33",
+    "34": "LABEL_34",
+    "35": "LABEL_35",
+    "36": "LABEL_36",
+    "37": "LABEL_37",
+    "38": "LABEL_38",
+    "39": "LABEL_39",
+    "40": "LABEL_40",
+    "41": "LABEL_41",
+    "42": "LABEL_42",
+    "43": "LABEL_43",
+    "44": "LABEL_44",
+    "45": "LABEL_45",
+    "46": "LABEL_46",
+    "47": "LABEL_47",
+    "48": "LABEL_48",
+    "49": "LABEL_49",
+    "50": "LABEL_50",
+    "51": "LABEL_51",
+    "52": "LABEL_52",
+    "53": "LABEL_53",
+    "54": "LABEL_54",
+    "55": "LABEL_55",
+    "56": "LABEL_56",
+    "57": "LABEL_57",
+    "58": "LABEL_58",
+    "59": "LABEL_59"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_28": 28,
+    "LABEL_29": 29,
+    "LABEL_3": 3,
+    "LABEL_30": 30,
+    "LABEL_31": 31,
+    "LABEL_32": 32,
+    "LABEL_33": 33,
+    "LABEL_34": 34,
+    "LABEL_35": 35,
+    "LABEL_36": 36,
+    "LABEL_37": 37,
+    "LABEL_38": 38,
+    "LABEL_39": 39,
+    "LABEL_4": 4,
+    "LABEL_40": 40,
+    "LABEL_41": 41,
+    "LABEL_42": 42,
+    "LABEL_43": 43,
+    "LABEL_44": 44,
+    "LABEL_45": 45,
+    "LABEL_46": 46,
+    "LABEL_47": 47,
+    "LABEL_48": 48,
+    "LABEL_49": 49,
+    "LABEL_5": 5,
+    "LABEL_50": 50,
+    "LABEL_51": 51,
+    "LABEL_52": 52,
+    "LABEL_53": 53,
+    "LABEL_54": 54,
+    "LABEL_55": 55,
+    "LABEL_56": 56,
+    "LABEL_57": 57,
+    "LABEL_58": 58,
+    "LABEL_59": 59,
+    "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 768,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.33.3",
+  "type_vocab_size": 0,
+  "vocab_size": 251000
+}

eval_results_ml.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"ru-RU": {"f1": 0.010316925076793538, "accuracy": 0.04942837928715535}, "cy-GB": {"f1": 0.009031079552289031, "accuracy": 0.03597848016139879}, "en-US": {"f1": 0.004128358654351474, "accuracy": 0.021856086079354405}, "tl-PH": {"f1": 0.007033744185653525, "accuracy": 0.04909213180901143}, "bn-BD": {"f1": 0.01064684437896273, "accuracy": 0.04572965702757229}, "pl-PL": {"f1": 0.010264168909410978, "accuracy": 0.05917955615332885}, "fa-IR": {"f1": 0.009904069834589222, "accuracy": 0.05413584398117014}, "ro-RO": {"f1": 0.0082767370311412, "accuracy": 0.04942837928715535}, "kn-IN": {"f1": 0.011624510132884028, "accuracy": 0.04707464694014795}, "es-ES": {"f1": 0.006931920058950065, "accuracy": 0.04942837928715535}, "fi-FI": {"f1": 0.008348889025429634, "accuracy": 0.05279085406859448}, "el-GR": {"f1": 0.013950351638227847, "accuracy": 0.05211835911230666}, "ar-SA": {"f1": 0.010864946698961918, "accuracy": 0.050773369199731}, "ca-ES": {"f1": 0.006624775227252109, "accuracy": 0.05346334902488231}, "sl-SL": {"f1": 0.00669486702190452, "accuracy": 0.04942837928715535}, "hu-HU": {"f1": 0.007341933853776979, "accuracy": 0.05211835911230666}, "sq-AL": {"f1": 0.006698035828942186, "accuracy": 0.05379959650302623}, "pt-PT": {"f1": 0.009876686308811096, "accuracy": 0.05279085406859448}, "hi-IN": {"f1": 0.013358473858025266, "accuracy": 0.05615332885003362}, "am-ET": {"f1": 0.011571610890102892, "accuracy": 0.04909213180901143}, "ml-IN": {"f1": 0.009399478462437673, "accuracy": 0.04741089441829186}, "jv-ID": {"f1": 0.007928378619948176, "accuracy": 0.05211835911230666}, "tr-TR": {"f1": 0.007740517852818087, "accuracy": 0.05178211163416274}, "vi-VN": {"f1": 0.011817855833325643, "accuracy": 0.04808338937457969}, "he-IL": {"f1": 0.00956928578215271, "accuracy": 0.05245460659045057}, "my-MM": {"f1": 0.010786182254414464, "accuracy": 0.06186953597848016}, "mn-MN": {"f1": 0.010524399932849935, "accuracy": 0.04472091459314055}, "ja-JP": {"f1": 0.011610784087114788, "accuracy": 0.0652320107599193}, "is-IS": {"f1": 0.008242528109904796, "accuracy": 0.05917955615332885}, "id-ID": {"f1": 0.013556971091917974, "accuracy": 0.04236718224613315}, "sv-SE": {"f1": 0.008868076660263171, "accuracy": 0.04404841963685272}, "nb-NO": {"f1": 0.009948873549432316, "accuracy": 0.05850706119704102}, "da-DK": {"f1": 0.006963028671915196, "accuracy": 0.04640215198386012}, "te-IN": {"f1": 0.008827314588716275, "accuracy": 0.05413584398117014}, "ta-IN": {"f1": 0.010181200766674517, "accuracy": 0.0531271015467384}, "de-DE": {"f1": 0.009820927979154084, "accuracy": 0.05682582380632145}, "ms-MY": {"f1": 0.008695116790145493, "accuracy": 0.04976462676529926}, "az-AZ": {"f1": 0.006846897205354794, "accuracy": 0.04572965702757229}, "km-KH": {"f1": 0.012659606303168983, "accuracy": 0.07195696032279758}, "hy-AM": {"f1": 0.013338651577045071, "accuracy": 0.05716207128446537}, "fr-FR": {"f1": 0.005880360132106054, "accuracy": 0.05648957632817754}, "lv-LV": {"f1": 0.006623425374335874, "accuracy": 0.06220578345662407}, "ko-KR": {"f1": 0.008989616861369655, "accuracy": 0.0484196368527236}, "sw-KE": {"f1": 0.011598658779704799, "accuracy": 0.05514458641560188}, "ka-GE": {"f1": 0.010113270489478075, "accuracy": 0.04270342972427707}, "zh-TW": {"f1": 0.012945789025900394, "accuracy": 0.03665097511768662}, "ur-PK": {"f1": 0.010250507258275702, "accuracy": 0.05749831876260928}, "nl-NL": {"f1": 0.010128839057233111, "accuracy": 0.04707464694014795}, "it-IT": {"f1": 0.007618073321736792, "accuracy": 0.0531271015467384}, "th-TH": {"f1": 0.008082391982246246, "accuracy": 0.04404841963685272}, "zh-CN": {"f1": 0.009933305466830786, "accuracy": 0.03093476798924008}, "af-ZA": {"f1": 0.007387175615153436, "accuracy": 0.03799596503026227}, "all": {"f1": 0.009897739649780104, "accuracy": 0.05036599244736434}}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a490c74c8fa60f3d998b40cb3d0965de9486ccc82f24e737ec749868531382a
+size 1115491954

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca2e7e08d9378a8f8f565ebecbbcb3c08196c1868f81b9348b03cd1b51aed05d
+size 4600