tharindu commited on Apr 19

Commit

98f7a06

•

1 Parent(s): 8590867

Upload folder using huggingface_hub

Browse files

Files changed (30) hide show

.gitattributes +3 -0
best_model/config.json +39 -0
best_model/eval_results.txt +4 -0
best_model/model.safetensors +3 -0
best_model/model_args.json +1 -0
best_model/optimizer.pt +3 -0
best_model/scheduler.pt +3 -0
best_model/special_tokens_map.json +15 -0
best_model/tokenizer.json +3 -0
best_model/tokenizer_config.json +54 -0
best_model/training_args.bin +3 -0
checkpoint-3515-epoch-5/config.json +39 -0
checkpoint-3515-epoch-5/eval_results.txt +4 -0
checkpoint-3515-epoch-5/model.safetensors +3 -0
checkpoint-3515-epoch-5/model_args.json +1 -0
checkpoint-3515-epoch-5/optimizer.pt +3 -0
checkpoint-3515-epoch-5/scheduler.pt +3 -0
checkpoint-3515-epoch-5/special_tokens_map.json +15 -0
checkpoint-3515-epoch-5/tokenizer.json +3 -0
checkpoint-3515-epoch-5/tokenizer_config.json +54 -0
checkpoint-3515-epoch-5/training_args.bin +3 -0
config.json +39 -0
eval_results.txt +4 -0
model.safetensors +3 -0
model_args.json +1 -0
special_tokens_map.json +15 -0
tokenizer.json +3 -0
tokenizer_config.json +54 -0
training_args.bin +3 -0
training_progress_scores.csv +23 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+best_model/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+checkpoint-3515-epoch-5/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

best_model/config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "FacebookAI/xlm-roberta-base",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

best_model/eval_results.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+eval_loss = 0.606586695710818
+macro_f1 = 0.7405165582398466
+mcc = 0.5894639725182662
+weighted_f1 = 0.7364990262052206

best_model/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3d43bad2abd514b9b97574b0ce47820b176b55d0b7a6927a4febc6d43a26253
+size 1112208084

best_model/model_args.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"adafactor_beta1": null, "adafactor_clip_threshold": 1.0, "adafactor_decay_rate": -0.8, "adafactor_eps": [1e-30, 0.001], "adafactor_relative_step": true, "adafactor_scale_parameter": true, "adafactor_warmup_init": true, "adam_betas": [0.9, 0.999], "adam_epsilon": 1e-08, "best_model_dir": "outputs/sentiment_analysis/xlm-roberta-base/best_model", "cache_dir": "cache_dir/sentiment_analysis/xlm-roberta-base", "config": {}, "cosine_schedule_num_cycles": 0.5, "custom_layer_parameters": [], "custom_parameter_groups": [], "dataloader_num_workers": 0, "do_lower_case": false, "dynamic_quantize": false, "early_stopping_consider_epochs": false, "early_stopping_delta": 0, "early_stopping_metric": "eval_loss", "early_stopping_metric_minimize": true, "early_stopping_patience": 10, "encoding": null, "eval_batch_size": 100, "evaluate_during_training": true, "evaluate_during_training_silent": true, "evaluate_during_training_steps": 200, "evaluate_during_training_verbose": true, "evaluate_each_epoch": true, "fp16": true, "gradient_accumulation_steps": 1, "learning_rate": 1e-05, "local_rank": -1, "logging_steps": 200, "loss_type": null, "loss_args": {}, "manual_seed": 777, "max_grad_norm": 1.0, "max_seq_length": 512, "model_name": "FacebookAI/xlm-roberta-base", "model_type": "xlmroberta", "multiprocessing_chunksize": -1, "n_gpu": 1, "no_cache": false, "no_save": false, "not_saved_args": [], "num_train_epochs": 5, "optimizer": "AdamW", "output_dir": "outputs/sentiment_analysis/xlm-roberta-base", "overwrite_output_dir": true, "polynomial_decay_schedule_lr_end": 1e-07, "polynomial_decay_schedule_power": 1.0, "process_count": 78, "quantized_model": false, "reprocess_input_data": true, "save_best_model": true, "save_eval_checkpoints": true, "save_model_every_epoch": true, "save_optimizer_and_scheduler": true, "save_recent_only": true, "save_steps": 200, "scheduler": "linear_schedule_with_warmup", "silent": false, "skip_special_tokens": true, "tensorboard_dir": null, "thread_count": null, "tokenizer_name": "FacebookAI/xlm-roberta-base", "tokenizer_type": null, "train_batch_size": 8, "train_custom_parameters_only": false, "trust_remote_code": false, "use_cached_eval_features": false, "use_early_stopping": false, "use_hf_datasets": false, "use_multiprocessing": false, "use_multiprocessing_for_evaluation": false, "wandb_kwargs": {"name": "FacebookAI/xlm-roberta-base"}, "wandb_project": "Sinhala Sentiment Analysis", "warmup_ratio": 0.06, "warmup_steps": 211, "weight_decay": 0.0, "model_class": "TextClassificationModel", "labels_list": ["NEUTRAL", "POSITIVE", "NEGATIVE"], "labels_map": {"NEUTRAL": 0, "POSITIVE": 1, "NEGATIVE": 2}, "lazy_delimiter": "\t", "lazy_labels_column": 1, "lazy_loading": false, "lazy_loading_start_line": 1, "lazy_text_a_column": null, "lazy_text_b_column": null, "lazy_text_column": 0, "onnx": false, "regression": false, "sliding_window": false, "special_tokens_list": [], "stride": 0.8, "tie_value": 1}

best_model/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5e8b7c2bf9e007b4c1bd6eaa43b41bb6024ad21fe44ed5a84edff2557ecf1f0
+size 2224535738

best_model/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:73b632bbc5cd1b999cc4ce6ef0ee5d1d8f80de02fbda855eebd53538b303258a
+size 1064

best_model/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

best_model/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6f76fe13d42f80dcee0cb86a1aeb5f14f8909bb8a8782f7a4a4ad76697ef164
+size 17083021

best_model/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

best_model/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b014c739b78fa7bb7bf1aa7768e68f9ece6ef1d6e5266ad6d25d9cbdf5378308
+size 3896

checkpoint-3515-epoch-5/config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "FacebookAI/xlm-roberta-base",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

checkpoint-3515-epoch-5/eval_results.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+eval_loss = 0.7278924028078715
+macro_f1 = 0.7400787915842186
+mcc = 0.5912269376971394
+weighted_f1 = 0.7367751958634877

checkpoint-3515-epoch-5/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ae058a728c0fcc4d6b5d3fa909183ea122ad194e1b973b2d5720f2f9728d571
+size 1112208084

checkpoint-3515-epoch-5/model_args.json ADDED Viewed

	@@ -0,0 +1 @@

checkpoint-3515-epoch-5/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fe6e238e00cc1bf3e5b55a10814085a6e5221cf29cf569ec090659386eb3e50
+size 2224535738

checkpoint-3515-epoch-5/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b228755c296ba433f15c642a85eaefdc12ec36ec8541c9ecba3e16923b81de98
+size 1064

checkpoint-3515-epoch-5/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-3515-epoch-5/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6f76fe13d42f80dcee0cb86a1aeb5f14f8909bb8a8782f7a4a4ad76697ef164
+size 17083021

checkpoint-3515-epoch-5/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

checkpoint-3515-epoch-5/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b014c739b78fa7bb7bf1aa7768e68f9ece6ef1d6e5266ad6d25d9cbdf5378308
+size 3896

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "_name_or_path": "FacebookAI/xlm-roberta-base",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

eval_results.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+eval_loss = 0.7278924028078715
+macro_f1 = 0.7400787915842186
+mcc = 0.5912269376971394
+weighted_f1 = 0.7367751958634877

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ae058a728c0fcc4d6b5d3fa909183ea122ad194e1b973b2d5720f2f9728d571
+size 1112208084

model_args.json ADDED Viewed

	@@ -0,0 +1 @@

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6f76fe13d42f80dcee0cb86a1aeb5f14f8909bb8a8782f7a4a4ad76697ef164
+size 17083021

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b014c739b78fa7bb7bf1aa7768e68f9ece6ef1d6e5266ad6d25d9cbdf5378308
+size 3896

training_progress_scores.csv ADDED Viewed

	@@ -0,0 +1,23 @@

+global_step,train_loss,mcc,macro_f1,weighted_f1,eval_loss
+200,1.0584716796875,0.0,0.20908646800195407,0.28661959955285665,1.069009749094645
+400,1.0379638671875,0.038866161381021315,0.3223890783957439,0.3476455041299756,1.0258268157641093
+600,0.8944091796875,0.3356030610692675,0.439675160697888,0.4675828774643883,0.8856121460596721
+703,0.3840433657169342,0.49428516688588425,0.641708887041141,0.6495082309325583,0.6889036893844604
+800,0.6374053955078125,0.502147404626319,0.6707866931683287,0.6761805991121258,0.6971945722897848
+1000,0.5996513366699219,0.5428150645348128,0.7094972661714106,0.7042153646323749,0.6499818702538808
+1200,0.8780517578125,0.5602156214716048,0.7149353043214935,0.7121824284702569,0.6589588900407155
+1400,0.34406280517578125,0.5640401758185832,0.7115528143289943,0.7129789124597237,0.661833530664444
+1406,0.2644449770450592,0.5485446488785957,0.7157280593904511,0.7104053987882442,0.6388011852900187
+1600,0.7111034393310547,0.5696680340827229,0.7272049744029179,0.7231938468481846,0.6082332015037537
+1800,0.23871231079101562,0.556351734593933,0.7238844374959287,0.7177309116148322,0.6424811045328777
+2000,1.1884880065917969,0.5833935086320591,0.7332649740672558,0.7271136074905272,0.6190011511246364
+2109,0.4173177182674408,0.5894639725182662,0.7405165582398466,0.7364990262052206,0.606586695710818
+2200,0.22592449188232422,0.5748442102903613,0.7322659184902612,0.7245903599336564,0.6776909222205479
+2400,0.1421346664428711,0.5878199027102489,0.7374282188704813,0.7337496860780385,0.6582034925619761
+2600,0.4403419494628906,0.5458391740965017,0.7170169259321959,0.7082466563753468,0.7215832670529684
+2800,0.5751276016235352,0.5928953840693267,0.7327897628806469,0.7336711688855792,0.6887663503487905
+2812,0.5836639404296875,0.6010482547417683,0.7426616123390241,0.7419812874967691,0.680252335468928
+3000,0.345611572265625,0.5834407518046234,0.7351605377254614,0.729081367361939,0.7225894739230474
+3200,0.10987091064453125,0.5806198418744865,0.7331919994603333,0.7289611466503186,0.7378402839104334
+3400,0.5619616508483887,0.5880803641291443,0.7385743568730602,0.7349326575618604,0.7191217278440794
+3515,0.052824657410383224,0.5912269376971394,0.7400787915842186,0.7367751958634877,0.7278924028078715