iceman2434
/

roberta-tagalog-base-ft-udpos213-top2langrandom

Token Classification

Model card Files Files and versions Community

roberta-tagalog-base-ft-udpos213-top2langrandom / README.md

iceman2434's picture

Create README.md

fa56548 verified 5 months ago

|

history blame contribute delete

726 Bytes

metadata

datasets:
  - universal_dependencies
language:
  - tl
metrics:
  - f1
pipeline_tag: token-classification

Model Specification

Model: RoBERTa Tagalog Base (Jan Christian Blaise Cruz)
Randomized training order of languages
Training Data:
- Combined English & Serbian corpora (Top 2 Languages)
Training Details:
- Base configurations with learning rate 5e-5

Evaluation

Evaluation Dataset: Universal Dependencies Tagalog Ugnayan (Testing Set)
Tested in a zero-shot cross-lingual scenario on a Universal Dependencies Tagalog Ugnayan testing dataset (with 73.99% Accuracy)

POS Tags

ADJ – ADP – ADV – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB