BramVanroy
/

bert-base-multilingual-cased-hebban-reviews5

Text Classification

sentiment-analysis

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Edit model card

bert-base-multilingual-cased-hebban-reviews5

Dataset

dataset_name: BramVanroy/hebban-reviews
dataset_config: filtered_rating
dataset_revision: 2.0.0
labelcolumn: review_rating0
textcolumn: review_text_without_quotes

Training

optim: adamw_hf
learning_rate: 5e-05
per_device_train_batch_size: 64
per_device_eval_batch_size: 64
gradient_accumulation_steps: 1
max_steps: 5001
save_steps: 500
metric_for_best_model: qwk

Best checkedpoint based on validation

best_metric: 0.697825193570947
best_model_checkpoint: trained/hebban-reviews5/bert-base-multilingual-cased/checkpoint-4500

Test results of best checkpoint

accuracy: 0.5898668639053254
f1: 0.5899204480029937
precision: 0.5971431895675179
qwk: 0.7050840079198698
recall: 0.5898668639053254

Confusion matrix

Normalized confusion matrix

Environment

cuda_capabilities: 8.0; 8.0
cuda_device_count: 2
cuda_devices: NVIDIA A100-SXM4-80GB; NVIDIA A100-SXM4-80GB
finetuner_commit: 8159b4c1d5e66b36f68dd263299927ffb8670ebd
platform: Linux-4.18.0-305.49.1.el8_4.x86_64-x86_64-with-glibc2.28
python_version: 3.9.5
toch_version: 1.10.0
transformers_version: 4.21.0

Downloads last month: 19

Inference Examples

Text Classification

This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Evaluation results

Test accuracy on BramVanroy/hebban-reviews - filtered_rating - 2.0.0
test set self-reported

0.590
Test f1 on BramVanroy/hebban-reviews - filtered_rating - 2.0.0
test set self-reported

0.590
Test precision on BramVanroy/hebban-reviews - filtered_rating - 2.0.0
test set self-reported

0.597
Test qwk on BramVanroy/hebban-reviews - filtered_rating - 2.0.0
test set self-reported

0.705
Test recall on BramVanroy/hebban-reviews - filtered_rating - 2.0.0
test set self-reported

0.590

View on Papers With Code