microsoft
/

deberta-v3-base

Inference Endpoints

Model card Files Files and versions Community

DeBERTa commited on Oct 20, 2021

Commit

f98b109

•

1 Parent(s): e68dde0

Update README.md

Files changed (1) hide show

README.md +34 -0

README.md CHANGED Viewed

@@ -28,6 +28,40 @@ We present the dev results on SQuAD 1.1/2.0 and MNLI tasks.
 | **DeBERTa-v3-base**  | 93.9/88.4 | 88.4/85.4 | 90.5   |
 | DeBERTa-v3-base+SiFT  | -/- | -/- | **91.0**   |
 ### Citation

 | **DeBERTa-v3-base**  | 93.9/88.4 | 88.4/85.4 | 90.5   |
 | DeBERTa-v3-base+SiFT  | -/- | -/- | **91.0**   |
+#### Fine-tuning with HF transformers
+```bash
+#!/bin/bash
+cd transformers/examples/pytorch/text-classification/
+pip install datasets
+export TASK_NAME=mnli
+output_dir="ds_results"
+num_gpus=8
+batch_size=8
+python -m torch.distributed.launch --nproc_per_node=${num_gpus} \
+  run_glue.py \
+  --model_name_or_path microsoft/deberta-v3-small \
+  --task_name $TASK_NAME \
+  --do_train \
+  --do_eval \
+  --evaluation_strategy steps \
+  --max_seq_length 256 \
+  --warmup_steps 1000 \
+  --per_device_train_batch_size ${batch_size} \
+  --learning_rate 2.5e-5 \
+  --num_train_epochs 3 \
+  --output_dir $output_dir \
+  --overwrite_output_dir \
+  --logging_steps 1000 \
+  --logging_dir $output_dir
+```
 ### Citation