mt5_base_EN_wiki

This model is a fine-tuned version of google/mt5-base on the wikisql dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 5e-05
train_batch_size: 53
eval_batch_size: 16
seed: 42
optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
num_epochs: 15
mixed_precision_training: Native AMP

Epoch	Step	Validation Loss	Rouge2 Fmeasure
1.0	1223	nan	0.0086
2.0	2446	nan	0.0086
3.0	3669	nan	0.0086
4.0	4892	nan	0.0086
5.0	6115	nan	0.0086
6.0	7338	nan	0.0086
7.0	8561	nan	0.0086
8.0	9784	nan	0.0086
9.0	11007	nan	0.0086
10.0	12230	nan	0.0086
11.0	13453	nan	0.0086
12.0	14676	nan	0.0086
13.0	15899	nan	0.0086
14.0	17122	nan	0.0086
15.0	18345	nan	0.0086