kennethge123
/

sst5-bert-base-uncased-kd

Model card Files Files and versions Community

sst5-bert-base-uncased-kd / README.md

kennethge123's picture

Upload README.md with huggingface_hub

292c436 verified 8 months ago

|

368 Bytes

	---
	language: en
	license: mit
	library_name: pytorch
	---
	# Plainly Optimized Network
	Dataset: BIGBENCH

	Trainer Hyperparameters:
	- `lr` = 5e-05
	- `per_device_batch_size` = 1
	- `gradient_accumulation_steps` = 4
	- `weight_decay` = 1e-09
	- `seed` = 42

	\|eval_loss\|eval_accuracy\|epoch\|
	\|--\|--\|--\|
	\|66.323\|0.063\|1.0\|
	\|59.935\|0.055\|2.0\|
	\|60.344\|0.056\|3.0\|
	\|58.559\|0.054\|4.0\|